Lähtökohta: Avointa, turvallista ja suomalaista puheentunnistusta
Miten voisimme parantaa suomenkielistä puheentunnistusta ja tekoälyä hyödyntäviä palveluita? Miten varmistamme, että suomenkielisen puheentunnistuksen kehittäminen ei ole vain Applen ja Googlen kaltaisten kaupallisten jättien varassa? Valtion kehitysyhtiö Vake otti syksyllä 2019 Solitaan yhteyttä ja pyysi apua suomenkielisen puheen keräämisessä.
Tavoitteena oli rakentaa paljon variaatioita puhutusta suomen kielestä sisältävä puhepankki, joka auttaa tutkijoita ja sovelluskehittäjiä luomaan suomenkielistä puheentunnistusta ja yhteiskunnallisesti merkittäviä tekoälysovelluksia.
Valtion kehitysyhtiö Vaken (nyk. Ilmastorahasto) ja Solitan lisäksi hankkeeseen tulivat mukaan Yleisradio ja Helsingin yliopisto. Solita vastasi projektin suunnittelusta ja toteutuksesta.
Strategia: Suomalaiset kehittämään puheentunnistusta yhdessä
Lähtöajatuksena oli kehittää avoimesti ja tietoturvallisesti suomenkielistä puheentunnistusta ja korkealuokkaisia digipalveluita suomalaisvoimin ja innostaa suomalaiset talkoisiin rikkaampaa suomenkieltä ymmärtävien palveluiden puolesta.
Puheen lahjoituksesta haluttiin tehdä helppoa, ehdottoman tietoturvallista ja luottamuksellista – sekä kansalaisia innostavaa ja viihdyttävää, jotta riittävän puhemäärän tallentaminen onnistuisi. Toteutuksesta rakennettiin myös teknisesti saavutettava: Puheen luovutus onnistuu lukuisissa eri puhelimissa ja nettiselaimessa. Korkeat laatuvaatimukset täyttävä palvelu huomioi myös erityisryhmät. Puhetta voivat luovuttaa esimerkiksi näkövammaiset.
Hankkeen käynnistymistä edelsi puolen vuoden suunnitteluperiodi, johon osallistui Vaken, Ylen, Solitan asiantuntijoita sekä Helsingin yliopiston kielitieteilijöitä ja joukko muita yrityksiä. Suunnittelujakson aikana syntyi hankkeen konsepti ja toteutussuunnitelma.
Hankkeen käynnistymistä edelsi puolen vuoden suunnitteluperiodi, johon osallistui Vaken, Ylen, Solitan asiantuntijoita sekä Helsingin yliopiston kielitieteilijöitä ja joukko muita yrityksiä. Suunnittelujakson aikana syntyi hankkeen konsepti ja toteutussuunnitelma.
Luova ratkaisu: Haluaisitko selostaa Lasse Virénin juoksua?
Lahjoita puhetta -hankkeen tavoitteena on kerätä 10 000 tuntia vapaasti puhuttua suomenkielistä arkipuhetta. Jotta kone oppii ymmärtämään suomen kieltä, tarvitaan määrällisesti paljon puhetta ja erilaisia variaatioita puhutusta suomesta: puhepankin pitäisi sisältää eri murteita, eri sukupuolten ja eri ikäisten ihmisten puhetta sekä huomioida esimerkiksi maahanmuuttajat. Tavoitteen saavuttamiseksi rakennettiin Lahjoita puhetta -verkkopalvelu, jossa omaa puhetta voi lahjoittaa helposti ja inspiroivasti.
Miten pankittaa puhetta helposti, inspiroivasti ja tehokkaasti? Solita ja Yle rakensivat palveluun erilaisia kehotteita, jotka auttavat puheen tuottamisessa. Käyttäjä voi luovuttaa puhetta niin mobiiliapplikaation kuin verkkopalvelun kautta. Palvelusta voi valita erilaisia teemoja ja haastattelukysymyksiä: halutessaan voi kertoa omia kuulumisiaan – tai vaikkapa selostaa Lasse Virénin juoksua. Puheen tuottamisen välissä palvelu kysyy erilaisia lisäkysymyksiä, kuten luovuttajan iän.
Palvelulle rakennettiin näkyvyyttä niin YLEn tv-kampanjoilla, mediaviestinnällä kuin tutkijayhteistyöllä.
Toteutus: Tinkimätön toteutus toimii vientituotteena ulkomaille
Puheen luovutus käynnistyi kesäkuussa 2020. Kuka tahansa voi tänäänkin lahjoittaa omaa suomenkielistä puhettaan osoitteessa lahjoitapuhetta.fi tai lataamalla Lahjoita puhetta -mobiilisovelluksen. Puheen lahjoittajia ei voi tunnistaa eikä puheen sisällöllä ole hankkeen onnistumisen kannalta merkitystä. Puheen pinnallisuus on vähintäänkin sallittua – salaisuuksia äänitteissä ei kannata paljastaa.
Hankkeen teknistä toteutusta kuvaa laadullinen ja tietoturvan toteutukseen liittyvä tinkimättömyys. Sisällöllisesti puheenluovuttamisesta eli ääninauhurille juttelusta haluttiin tehdä erilaisille suomalaisille hauskaa ja innostavaa.
Lahjoitettu puhe tallentuu Helsingin yliopiston kielipankkiin, josta sitä voidaan luovuttaa tutkijoille ja yrityksille erilaisten puheentunnistusta hyödyntävien sovellusten kehittämiseen sekä tutkimustyöhön.
Konsepti on suunniteltu modulaariseksi ja joustavaksi. Toteutus venyy hyvin erilaisiin tarpeisiin, ja se toimii myös tulevaisuudessa mahdollisena vientituotteena ulkomaille.
Kielitieteilijät ovat antaneet toteutuksesta tähän mennessä vuolaasti positiivista palautetta. Myös Ylen ja Solitan yhteistyössä toteuttama graafinen ilme on koettu esteettisenä ja selkeänä.
Tulokset: Vain taivas rajana hyödyntämiselle – tutkijat ja yritykset kiittävät
Lahjoita puhetta on yhteiskunnallisesti merkittävä hanke, joka auttaa tutkijoita ja yrityksiä kehittämään uusia vaikuttavia, suomenkielisiä palveluita niin terveydenhuoltoon, oppilaitoksiin kuin vanhustenhoitoonkin. Yhteiskunnallisesti merkittävien ja ihmisten arkea helpottavien palveluiden rakentamisessa datapankin avulla yrityksillä ja tutkijoilla on vain taivas rajana.
Tähän mennessä puhetta on kerätty yli 4000 tuntia ja datan määrä lisääntyy jatkuvasti. Luovutuskertoja on ollut tähän mennessä 214 000, ja esimerkiksi suomenkieliset vanhukset ovat luovuttaneet puhettaan aktiivisesti.
Koneoppimisen ja tekoälyn kehittämisen kannalta merkittävää on, että kerätystä puheesta on olemassa myös erilaista metatietoa, kuten esimerkiksi puheen luovuttajan synnyinpaikka, murretausta, ikä ja sukupuoli. Sovellukseen kerätään vain puheen luovuttajan itse antamat tiedot, eli muuta dataa käyttäjästä ei tallennu.
Jatkuvasti kasvava ja rikastuva puhepankki parantaa tulevaisuudessa kaikkien suomalaisten elämää. Suomalaisen puheentunnistuksen kehittyminen auttaa lukuisten eri ammattikuntien työtä lääkäreistä kielitieteilijöihin ja tavallisiin kansalaisiin.