26.06.2018Blogi

Onko koneoppiminen (machine learning/ML) tuotekehitystä vai löytöretkeilyä?

– Uusien asioiden tekeminen on täynnä kulttuurien kohtaamisia

Datatiede, koneoppiminen ja tekoäly ovat suuria lupauksia siinä prosessissa, missä enemmän tai vähemmän käyttökelpoisesta raakadatasta jalostetaan arvokasta materiaalia. Koneoppiminen voi olla loistava työkalu tiedon jalostamisessa. Se on kuitenkin suhteellisen uusi asia, joten sen outous on syytä huomioida kun lähestytään sellaisia tahoja, joille koneoppiminen ei ole ennestään tuttua.

Oppimisessa ja uusien asioiden tekemisessä tasapaino on tärkeää. Toimijoiden on tunnettava olonsa riittävän turvalliseksi, jotta ovat valmiita ryhtymään ennalta tuntemattomiin asioihin, sillä koneoppimisen soveltaminen saattaa olla monelle täysin uusi asia.

Jotta uudet asiat voivat levitä, täytyy ihmisten vaihtaa mielipiteitä ja vaikutteita. Usein tämä edellyttää erilaisten kulttuurien kohtaamisia.

Esimerkiksi koneoppimisen tutkijoiden kulttuuri saattaa olla erilainen kuin soveltajien. Samoin on toimialatietäjien ja sovellusten tekijöiden laita.

Seuraavassa keskitymme kolmeen kulttuurien kohtaamiseen: 1) miten hankkeen rahoittaja näkee koneoppimisen, 2) miltä näyttää kun toimialatietäjä kohtaa koneoppimisen ja 3) mitä tapahtuu kun datatieteilijä kohtaa muun maailman.

#1 Sponsori kohtaa datatieteilijän

Jotta sponsori voisi kokea koneoppimisen vähentävän uuden hankkeen riskitasoa, on hänen hankittava perustietämystä koneoppimisesta.

Hankkeen tai uuden kehityksen kohdalla sponsorin oppimisretkellä turvallisuus ja mukavuus ovat aivan yhtä tärkeitä kuin millä tahansa retkellä.

Data-analytiikassa (tai datatieteessä) puhutaan paljon ns. ekploratiivisesta analyysistä, jonka voisi luonnehtia olevan datalla kokeilua. Sanan juuret viitannevat löytöretkeilyyn. Löytöretkeily onkin erittäin hyvä mielikuva, kun yritetään ymmärtää datan penkomiseen erikoistunutta henkilöstöä: tietty uteliaisuus yhdistyy matematiikkaan tai tietojenkäsittelyä kohtaan tunnettuun sympatiaan. Kyse on kuin tutkimusmatkasta.

Löytöretkeilylle olennaista on se, ettei matkalle lähdettäessä useinkaan tiedetä, mitä löydöksiä tulee vastaan. Retkeilijän kannalta tämä on fantastista! Työ ei koskaan ole tylsää, vaan se uudistuu ja uudistaa tekijäänsä. Löytöretken rahoittajan kannalta tämä voi olla huvittavaa, ärsyttävää tai jopa pelottavaa.

Rahoittaja ja sponsori, eli liiketoiminnallinen uudistaja, etsii retkistään taloudellista tuottoa. Kun löytöretkeilyn tuloksista ei ole edes summittaista tietoa, vaatii suurta luottamusta päästää rahoitetut löytöretkeilijät matkalle.

Kun löytöretkeilijä on ollut matkalla useita kuukausia, voi rahoittajan sosiopoliittinen tilanne muodostua haastavaksi. Ylempi johto ja rahoitusosasto alkavat tiedustelemaan matkasta ja ehkäpä toisten liiketoimintojen vetäjät alkavat leukailemaan kahvipöydässä tuloksien puutteesta. Tällöin tarvitaan raportteja (data)löytöretkeilijöiltä: mieluiten kuvauksia uusista mantereista, liiketoimintamahdollisuuksista tai jopa luonnonvaroista.

Liiketoiminnan rahoittajan tuskaa lisäävät lehtiartikkelit ja uutiset siitä, että muut yritykset ovat onnistuneet datatiedehankkeissaan. Uutisista unohtuu kuitenkin usein sellainen seikka, että onnistumista on valmisteltu sitkeästi vuosia, eikä epäonnistumisista kerrota läheskään yhtä innokkaasti kuin onnistumisista.

#2: Toimialatieto kohtaa koneoppimisen

 Jotta toimialatiimi voi luottaa koneoppimismallin tuottamiin tuloksiin, pitää datatieteilijän kyetä selittämään miten mallit toimivat ja miksi ne tuottavat niitä tuloksia mitä ne tuottavat.

Kun koneoppimisen ja sovellusalueen asiantuntijat kohtaavat yhteisen tekemisen merkeissä, pääsee ns. “hiljainen tieto” nousemaan esiin – tai ainakin sen pitäisi nousta.

Sovellusalueen asiantuntijat tietävät paljon sellaisia asioita, joita eivät edes tiedosta tietävänsä. Nuo asiat voivat liittyä fyysisen maailman ilmiöihin tehtaassa tai laitteessa, kuluttajien käyttäytymiseen tai markkinan toimintaan. Samoin on koneoppimisen asiantuntijoiden laita, joiden osaaminen puolestaan liittyy tiedon käsittelemiseen, laskentaongelman asetteluun ja mallien laatimiseen.

Yksi koneoppimisen soveltamisen ongelma on se, että se on hyvin kaukana siitä todellisuudesta, mitä suurin osa sovellusalueen osaajista kohtaa päivittäin. Mallit ovat usein melko abstrakteja, eikä se pysty suoraan selittämään miksi se tuotti sen ennusteen minkä se tuotti.

Keskustelu toimialan ja koneoppimisen asiantuntijan välillä on aluksi kankeaa, koska heidän ajattelutapansa ja terminologiansa ovat toisilleen vieraita. Koneoppimishankkeissa kannattaakin varautua siihen, että toimialaosaajia hieman tutustutetaan koneoppimisen peruskäsitteisiin ja että koneoppimisosaajia tutustutetaan paljon toimialan lainalaisuuksiin.

Kulttuuritörmäystä pehmentää esimerkiksi se, että määritellään yhdessä, onko projektissa kysymys tutkimuksesta vai tuotekehityksestä.

Jotta datatieteilyä tai koneoppimista voidaan jalostaa kaupalliseksi toiminnaksi on syytä hahmottaa mitä eroa on tutkimuksella ja tuotekehityksellä.

#3: Tieteily kohtaa muun maailman

 Jotta datatieteilijä voisi tuottaa lisäarvoa hankkeelle, tulee hänen pelata samojen sääntöjen mukaan kuin muidenkin hankkeeseen osallistuvien.

Datatieteen ja toimialaongelman muuttaminen toiminnalliseksi ratkaisuksi vaatii laajaa osaamista. Molemmat osaamiset kohtaavat tuskin koskaan samassa henkilössä ja jos näin olisi, on yhden tekijän kapasiteetti tuottaa toimivaa järjestelmää rajallinen. Siksi tarvitaan tyypillisesti laaja-alaista ryhmää. Tarvitaan organisoitumista.

Tarvittavat osaamiset ovat datatiede (mallitus), ns. piirreanalyysi, dataputken rakentaminen, toimialaosaaminen ja toiminnan johtaminen. Oppimisen kannalta olisi suotavaa toimia ketterässä moodissa, mutta on ymmärrettävää, että on tapauksia missä projektimalli toimii paremmin.

On myöskin hyvä muistaa, että toteutusalusta ei valitse sovellutusta tai liiketoimintatarvetta, vaan liiketoimintatarve valitsee toteutusalustan.

Ihminen ja organisaatio kaipaavat riittävää tasapainoa. Jos kaikki tutut ja turvalliset elementit korvataan uusilla, voi tasapaino tilapäisesti järkkyä. Siksi on tärkeää, että uusia asioita tuodaan kehitystyöhön maltillisesti. Jos esimerkiksi koneoppiminen on uusi asia, ei hanketta kannata sekoittaa ottamalla käyttöön liikaa muita uusia käytänteitä.

Löytöretkeilyn periaatteet toimivat tässäkin: varovaisuus, rohkeus ja terve järki oikeassa suhteessa ovat loistavia työkaluja jokaisella askeleella.

Solita case DNA