2.12.2021Blogi

Data ei ole öljyä, se on lantaa

Datan vertailu öljyyn ontuu – tai ainakin pitäisi ymmärtää, että data on kuin raakaöljyä. Öljy on jalostunut maan sisällä kymmenien tuhansien vuosien aikana, sitä ei juurikaan tule lisää vaikka uusia paikkoja kai edelleen löydetään. Dataa taas kertyy vuosi vuodelta enemmän

Tim O‘Reilly vertasi helmikuun 2021 ansiokkaassa kirjoituksessaan dataa hiekkaan. O’Reillyn vertaus osuu siltä osin hyvin, että kaikki hiekka ei ole hyvää ja hiekka vaatii jalostamista, mutta se on huono koska hiekasta on tullut maailman toiseksi kysytyin luonnonvara ja hiekkakin on loppumassa. Dataa kannattaisi siksi verrata öljyn tai hiekan sijaan koko ajan kasvavaan, nopeasti pilaantuvaan ja paljon jalostusta vaativaan luonnovaraan – lantaan.

Kasvava, mätänevä datakasa maksaa rahaa

Datan määrän lähes räjähdysmäinen kasvu dilutoi datan arvoa, jos sitä säilöö käyttämättä liian pitkään – aivan samalla tavalla kuin lantakasa mätänee ja vain tuottaa päästöjä. Aivan kuten öljynkin kanssa oli 1800-luvulla, monesti datan käyttötapausten löytäminen voi viedä aikaa, ja aina niitä ei löydy. Toisinaan käyttötapaukset voivat olla yllättäviä – datallekin on Kopi Luwakinsa.

80% luodusta datasta on ei -rakenteista ja jopa 85% kaikesta datasta on tavalla tai toisella turhaa. Suuri osa datan hallinnan kustannuksista aiheutuukin oikean, relevantin datan löytämisestä ja jalostamisesta. Toisin kuin öljy, data ei ole kovin monikäyttöistä, ja datan käyttö edellyttää usein eri datalajien muokkausta ja yhdistelyä. Suuri osa tietojärjestelmien kustannuksista kuluu integraatioihin ja datan käsittelyyn (ETL). Koko ajan lisääntyvän datan hallinta maksaa. McKinseyn arvion mukaan datan hallintaan kuluvat kustannukset ovat nousseet jopa 50% vuosina 2019-2021.

Lannoita datalla!

Usein myös dataa tuottavat tahot ovat niin syvällä omissa toiminnoissa ja uskomuksissa oman datan mahdollisuuksiin, ettei datan uutta potentiaalia ole mahdollista löytää organisaation sisältä. Joku toinen toimija – esimerkiksi opiskelijaryhmä, toinen yritys tai vaikkapa dataliiketoiminnan konsultti voisi hyvin nopeasti tuoda esille mahdollisuuksia liiketoiminnalle. Parhaimmillaan tämä uusi liiketoiminta voisi toteutua siten, ettei alkuperäisen datan omistajan edes tarvitsisi ottaa suurta liiketoimintariskiä, vaan tehdä jonkinlainen käytön ja tuloksen revenue-share -malli. Pitää kuitenkin muistaa, että suurin osa tavallisesta datasta on sellaista, jota on tarjolla todella monella muullakin, eikä ko. datalla ole suoraa liiketoiminnallista arvoa, ts. sen varaan ei ole edellytyksiä perustaa uutta liiketoimintaa. Tuossakin tapauksessa datasta voisi löytyä jalostettavaa arvoa omalle liiketoiminnalle, eli jakaminen voisi silloinkin kannattaa. Toki pieni varoituksen sana, joskus data voi sisältää myös tietoa, jota voidaan käyttää datan tuottajaa vastaan.

Olisikin siksi parempi sanoa suoraan, että data on uutta lantaa: kasattuna alkaa haista; levitettynä voi lannoittaa suuren pellon tuottamaan paljon satoa.

Vuosi vuodelta kasvavan datamassan ylläpito maksaa enemmän. Voidaan siis hyvin sanoa, että data kasattuna vain haisee ja kuluttaa resurssia, mutta oikealla tavalla se ravitsee koko yrityksen ja myös yrityksen ympärillä olevan ekosysteemin kasvua.

Löydä potentiaali!

Kaikki data ei ole yhtä arvokasta. Selvitä ne data-alueet, jotka ovat oikeasti hyödyllisiä ja tarjoa oikea palvelutaso oikeaan paikkaan – arvo edellä. Datan vaihdanta on hyvin kannatettavaa, “jos haluu saada, on pakko antaa”. Avoimen innovaation periaatteiden mukaisesti kokeile – fail fast, scale fast.

Datan hyötypotentiaalin löytäminen kestää. Asian nopeuttamiseksi dataa kannattaa avata rohkeasti. Julkinen toimija voi dataa avaamalla säästää palveluiden kehittämisen, auttaa luomaan muille liiketoimintaa ja luoda parempia palveluita käyttäjille. Selvitä ja seuraa siksi käyttäjiä ja hyödyntäjiä, jotta parannat palvelua jatkuvasti. Yksityissektorin toimijalle datapohjainen liikevaihto voi parhaimmillaan muodostua hyväkatteiseksi toiminnaksi, kunhan vain mahdollistetaan toiminnan muodostaminen, eikä alkuvaiheessa estetä kehitystä pitämällä datakasaa mätänemässä.

Puretaan siis haisevat datakasat ja mahdollistetaan niiden voima uudelle kasvulle!