1.12.2015Blogi

Tietovaraston automatisointi

Tietovaraston automatisointi tulee nykyään esille monessa eri paikassa. Puhumme siitä muun muassa Solitan sisällä, asiakkaat kyselevät aiheesta, markkinoille on tulossa uusia tuotteita ja silti tuntuu, että kukaan ei oikein puhu samasta asiasta. Mikä tietovaraston automatisoinnissa on niin hottista, että se kiinnostaa kaikkia, mutta kukaan ei oikein ole tehnyt sitä?

Tässä kirjoituksessa tietovaraston automatisointia tarkastellaan muutamasta eri näkökulmasta ja tuodaan esille millaiset asiat automatisoinnissa ovat tällä hetkellä ajankohtaisia tietovarastoja työssään toteuttaville (tekstissä ei kerrota kuinka automatisoinnin temppu tehdään tai millaisia tuotteita markkinoilla on olemassa).

Mitä vaikutuksia tietovaraston automatisoinnilla on työhöni?

Tietovarastojen tekeminen on työlästä. Moni ajattelee, että käyttämällä automatisointia, työmäärää saadaan pienennettyä. Onko näin? Olisiko sittenkin tärkeämpää saada lyhennettyä aikaa, joka menee asioiden määrittelystä siihen, että tietovarastosta saadaan tietoa hyödynnettyä? Minun näkökulmastani automatisointi on työkalu tuottaa jotain parempaa tietovaraston tilaajalle. Samalla parempien käytäntöjen avulla voin saada isot projektit paremmin hallintaani. Herääkin kysymys, että voisinkohan automatisoida tietovaraston kokonaisuudessaan? Koko tietovaraston kehityksen automatisointi on kuitenkin utopistinen tavoite. Utopistinen siksi, että silloin kaikki on oltava koneen luettavassa muodossa ja koneelle sopiva muoto ei yleensä ole yhtä luettavaa ihmiselle.

Mitä tietovarastosta automatisoidaan?

Tietovarasto rakentuu karkeasti ottaen kolmesta kokonaisuudesta: 1) tietovaraston tietorakenteista, 2) datalatauksista ja 3) tietovaraston metadatasta. Kaksi ensimmäistä kokonaisuutta, eli tietovaraston rakenteet ja datalataukset on periaatteessa mahdollista tehdä automatisoinnissa automaattisesti, mutta tietovaraston kokonaisuuksista metadata ei ole automatisoitavissa. Tosin siihen on mahdollista tehdä osittaista automatisointia, mutta se ei ole tämän kirjoituksen aihe.

Tietovaraston tärkein työvaihe on mallintaminen. Mallinnuksella kerrotaan millaista tietoa on olemassa ja miten se linkittyy muihin tietoihin. Mallinnuksessa käytetään graafisia välineitä ja niistä saa suoraan tietokannan luontilauseet. Mallinnustyöllä on merkittävää arvoa ja sitä ei kannata automatisoida.

Tietovaraston tietorakenteita ei siis itsessään kannata automatisoida, mutta se miten tietorakenteet luodaan eri palvelimille, on automatisoitavissa.

Tietovaraston datan käsittelyyn liittyy paljon datalatauksia, joiden tekeminen on työlästä ja virhealtista. Datalatauksissa on paljon mahdollisuuksia automatisoinnille. Tämä on osuus, jonka automatisointiin olen itse henkilökohtaisesti käyttänyt paljon aikaa ja miettinyt miten sen voisi tehdä. Tapoja on useita, mutta kaikissa perussapluuna on sama. Latauksia varten on oltava olemassa ohjausdataa tai sääntöjä miten data ladataan tietovarastoon. Ohjausdatan avulla muodostetaan varsinainen automatisointi, eli tekninen toteutus tietovaraston datalatauksista. Tässä siis tietovaraston automatisointi tarkoittaa työlään datalatausten (ETL-latausten) tekemistä koneellisesti.

Tietovaraston automatisoinnin tuomat hyödyt

Tietovaraston automatisoinnissa on useita hyötyjä: määrällisiä, laadullisia, suoria ja välillisiä. Tässä lueteltuna neljä tärkeintä hyötyä:

1. Ihmistyön väheneminen. Automatisoinnin tärkeimpänä hyötynä voisi olettaa olevan suoran ihmistyön vähenemisen, koska automatisointi siirtää ihmisen tehtävää työtä koneen tehtäväksi. Suurin hyöty ei ole kuitenkaan työmäärien pieneneminen, vaan lisääntyvän koneen tekemän työn mukana tulevat muut välilliset ja suorat hyödyt.

2. Samanlainen tuotos – vähemmän virheitä. Kone tekee asiat samalla tavalla, jolloin inhimillisen virheen mahdollisuus poistuu. Tämä ei tietenkään poista ihmisen osuutta työn tekemisestä, mutta silloin mahdolliset virheet ovat loogisia virheitä, eivät huolimattomuusvirheitä.

3. Nopeammin tuotoksia – kone jaksaa painaa. Kone tekee tuotokset minuuteissa. Se tekee työtä vaikka kellon ympäri ja koko ajan töitä samalla tavalla. Ihmistyövoimaa ei voi lisätä ilman, että siitä aiheutuu muita sivuvaikutuksia – projekteissa muun muassa kommunikoinnin muodossa.

4. Henkilöriippuvuus vähenee – valitse sopivat tyypit. Nykyisin projekteihin valitaan eri osaamistaustaisia tekijöitä työmäärän suhteessa. Automatisoiduissa projekteissa ei tarvita massiivisia miehityksiä. Sopivan tiimin koko tulee tiimin toimivuuden kautta, eikä työmääräarvioiden massiivisuudesta.

Näistä asioista seurauksena on työmäärien pieneneminen ja siis myös suoraan saman toiminnallisuuden aikaansaaminen pienemmillä kustannuksilla. Automatisointi myös yhtenäistää toteutusta ja siten parantaa ylläpidettävyyttä.

Tietovarastojen toteuttaminen hallintaan automatisoinnilla

Tietovaraston automatisointi on tällä hetkellä siis työläiden datalatausten automatisointia. Tulevaisuudessa puhutaan myös muunlaisesta automatisoinnista. Oikeastaan automatisointi on enemmänkin ajattelutapa, jolla on selkeitä vaikutuksia työn tekemiseen ja erityisesti sen laatuun. Laatuun tässä yhteydessä hyvällä tavalla.

Automatisointiin ei tarvita tuotetta, vaan halua tehdä asiat järjestelmällisesti paremmin.

Minulle automatisointi on tapa ajatella ja hallita työläitä kokonaisuuksia. Otin käyttöön automatisoinnin toimintatavan useita vuosia sitten ja siitä lähtien työnteko on ollut joka päivä ”kivaa”, koska saan keskittyä vaikeisiin asioihin, koneen tehdessä mekaanisen työn.

Kiinnostuitko? Lue lisää analytiikan palveluistamme muun muassa Sanomat case -referenssistämme sekä ennakoivan analytiikkan -verkkosivuiltamme. Kurkkaa myös avoimet työpaikkamme täältä. Etsimme jatkuvasti joukkoomme uusia rakastettavia työkavereita – digitaalisen maailman matkaoppaita.