Digitalisaation myötä monissa organisaatioissa kerätään paljon dataa—yksityiskohtaisia merkintöjä niin ihmisten (sekä asiakkaiden että työntekijöiden) valinnoista ja käyttäytymisestä, kuin esimerkiksi koneiden toiminnasta. Liikenne- ja viestintäministeriön ”big datan käyttö” -työryhmän raportissa esiteltiin jo viisi vuotta sitten ehdotuksia kansallisiksi strategisiksi toimenpiteiksi, joiden avulla voitaisiin lisätä suurten tietoaineistojen hyödyntämistä.
Datasta puhutaan nykyään paljon, mutta ei turhaan, sillä siihen liittyy paljon potentiaalia: datan analysoinnilla voidaan tuottaa arvokasta tietoa ja ymmärrystä organisaation päätöksenteon tueksi. Kun datasta jalostetaan tietoa, voidaan tehdä parempia päätöksiä nimenomaan tietoon pohjautuen ”mutun” sijaan, ja saavuttaa kustannussäästöjä sekä tarjota parempaa palvelua asiakkaille. Data ja siitä johdettu tieto on tärkeä resurssi. Big datan lupaus on, kuin Kalevalan Sampo
Tarina Sammosta alkaa, kun Pohjolan emäntä Louhi lupaa järjestää Väinämöisen takaisin Kalevalaan, jos tämä hankkii hänelle onnea tuottavan Sammon. Tuon ihmekoneen tulisi olla rikkauksia tuottava mylly, joka taikoisi sisuksistaan viljaa, suolaa ja rahaa.
KUVA: Lisääntyvä data ja sen avulla muodostettu tieto auttavat ennustamaan, kehittymään, oppimaan, viestimään ja johtamaan.
Tietovarasto vs Tietoalusta
Data-analytiikassa on tapahtunut vallankumous, jossa voi vetää karkean viivan ”vanhojen” tietovarasto- ja Business Intelligence -ratkaisujen, sekä ”uusien” tietoalusta- ja Big Data -ratkaisujen välille. Vanhoissa tietovarastoratkaisuissa oli tavoitteena saada organisaation oma tieto paremmin saataville. Näissä ratkaisuissa yhdisteltiin eri järjestelmien dataa ja koostettiin siitä päätöksentekoa tukevia raportteja. Tässä vanhassa data-analytiikassa avain on tiedon tekeminen läpinäkyväksi ja helposti saatavilla olevaksi.
Moderni tietoalusta käsittelee laajemmin kaikkea saatavilla olevaa dataa. Tieto ei ole enää saareke, vaan kaikki digitaalinen liikenne nähdään osana tietoa. Kaikki aikaisemminkin raporteissa näkynyt tieto, sekä kaikki yrityksen digitalisaatiosta irti saatava data kerätään isoon tietoaltaaseen, mistä ymmärrystä lähdetään louhimaan edistyneen analytiikan keinoin. Tilastotieteellisiä menetelmiä hyödyntävän edistyneen analytiikan avulla ennustetaan tulevaisuuden skenaarioita, järjestellään dataa samankaltaisiin ryhmiin sekä etsitään syy-seuraussuhteita.
KUVA: Yleismaailmallinen tietoalustaan liittyvien käsitteiden jaottelu.
Ennustaako data tulevaa vai selittääkö se tapahtunutta?
Jatkuvasti kasvava datan määrä ja toisaalta kehittyneet analyysimenetelmät kuten koneoppiminen ja luonnollisen kielen käsittely mahdollistavat monenlaisiin kysymyksiin vastaamisen:
Kuvaileva analytiikka: Mitä tapahtui?
Perinteinen raportointi on varmasti monelle tuttua, yrityksessä voidaan alasta riippuen raportoida esimerkiksi myyntilukuja, tuotantomääriä tai asiakastyytyväisyyteen liittyviä lukuja. Numeeristen raporttien lisäksi datasta voidaan myös luoda rikkaita interaktiivisia visualisointeja, joita voidaan hyödyntää keskustelujen ja ideoinnin tukena.
Diagnosoiva analytiikka: Miksi näin tapahtui?
Esimerkiksi kaupunki voi kartoittaa opiskelijoiden hyvinvoinnin nykytilaa: perinteisten staattisten tilastoanalyysien sijaan, koneoppimisen avulla opiskelijat voidaan jaotella ryhmiin, joilla on erilainen tilanne ja tarpeet. Näin voidaan paremmin hahmottaa, millaisia palveluita eri opiskelijaryhmät tarvitsevat ja kohdistaa toimenpiteet sen mukaan. Harva opiskelija edustaa keskiarvoa, eikä kaikilla ole samoja ongelmia: siksi perinteinen keskiarvojen tuijottaminen ei usein johda optimaalisiin tuloksiin.
Ennakoiva analytiikka: Mitä tulee tapahtumaan?
Yksinkertaisena esimerkkinä ennakoivasta analytiikasta on teollisuusyritys, joka seuraa koneiden toimintaa ja ennustaa milloin tietty osa koneesta on hajoamassa. Tällöin voidaan saavuttaa kustannussäästöjä, kun osa vaihdetaan ennen kuin se hajoaa odottamattomasti ja vältytään viivästyksiltä. Sopivan ennustusmallin löytyminen voi olla haastavaa, mutta riittävällä määrällä hyvälaatuista ja oikein valittua dataa päästään usein hyvään lopputulokseen.
Ohjaava analytiikka: Mitä pitäisi tapahtua?
Ohjaava analytiikka ei tyydy ennustamaan tulevaa, vaan myös pyrkii antamaan neuvoja päätöksenteon tueksi. Ehkä yksinkertaisin esimerkki ohjaavasta analytiikasta ovat suosittelualgoritmit: verkkokauppa voi suositella tietyn tuotteen ostamista muiden asiakkaiden ostokäytökseen perustuen, tai verkkosivusto voi suositella työnhakijalle tietyn osaamisen lisäämistä CV:hen. Usein kyseessä voi olla myös useampien vaihtoehtojen vertailu, kuten tuotteita valmistavan yrityksen mahdollisuus optimoida varastotasoja ja toimitusketjuja.
Datan potentiaali
Maailma on täynnä hyödyntämättömiä analytiikan mahdollisuuksia. On jokaisen yhteiskunnallinen perusvelvollisuus ymmärtää data-analytiikan potentiaali, koska jokainen, joka ymmärtää analytiikan perusajatuksen, voi keksiä oivallisia sovelluskohteita.
Parhaisiin tuloksiin päästään, kun data-analyytikot toimivat yhteistyössä aihealueen substanssiosaajien kanssa. Substanssi vastaa kysymyksistä tärkeimpään ”Miksi?”, kun analytiikka antaa vastauksen kohtiin ”Mitä?” ja ”Miten?”. Näin analyyseista saadaan paras mahdollinen hyöty. Goforen data-analyytikotkin toimivat aktiivisessa yhteistyössä niin tutkimusyhteisöjen, asiakkaiden, johdonkonsulttien, palvelumuotoilijoiden, kuin ohjelmistokehittäjien kanssa.
KUVA: Parempi ymmärrys datan hyödyntämisen mahdollisuuksista luo koko ajan lisää uusia mahdollisuuksia.
Tulevaisuus on täällä tänään
Data-analyysin mahdollisuudet ovat siis monet ja modernia analytiikkaa ja tekoälyä hyödynnetään päivä päivältä laajemmin:
Lääketieteessä modernia analytiikkaa ja tekoälyä voidaan hyödyntää diagnoosien tukena tulkittaessa laboratorionäytteitä ja kuvantamistutkimuksia, tai potilaan tilaa reaaliaikaisesti valvottaessa. TAYS:issa epilepsiapotilaiden unta seurataan tekoälyn avulla. TAYS ja VTT pilotoivat ratkaisua, jossa yhdistetään reaaliaikainen seuranta ja data-analyysi tunnistamaan sydäninfarktin riski. Tietoalusta ja tekoäly vievät lääketiedettä suuntaan, jossa sairaudet tunnistetaan jo ennen niiden puhkeamista.
Kyberturvallisuudessa tekoälyllä on mahdollista ennustaa ja estää rikollisuutta. Esimerkiksi USA:n 2016 presidentinvaalien tyyppinen manipulaatio voidaan havaita ja reagoida siihen. Samoin internetissä käytävää kommunikaatiota ja kauppaa on mahdollista valvoa, ja näin kamppailla esimerkiksi talousrikollisia, terrorismia tai huumekauppaa vastaan.
Finanssisektorilla big dataa ja tekoälyä käytetään laajasti muuhunkin kuin turvallisuuden takaamiseen. Riskin hallinta, tuoton maksimointi, markkina-analyysit, uusien sijoitustuotteiden tuominen nopeasti markkinoille, start-uppien joukkorahoitus ja blockchain ovat kaikki modernin teknologian tuomia rahoitusalan mahdolisuuksia.
Liikenteessä big data ja tekoäly näyttelevät pääroolia ennustettaessa avoimesta datasta liikenneruuhkia ja matka-aikoja. Maailmalla ollaan tekoälyä ottamassa käyttöön paitsi ennustamisessa, myös liikenteen hallinnassa. Tekoälyllä voidaan estää ruuhkien syntymistä ja myös vähentää onnettomuuksia sekä päästöjä.
Teollisuudessa data-analytiikka tarjoaa lähes rajattomat mahdollisuudet toiminnan tehostamiseen ja optimointiin, kun kaikki tuotantoketjusta saatava data yhdistetään ja sitä aletaan ymmärtämään. Kaikki modernit teollisuuden toimijat hyödyntävät data-analytiikkaa esimerkiksi tuotantoketjun, tuotannon, tehtaan ylläpidon ja energian käytön hallinnassa sekä tehostamisessa.
Ympäristönsuojelussa moderni data-analytiikka paitsi tarjoaa epätoivoisia ennusteita planeettamme tilasta, myös auttaa varsinaisessa ympäristönsuojelussa lukemattomilla tavoilla, kuten esimerkiksi tehostamalla liikenteen ja teollisuuden energiankäyttöä, sekä raaka-aineiden kierrätystä.
Start-up maailmassa data-analytiikalla voidaan happotestata uusia tuoteideoita ja ymmärtää loppukäyttäjien tarpeita.
Olemassa olevista data-analytiikan, koneoppimisen ja tekoälyn hyödyntämisen esimerkeistä voi koota pitkän listan. Tulevaisuuden mahdollisuudet ovat rajattomat. Accenture ennustaa (ehkä hieman puolueellisesti), että 79% yrityksistä, jotka eivät aio hyödyntää big dataa tulevat häviämään kilpailussa.