Blogi 1.4.2014

Julkishallinnon omistaman datan avaaminen: mitä tulisi varmistaa ennen teknistä toteutusta?

Gofore

Kiva kun löysit tämän artikkelin! Se sisältää varmasti hyvää tietoa, mutta pidäthän mielessä, että se on kirjoitettu 10 vuotta sitten.

Julkishallinnon tuottaman ja omistaman datan avoin saatavuus on yksi hallinnon läpinäkyvyyden mittareista. Ei toki ainoa eikä merkittävinkään, mutta oikein sovellettuna ja hyödynnettynä avoin data on yksi keino, jolla saamme tehostettua suomalaisen yhteiskunnan toimintaa. Jotta tuo tavoite saavutetaan, meidän on tiedettävä miten datan avaaminen tulisi tehdä. Samoin on ymmärrettävä mitä avoin data ja avoin tieto itse asiassa ovat. Ne kun eivät ole sama asia.
Datan avaamisen pohdinta tulee aloittaa strategisten tavoitteiden tunnistamisesta: miksi dataa avataan, mitä datan avaamisella tavoitellaan ja mitä seurannaisvaikutuksia datan avaamisella on. Samoin on ymmärrettävä, mitä datan ja tiedon avaamisella halutaan nimenomaisesti välttää tai estää tapahtumasta. Näin siksi, että avoimeen dataan ja avoimeen tietoon liittyvät mahdolliset ongelmat eivät niinkään ole luonteeltaan teknisiä vaan ensisijaisesti toiminnallisia ja taloudellisia. Etenkin kun vaikutukset ovat yleensä peruuttamattomia; jos data on avattu julkiseen käyttöön, se on vapaassa jakelussa eikä sitä saada enää suljettua. Toki on huomattava, että vaikka kerran avattua dataa ei saada enää suljettua, se kuitenkin vanhenee jollain aikavälillä. Vaikka datan julkaisu voi osoittautua vääräksi ratkaisuksi, niin virheistä voidaan oppia. Lyhyellä aikavälillä aikaansaatu vahinko voidaan laskea osaksi oppimisprosessia.
Teknisesti ottaen datan avaaminen on suoraviivaisempaa. Yksinkertaisimmillaan avoin data voi olla missä tahansa muodossa olevaa rakenteetonta dataa, joka on tehty julkisesti saataville. Kehittyneemmässä lähestymistavassa avoimeen dataan voidaan lisätä rakenteisuutta, avoimia ja sovellusriippumattomia tietoformaatteja, niistä voidaan tehdä osoitettavissa olevia tietoalkioita tai dataan voidaan sisällyttää kontekstisidonnaisia linkityksiä. Kontekstisidonnaisuuden myötä avoimesta datasta voidaan jalostaa avointa tietoa, jolla onkin sitten jo kertaluokkaa enemmän sisäänrakennettua arvoa. Kontekstisdonnaisuuden yhteydessä on huomioitava, että monissa tapauksissa datan avaaja on investoinut aikaa ja rahaa kontekstisidonnaisuuden tuottamiseen, mikä osaaltaan on yksi sisäänrakennetun arvon komponentti.
Tekniikka sikseen, mutta mihin asioihin olisi sitten kiinnitettävä huomiota, kun julkishallinnon tuottamaa ja jalostamaa dataa halutaan avata? Kokemuspohjaisesti olemme havainneet, että aiheeseen liittyvät pohteet on hyödyllistä jakaa viiteen eri näkökulmaan, joita kutakin voidaan tarkastella verraten itsenäisesti.
Ensimmäinen käsiteltävä teema kattaa datan avaamisen tavoitteiden tarkastelun; miksi julkinen toimija ylipäänsä haluaa avata dataa ja millaisia kokonaishyötyjä avaamisella tavoitellaan. Minimissään tavoite voi olla tehdyn poliittisen päätöksen toteuttaminen. Toisaalta tavoite voi myös olla tietyn toimialan tukeminen ja kaupallisten toimijoiden liiketoimintamahdollisuuksien avaaminen.
Kun tavoitteista on sovittu, on analysoitava mitä tiettyä dataa halutaan avata. Tähän liittyvässä tarkastelussa on ymmärrettävä ne rajoitteet ja mahdollisuudet, joita kuhunkin avattavaan datalajiin liittyy. Olennaista on, että avattava data on sellaista, jolla on paitsi kysyntää datan kuluttajien keskuudessa, myös avattuna kaikille osapuolille turvallista. Datan avaaminen ei saa rikkoa julkiselle viranomaiselle asetettuja velvoitteita ja vastuita. Tällöin on varmistettava, että avaamisesta ei koidu ennakoimattomia seuraamuksia dataan liittyvän arvoketjun toimijoille. Esimerkkinä vaikkapa se, että avaamalla aiemmin suljettua tai suojattua dataa, julkinen toimija vahingossa tulee neutraloineeksi oman asiakkaansa liiketoimintamallin.
Kun tiedetään, mitä tavoitellaan ja mitä tarjotaan, on myös ymmärrettävä mikä on avattavan datan kohdeyleisö ja mitä arvopotentiaalia tälle yleisölle tarjotaan. Se, että data laitetaan julkiseen verkkoon saataville ja toivotaan, että joku sitä käyttää, johtaa harvoin kokonaisuuden kannalta parhaaseen tai edes riittävään lopputulokseen. Onnistuneeseen datan avaamiseen kuuluu se, että julkinen toimija pyrkii ennakoimaan, ketkä avattavaa dataa tulevat käyttämään ja miten haluttu arvo syntyy avattua dataa jalostamalla. Näin siitäkin huolimatta, että avoimen datan suuri potentiaalinen arvo on myös ennakoimattomissa käyttötavoissa. Ennakoimattomien datan käyttäjien ja toivottujen datan käyttäjien arvon muodostamisen haaste on myös datan avaamisen viestinnän suunnittelussa. Viestinnäksi kun ei riitä, että avoin data on jossain julkisen levyn kulmalla hakukoneiden saatavilla. Hyvin suunniteltu ja toteutettu viestintä on yksi keskeinen onnistumisen mahdollistaja.
Tavoitteiden ja hyötyjen lisäksi on ymmärrettävä käytössä oleva operatiivinen tapa, jolla julkinen toimija tunnistaa, kerää, verifioi, hyödyntää ja julkaisee datansa. Käytännössä julkisen toimijan on tarkasteltava omia datan käsittelyyn liittyviä käytänteitä varmistaakseen sen, että julkaistava avoin data on vain ja ainoastaan sellaista dataa, joka on nimenomaisesti avoimeksi tarkoitettu. Julkisyhteisön sisäisten prosessien kannalta tämä tarkoittaa sitä, että ei-avoimen datan ja avoimen datan käsittelytavat on määritelty ja toteutettu siten, että datan avaaminen on aina tietoinen toimenpide. Tällöin painopiste on nimenomaisuudessa: vain ja ainoastaan avoimeksi tarkoitettua dataa syötetään avoimen datan julkaisuprosessiin.
Viidentenä tarkasteltavana aihekokonaisuutena on syytä pitää myös riskien ja väärinkäytösten hallintaa. Tämä pohjautuu siihen, että julkisten toimijoiden hallussa on datakokonaisuuksia, jotka kuvaavat erilaisiin ihmiselämän osa-alueisiin liittyviä ilmiöitä. Avattavan datan osalta lähtökohtana on, että mikään avattavista datakokonaisuuksista ei aiheuta tai niiden ei pitäisi aiheuttaa yksittäiselle kansalaiselle tai ryhmälle kansalaisia heidän turvallisuuteensa tai yksityisyyden suojaansa liittyviä ongelmia. On kuitenkin olemassa skenaarioita, joissa sinänsä harmittomia yksittäisiä datakokonaisuuksia yhdistelemällä ja analysoimalla voidaan saada aikaan tietokokonaisuuksia, jotka yhdisteltyinä mahdollistavatkin potentiaalisesti hyvinkin huolestuttavien käyttötapojen esiintymisen.Tällaisiakin esimerkkejä historiasta kyllä löytyy.
Yllä esitetyt näkökohdat muodostavat käytännössä minimitason sille tahtotilan tarkastelulle, joka julkisen viranomaisen tulee käydä läpi ennen siirtymistä suljetun datan avaamisen tekniseen toteuttamiseen.

Takaisin ylös