Blogi 28.3.2014

Avoimen datan lisenssit helpottavat datan käyttöä ja julkaisua

Gofore

Kiva kun löysit tämän artikkelin! Se sisältää varmasti hyvää tietoa, mutta pidäthän mielessä, että se on kirjoitettu 10 vuotta sitten.

Avoimen datan julkaisun motivaationa on lupaus avoimen datan parantavan verkoston kokonaistuottavuutta. Datan ollessa avoimesti satavilla, sitä voidaan hyödyntää useammassa osassa verkostoa, jolloin myös potentiaalista lisäarvoa syntyy useammassa osassa verkostoa. Ihanteellisesti avoimen datan käyttöönoton transaktiokustannukset ovat lähellä nollaa, koska datasta ei tarvitse maksaa, työaikaa ei kulu sopimusneuvotteluihin, eikä asianajajien palkkoihin sopimuksen laatimisessa. Sen lisäksi, että avoimien lisenssien luovat lakiteknisen ilmaisun sisällön avoimuudelle, niiden tärkein rooli on selkeyttää datan käyttäjälle ja julkaisijalle mitä avoin julkaiseminen tarkoittaa.
Avoimet sisältölisenssit kattavat niin avoimen lähdekoodin lisenssit, kuin avoimet taidelisenssit ja avoimen datan lisenssit. Voidaan myös mieltää avoimien API:en lisenssien kuuluvan tähän joukkoon henkisesti, vaikka palvelun ja sisällön ero onkin mielenkiintoinen semanttinen kysymys. Koodi on kuitenkin luonteeltaan erilaista kuin data tai taideteos, joille tarvitaan erilaisia lisenssejä. Kaikille lisensseille yhteistä on lupa sisällön käyttö omaan tarkoitukseen ja sisällön eteenpäin levittäminen. Riippuen sovellusalueesta kaupallinen hyödyntäminen ja sisällön muokkaaminen saattaa olla kiellettyä lisenssissä. Kaikki avoimet datasetit ja koodinpätkät eivät esimerkiksi ylitä teoskynnystä, jolloin niitä eivät suojaa tekijänoikeudet, mutta ne saattavat olla lähioikeuden alaisia.
Avoimien sisältölisenssien inspiraationa ovat olleet avoimen lähdekoodin lisenssit. Avoimen lähdekoodin lisenssit ovat mahdollistaneet avoimen lähdekoodin menestystarinat, kuten Linuxin, Mozillan, RedHatin ja Eclipsen. Avoimen lähdekoodin lisenssit ovat kuitenkin olleet edelläkävijänä, jonka vuoksi avoimen datan lisenssejä kohtaan ei ole yhtä suuria ennakkoluuloja kuin avointa lähdekoodia aikanaan. Myöskään avoimia sisältölisenssejä vastaan ei ole ollut mahdollista käydä yhtä mittavia ja tehokkaita pelottelukampanjoita, kuin avoimen lähdekoodin lisenssejä vastaan. Kuten avoimen lähdekoodin lisenssien käyttö, myös avoimien sisältölisenssien käyttö, sekä uhkaa vanhoja liiketoimintamalleja, että mahdollistaa uusia.
Ehkä oleellisin asia, minkä avoimen datan sisältölisenssien tekijät ovat oppineet avoimen lähdekoodin lisensseistä, on selkeyden ja yksinkertaisuuden tärkeys. Avoimen lähdekoodin lisenssejä on yli 60 tarkasti määriteltyä, sekä lukemattomia muita koodiin liitettyjä ilmaisuja joilla sen käyttö mahdollistetaan avoimena. Datalle suositeltuja avoimia sisältölisenssejä on alle kymmenkunta ja niistä on tarkoituksella yritetty tehdä mahdollisimman selkeitä ja yksinkertaisia. Avoimen lähdekoodin lisenssit voivat olla yli kymmenen sivua pitkiä ja käyttää ilmaisuja joiden merkitys ei aukea asianajajalle kuin ohjelmistokehittäjällekään. Tällöin lisenssi ei enää palvele tehokkaasti tarkoitustaan lisensoidun sisällön käytön mahdollistajana. Vastuuntuntoinen käyttäjä haluaa varmistaa oikeutensa käyttää koodia, jolloin hän joutuu käyttämään paljon aikaa lisenssin tutkimiseen tai rahaa asiantuntijapalveluun koodin ja lisenssin auditointiin.
Lisensseillä, kuten muille vastaavilla viestinnän työkaluilla, on tapana lisääntyä ja muuttua ajan myötä. Avoimen sisällön edelläkävijä, Creative Commons (CC) -yhteisö, taistelee tätä kehitystä vastaan. Uusia lisenssejä ei tehdä, mutta vanhoja päivitetään. CC-lisenssien rakenne on myös jossain määrin modulaarinen, joten niissä voidaan esimerkiksi määritellä minkä maan oikeusistuimien alla lisenssiä koskevat riidat tulee käsitellä muuttamatta lisenssiä. Modulaarisuuden vuoksi lisenssien sisältö voidaan ilmaista selkeästi muutamalla ikonilla. CC-lisenssien lähestyttävyys on tehnyt niistä suosittuja, sekä julkaisijoiden, että loppukäyttäjien keskuudessa. CC-lisenssit ovatkin loistava esimerkki, kuinka avoimen datan transaktiokustannuksia minimoidaan. CC-lisenssien modulaarisuuden vuoksi niille on kehitetty myös RDF-pohjainen kuvauskieli, jolloin lisenssien ehdot voidaan esittää myös koneluettavassa muodossa. Tällöin lisensoidun datan transaktiokustannukset voidaan hoitaa automaatiolla. CC on tehnyt myös julkaisijalle lisenssin valintaa helpottavan yksinkertaisen verkkopalvelun.
Kuitenkin suuret toimijat, kuten kansallisvaltiot, ovat syystä tai toisesta välttämättä halunneet määritellä omat lisenssinsä omalle datallaan. Se lisää lisenssien määrää ja käyttäjien mahdollisuuksia sekaannuksiin. Open Knowledge Foundation (OKF) ylläpitää avoimen lisenssin määritelmää ja listaa lisenssistä, jotka täyttävät tämän määritelmän eri osa-alueet. Lisäksi OKF:llä on ikoneja, joilla voi helposti ja käyttäjäystävällisesti merkitä avoimella lisenssillä lisensoitua data. OKF:llä on myös API, jossa sen analysoimien lisenssien kuvauksia on saatavilla koneluettavassa JSON-muodossa.
Vaikka tekijänoikeuskysymykset ja lisensointi ovat kiinnostavia, ei moni tykkää arpoa niitä kovinkaan pitkään, jos on juuri saanut omasta mielestään loistavan idean sovelluksesta, visualisoinnista tai liiketoimintamahdollisuudesta. Tästä syystä, ja ihan oman mukavuudenkin vuoksi, on hyvä olla tietoinen yleisimmistä avoimista sisältölisensseissä ja pitäytyä niissä. Yleisimmät lisenssit myös tarjoavat valmiiksi käyttäjä- ja koneystävällisiä lisenssien ilmaisut. On myös olennaista, että otettaessa käyttöön muita transaktiokustannuksia pienentäviä ratkaisuja, kuten datan löytämistä helpottavia tietovarantoja, niin myös niissä otetaan huomioon lisenssien mahdollisuudet ja selkeä esittäminen.

Takaisin ylös