Love data -viikko

Helmikuun toinen viikko 10.2-14.2 omistettiin tutkimusdatalle ja rakkaudelle. Viikon aikana pidetyn kampanjan tarkoituksena oli edistää hyviä tutkimusaineistojen hallinnan käytäntöjä, kuten esimerkiksi aineiston turvallista säilyttämistä, avaamista ja uudelleen käyttöä. Jokaiselle päivälle tarjoiltiin datanhallinnan vinkki, sekä päivän teemaan sopiva rakkauslaulu. Tässä kooste viikon teemoista:

  1. Etsi dataa rakastettavaksi paikoista, joista sitä varmasti löytyy. Esimerkiksi tutkimusaineistojen hakupalvelun Etsimen ja Tietoarkiston avulla löydät sopivan kumppanin.

Kentälle pääsy ja tutkimusaineiston kerääminen vaatii paljon työtä. Dataa voi etsiä rakastettavaksi ja hellittäväksi tutkimusaineistojen hakupalveluiden (esimerkiksi Etsin) tai arkistojen kautta. Tietoarkiston Aila-hakuportaalista voit ladata aineistoa käytettäväksi tutkimuksessa ja opetuksessa.

Datalehdistä (esimerkiksi Data in Brief ja Scientific Data) löytyy yksityiskohtaisia kuvauksia tutkimusdatasta ja myös tieto datan olinpaikasta. Myös Tieteelliset artikkelit voivat johtaa tutkimusdatan jäljille. Artikkelissa käytetty data voi olla artikkelissa oheismateriaalina tai datan saatavuudesta kerrotaan tarkemmin artikkelin data statement -osiossa. Kannattaa myös vilkaista artikkelin lähdeluettelo, koska sieltä voi löytyä dataviittauksia.

Tutkimusaineiston käyttäminen uudelleen on ekologinen ja taloudellinen vaihtoehto. Luo löydetyllä aineistolla jotain uutta ja löydä uusia yhteistyökumppaneita. Tunne data-rakkauden roihu sydämessäsi!

Soittolistalla: U2 – I Still Haven’t Found What I’m Looking For (Official Video)

  1. Lakien asettamat velvoitteet luovat pelisäännöt, jonka puitteissa toimitaan niin datojen kuin ihmistenkin kanssa. Huolehdi, että tunnistat aineistoihisi liittyvän lainsäädännön, eli ainakin nämä:

  • Omistat riittävät oikeudet käyttämiisi aineistoihisi, jotta voit hyödyntää niitä tutkimuksessasi.
  • Tutkimusaineisto ei aina ylitä teoskynnystä, joten tekijänoikeuslaki ei välttämättä päde tutkimusdataan. Aineistoosi voi kuitenkin liittyä esimerkiksi tietokantaoikeuksia.
  • Sovi kumppaniesi kanssa datasi käytöstä hankkeen aikana ja sen jälkeen. Jos aineistosi sisältää henkilötietoja tai muita luottamuksellisia tietoja, pidäthän huolen, että tietoihin pääsevät käsiksi vain niitä käsittelevät henkilöt. Vaikka suhteesi dataasi onkin avoimesti tiedossa, kaikkia yksityiskohtia ei kuitenkaan pidä paljastaa muille.
  • Ulkopuolisella rahoituksella tehdyissä hankkeissa muista tehdä oikeuksiensiirtosopimus
  • Aineistoasi voi koskea myös liikesalaisuuslaki
  • Katso Maria Rehbinderin video dataan liittyvästä lainsäädännöstä

Play list: Anna Puu – Säännöt rakkaudelle 

  1. Etsi datallesi hyvä koti tallentamalla se tarkoituksenmukaiseen ja turvalliseen paikkaan. Huolehdi varmuuskopioinnista sekä turvallisesta tiedostojen käsittelystä ja siirrosta. Näin rakkaasi ei katoa matkan varrella tai joudu vääriin käsiin.

Salaa ja erota mahdollisuuksien mukaan sensitiivinen data muusta datasta. Huomioi, että pelkkä datan poistaminen (delete) ei tuhoa dataa. Mieti ketkä saavat nähdä ja käsitellä dataasi.

Hoivaa rakasta dataasi ja sen historiaa hyvällä kansioinnilla sekä tiedostojen versionhallinnalla. Tallenna tiedostoista useita versioita sitä mukaa, kun teet muutoksia tiedostoihin. Nimeä kansiot ja tiedostot riittävän kuvaavasti, jotta tiedät mistä versiosta on milloinkin kyse.

Soittolistalla:  Agents & Jorma Kääriäinen – Moskovan valot : https://areena.yle.fi/1-50141719

  1. Tutkimusdataa kannattaa rakastaa avoimesti, älä salaa rakkauttasi

Suhteestasi toisen keräämään dataan kerrot dataviittauksella. Viittaus antaa tunnustusta datan kerääjälle ja tuo näkyvyyttä datalle. Dataviittauksessa keskeisiä tietoja ovat tekijä, tekijän taustaorganisaatio, aineiston nimi, keruuajankohta, versio, pysyvä tunniste sekä jakajatieto. Data-arkistot tarjoavat usein myös malliviittauksen arkistoimalleen datalle.

Soittolistalla: Abba – I do, I do, I do, I do, I do (Official Video)

  1. Muista kuitenkin, että dataa voi jakaa vain, jos siitä on sovittu kaikkien sen keräämiseen osallistuneiden osapuolten kanssa.

Samalla sovitte, millä ehdoilla avaamaanne dataa voi käyttää ja annatte aineistolle lisenssin, jossa määritellään käyttöehdot. Avattu data ei luonnollisestikaan saa sisältää luottamuksellista tietoa, jonka jakaminen ei ole mahdollista.

Avoimille tutkimusaineistoille suosittelemme CCBY lisenssiä tai CC0 –luopumaa, joka varmistaa laajimmat jatkokäyttömahdollisuudet. Parhaiten sinun aineistosi avaamiseen soveltujaa lisenssiä voit kartoittaa oppaastamme.

Datan avaamiseen kannattaa hyödyntää alallasi jo vakiintuneita palveluita, mikäli vain mahdollista. Jos datan avaamiseen soveltuvat palvelut eivät ole sinulle tuttuja, voit hyödyntää esimerkiksi

  • Tampereen yliopiston yhteydessä toimivaa Tietoarkistoa
  • EU:n rahoittamaa Zenodoa
  • Tai etsiä sinulle soveltuvia palveluita Re3data -portaalista

Soittolistalla: Gladys Knight –License to kill (Proms in Hyde Park 2018)  (BBC Music)

  1. Reilu rakkaus ja fair data

Datallesi osoitat rakkautta olemalla sille reilu eli noudattamalla kansainvälisiä FAIR-periaatteita. FAIR-periaatteiden tarkoitus on tehdä data löydettäväksi (Findable), saavutettavaksi (Accessible), yhteentoimivaksi (Interoperable) ja uudelleenkäytettäväksi (Re-usable). Datan reiluutta varmistavat muun muassa seuraavat seikat:

  • datalla on pysyvä tunniste kuten DOI tai URN
  • datalla on avoin tiedostomuoto
  • data on kuvailtu eli siitä on olemassa metatietoa
  • datalla on lisenssi, joka kertoo jatkokäytön mahdollisuuksista
  • data on tallennettu data-arkistoon.

Soittolistalla:  Stevie Wonder – All in love is fair