Aineistoja näkyvissä! Tiedot tutkimusaineistojen saatavuudesta yleistyneet tieteellisissä artikkeleissa

Tutkimuksen läpinäkyvyyden, avoimuuden ja toistettavuuden edistämiseksi lehdet suosittelevat yhä useammin, että kirjoittajat lisäisivät käsikirjoitukseensa tietoa tutkimusdatasta ja sen mahdollisesta saatavuudesta, eli ns. Data Availability Statementin (DAS-ilmoitus). DAS-ilmoituksen ideana on kertoa artikkelin lukijoille yksityiskohtaisempaa tietoa tutkimusdatasta ja sen avoimuudesta. Tutkimusten mukaan (mm. Colavizza ym. 2020) avointa tutkimusdataa sisältävät artikkelit hyödyttävät paitsi tieteen toistettavuutta, myös tutkijaa itseään: artikkelit, joiden osana on avattuja aineistoja, saavat myös enemmän viittauksia.

Useilla isoilla tieteellisillä kustantajilla on omat ohjeensa DASin kirjoittamisesta. DAS-ilmoituksessa tulisi kuitenkin mainita esimerkiksi kaikki tutkimusdatan tyypit, joita on käytetty julkaisun tuottamiseen, mistä aineisto on löydettävissä, datan avoimuuden asteet, miten aineistoa voidaan jakaa tai jatkokäyttää ja mitä mahdollisia käyttöehtoja tai rajoituksia aineiston käyttöön liittyy. Mikäli dataa ei voida jakaa tai mikäli tutkimustulosten saamiseksi ei ole käytetty mitään aineistoja, olisi sekin hyvä mainita osana DAS-ilmoitusta. 

Miten hyvin tutkimusaineistoista on sitten kerrottu Tampereen yliopiston tutkijoiden julkaisemissa artikkeleissa? Tampereen yliopiston kirjaston asiantuntijat Kaisa Kylmälä ja Tomi Toikko analysoivat syksyllä 2022 yhteensä 2085 yliopiston tutkijoiden kirjoittamaa A1-tason julkaisua vuosilta 2020 ja 2021. Näistä julkaisuista 540:ssa (n. 26 % analysoiduista) oli mukana Data Availability Statement. DAS-ilmoitusten löytämiseksi artikkelit käytiin manuaalisesti läpi ja niistä etsittiin mainintaa tutkimusdatasta ja sen saatavuudesta. DASin sisällöstä kirjattiin ylös muun muassa datan avoimuuteen, saatavuuteen ja rajoituksiin liittyviä seikkoja. 

Kaisa ja Tomi, mikä teidän selvityksenne perusteella on tilanne Data Availability Statementien suhteen Tampereen yliopiston tutkijoiden julkaisemissa artikkeleissa?  

DAS-ilmoituksia löytyi toistaiseksi vähänlaisesti, mutta niiden lukumäärissä oli näkyvissä selvää nousua lyhyellä aikavälillä. Vuonna 2020 julkaistuista artikkeleista DAS löytyi noin 20 prosentista, kun taas vuoden 2021 artikkeleissa DAS-ilmoitus oli jo noin 31 prosentissa. Selvityksessä havaittiin myös selkeitä eroja yliopiston tiedekuntien välillä. Eri tieteenalat ovat eri kypsyystasoilla, kun puhutaan datanhallinnasta, sen avoimuudesta ja kustantajien ohjeista niihin liittyen. Näitä tietoja tullaan hyödyntämään, kun jatkamme datapalveluiden kehittämistä yliopistossa. 

Te löysitte siis 540 DAS-ilmoitusta. Löytyivätkö ne helposti? 

DAS-ilmoitusten otsikoinnit ja sijainnit vaihtelivat suuresti ja löysimmekin 39 erilaista otsikkoa, joiden alta DAS artikkelissa löytyi. Selvästi yleisin otsikko oli loogisesti Data Availability Statement, jonka osuus kaikista DAS-ilmoituksista oli 43 %. Muita yleisiä otsikoita olivat mm. Data Availability ja Availability of Data and Materials. Otsikoissa toistuivatkin useimmiten sanat data ja availability erilaisissa variaatioissa. Joissain artikkeleissa datan saatavuudesta kerrottiin varsinaisen DAS-ilmoituksen sijaan muissa artikkelin osioissa, kuten Notes tai Acknowledgements. 

Tarkastelitte DAS-ilmoituksia myös avointen julkaisuiden kautta. Mitä havaintoja teitte? 

Analyysissa havaittiin se, että DAS oli selvästi yleisempi avoimesti julkaistuissa artikkeleissa kuin hybridijulkaisuissa tai maksumuurin takana olevissa artikkeleissa. Sama päti myös avoimeen dataan, eli avoimesti julkaistuissa artikkeleissa avointa dataa oli suhteellisesti selvästi useammin kuin muissa artikkeleissa. 

Millaisia datan jakamisen käytäntöjä selvityksessä nousi esille? 

Mielenkiintoisesti yleisin yksittäinen datan tallennuspaikka oli artikkeli itse. Toisaalta monessa julkaisussa mainittiin, että data on saatavilla tutkijalta pyydettäessä. Usein tähän liittyi vaatimus pyynnön kohtuullisuudesta (reasonable request). Olisi mielenkiintoista selvittää onko data oikeasti saatavissa tutkijalta, millä aikataululla ja mitä ”reasonable request” todellisuudessa tarkoittaa. 

Ohjeistavatko kustantajat selkeästi DAS-ilmoituksen kirjoittamisesta? 

Sekä kustantajien että rahoittajien ohjeita DAS-ilmoituksia varten on alkanut näkyä viime vuosina jo mukavasti, mutta edelleen on kustantajia, jotka eivät ole huomioineet asiaa. Toisaalta DAS-suositusten ja -ohjeiden velvoittavuudessa on myös eroja. Kaikki projektissa löydetyt DAS-ilmoitukset löytyivät kansainvälisten kustantajien englanninkielisistä artikkeleista, joten kotimaassa on vielä harjoiteltavaa asian suhteen. 

Onko Tampereen yliopistolla omaa suositusta DAS-ilmoituksen tekemiseen? 

Tampereen yliopiston oma DAS-ohjeistus löytyy Tutkimusaineistojen hallinta -oppaastamme.

Selvityksen data Zenodossa: https://doi.org/10.5281/zenodo.7564440 

Selvityksen PowerPoint-esitys Zenodossa: https://doi.org/10.5281/zenodo.7655891 

 

Jos sinulla on kysymyksiä liittyen DAS-ilmoituksiin tai tutkimusdatan hallintaan, niin ota yhteyttä Tampereen yliopiston datatukeen researchdata@tuni.fi 

 

Lähteet:  

  1. Colavizza G, Hrynaszkiewicz I, Staden I, Whitaker K, McGillivray B (2020) The citation advantage of linking publications to research data.PLOS ONE 15(4): e0230416. https://doi.org/10.1371/journal.pone.0230416 
  1. How to write a data availability statement? https://zenodo.org/record/4788779#.Y6658dVBw2w