Aineistonhallinnan akatemia, osa 2. Aineiston esittely ja datan laatu

Aineistonhallintasuunnitelman kirjoittaminen lähtee perusasioista: oman tutkimusaineiston tunnistamisesta ja sen kuvaamisesta. Siksi on hyvä käyttää hetki sen pohtimiselle, mitä tutkimusaineisto minun tutkimuskontekstissani tarkoittaa? Käsitelläänkö aineistonhallintasuunnitelmassa fyysistä aineistoa vai keskitytäänkö ”dataan”? Onko minulla tutkimusaineistoa?

Data tuo joillekin mieleen excelit, taulukot ja tietokannat, mutta kyllä datan voi ymmärtää laajemminkin. Haastattelutiedostot, litteraatit, valokuvat, videot, mittaustulokset, etnografia, historiantutkijan muistiinpanot arkistoaineistoista, julkiset asiakirjat, rekisteriaineistot, aiemmin kerätyt tutkimusaineistot, Internet-aineistot, muista aineistoista analyysiä varten tehdyt luokittelut voidaan kaikki nähdä datana.

Laajasti ymmärrettynä mikä tahansa tutkimuksessa käytetty tausta-aineisto, jonka pohjalta uutta tietoa tuotetaan, voidaan nähdä aineistonhallintasuunnitelmassa datana. Pois lukien tieteelliset julkaisut, ellet sitten tutki tieteellistä julkaisemista?

Rajanvetoa datan ja aineiston välille voi olla hankala vetää, eikä sille ehkä ole tarvettakaan. Olennaista on määritellä aineisto tutkimuksen omista lähtökohdista ja huomioida juuri oman tutkimuksen keskeiset erityispiirteet. Jos esimerkiksi aineiston käsittely vaatii projektissa tuotettuja koodeja, myös ne kannattaa huomioida datana.

Myös fyysiset aineistot voidaan nähdä ”datana”, siltä osin, kun ne omassa tutkimuskontekstissa tuntuvat relevanteilta. Avoimen tieteen ja tutkimusaineistojen avoimuuden näkökulmasta fyysiset aineistot voivat olla hankalia ja siksi pääpaino aineistonhallintasuunnitelmassa onkin yleensä digitaalisissa aineistoissa. Toisaalta esimerkiksi kudos- ja verinäytteille on olemassa biopankkeja, joten tässäkin suhteessa rajanveto voi olla vaikeaa.

Lähes yhtä kiperä aineistonhallinnan kysymys liittyy datan laatuun. Kuten juuri huomasimme, tutkimusaineisto voi olla lähes mitä tahansa, jolloin yleisen tason vinkkiä datan laadun varmistamiseksi on mahdotonta antaa.

Laatukysymykset voivat liittyä esimerkiksi versionhallintaan, haastattelujen litteroinnin tarkistamiseen, analogisen materiaalin digitalosointiin ja moneen muuhun asiaan. Tärkeintä on tunnistaa mahdolliset virheet, mitä datan keräämis- ja käsittelytilanteissa voi tapahtua. Muista myös, että yhdenmukaisista työskentelykäytännöistä sopiminen sekä tutkimusryhmäläisten kouluttaminen ja ohjeistaminen parantaa paitsi aineiston laatua, säästää myös aikaa.

Ohjeita Aineistonhallintasuunnitelman kirjoittamiseen löydät DMPTuuli ja yksityiskohtaisempia neuvoja voit kysyä osoitteesta researchdata@tuni.fi. Aineistonhallinnan ohjeet löydät myös oppaastamme.