180 tutkijaa, opiskelijaa ja muuten aiheesta kiinnostunutta osallistui kirjaston järjestämään miniseminaariin sosiaalisen median aineistojen käytöstä tutkimuksessa. Seminaarin esitysdiat löydät täältä.
Some-aineistojen tutkimuskäyttö on hyvin yleistä, mutta aiheeseen liittyy tutkimuseettisiä ja oikeudellisia kysymyksiä, jotka aiheuttavat monille päänvaivaa. Miten nettikeskusteluihin osallistuvia tulisi informoida? Saako sosiaalisen median palvelusta ladata viestejä omalle koneelle? Voinko ottaa käyttäjien viesteistä suoria lainauksia? Teemat toistuivat osallistujilta pyytämissämme ennakkokysymyksissä, joita erityisasiantuntija Katja Fält esitteli avauspuheenvuorossaan. Saamaamme noin 40 ennakkokysymykseen vastaaminen olisi vaatinut oikeastaan oman seminaarinsa, joten pyysimme esiintyjiä ottamaan teemoja huomioon omissa esityksissään ja käsittelemään niitä siltä osin, kuin kokevat tarpeelliseksi.
Sosiaalisen median aineistot ovat pulmallisia paitsi tutkimuksen, myös arkistoinnin näkökulmasta. Kaikki mikä on julkisesti saatavilla ja nähtävillä, ei ole välttämättä käytettävissä muihin tarkoituksiin alkuperäisestä asiayhteydestään irrotettuna. Näihin asioin pureutui Tietoarkistossa työskentelevä johtava asiantuntija Arja Kuula-Luumi omassa puheenvuorossaan.
Esimerkiksi käyttäjän julkaisema kommentti somealustalla ei välttämättä käy sellaisenaan sitaatiksi julkaisuun, ellei tähän ole kommentin kirjoittajan lupaa. Sitaatti muodostaa helposti myös henkilötunnisteen, joten tietosuojakin on otettava huomioon.
Joissain tapauksissa tekijänoikeudet saattavat rajoittaa aineiston käyttöä muuhun tarkoitukseen. Valokuvat ja videot saavat aina tekijänoikeuden suojaa, mutta joskus lyhyt kirjallinen ilmaisukin voi olla suojan piirissä.
Aineistojen tutkimuskäyttöä rajoittavat lisäksi palveluiden käyttöehdot, joiden tulkinta voi kuitenkin olla maallikolle hankalaa. Palveluiden käyttäjät eivät aina tiedä, mihin ovat suostuneet eikä toisaalta tutkimuskäyttöä ole välttämättä erikseen käyttöehdoissa mainittu.
Käytännöllisemmän lähestymistavan sosiaalisen median aineistojen käsittelyyn toi Tampereen yliopiston johtamisen ja talouden tiedekunnassa työskentelevä yliopistotutkija Jukka Huhtamäki. Hän on Twitter-aineistoja tutkiessaan hyödyntänyt laskennallisia menetelmiä ja mediaetnografiaa. Laskennallisin keinoin on mahdollista tehdä tilastollista analyysiä aineistoista, mutta menetelmiä voi hyödyntää myös datan jalostamiseen, käsittelyyn ja visualisointiin.
Twitter on tehnyt aineistojen tutkimuskäytön mahdolliseksi sovellusrajapintojen avulla, mutta muiden sosiaalisen median palveluiden, kuten Facebookin kohdalla tilanne ei ole välttämättä näin yksinkertainen. Jotkut sosiallisen median palvelut ovat rajoittaneet alustojensa aineistojen tutkimuskäyttöä käyttäjiensä yksityisyyden suojaan vedoten. Voidaan kuitenkin kysyä, voiko yhteiskunnallisesti merkittävä palvelu kuitenkaan näin rajoittaa tieteellisen tutkimuksen tekemistä ja käytetäänkö tässä yksityisyyden suojaa vain tekosyynä.
Tutkijoiden aktiiviseen läsnäoloon sosiaalisessa mediassa liittyy eettisiä haasteita, joita kirjallisuustieteen yliopistonlehtori Samuli Björninen toi havainnollisesti esiin. Kertomuksen vaarat -projektin tutkijat saivat omakohtaisesti kokea, minkälaisia sudenkuoppia sosiaalisen median läsnäoloon voi liittyä.
Yliopistonlehtori Paavo Arvola kertoi Poliitikkojen ja politiikan toimittajien verkostoitumisesta Twitterissä. Tiedonlähteenään Arvola tutkimusryhmineen on käyttänyt Twitterin lisäksi mm. eduskunnan sekä digi- ja väestötietoviraston avointa dataa. Aineiston käsittelyä ja analysointia tehtiin niin määrällisten kuin laadullistenkin menetelmien avulla. Laskennallisen menetelmän haasteeksi muodostuu kontekstista riippuvien Twiittien merkitys ja tulkinta. Siksi twiittejä kerättiin rajapinnan kautta, mutta luokittelu teemoihin tehtiin käsityönä.
Sosiaalisen median aineistojen käyttöön liittyvistä haasteista huolimatta sosiaalisen median ilmiöiden tutkiminen on mahdollista, kunhan muistaa ottaa huomioon ainakin seuraavat asiat:
- Lue palvelun käyttöehdot ja selvitä, voiko palvelusta kerättyjä tietoja käyttää tutkimukseen.
- Selvitä, miten aineistoa voi palvelusta kerätä. Onko käytettävissä rajapintaa, otatko kuvankaappauksia…
- Kuviin ja videoihin liittyy tekijänoikeuksia – joissain tapauksissa myös teksteihin.
- Ota huomioon konteksti, jossa alkuperäiset tekstit on esitetty. Käyttäjä ei välttämättä osaa ennakoida sitä, että somepäivitykset voivat päätyä tutkimusaineistoksi.
- Suorat sitaatit muodostavat herkästi myös henkilötunnisteen, jolloin tietosuojavelvoitteet koskevat tutkijaa.
- Mieti, miten informoit tutkittavia. Oletko yhteydessä palvelun ylläpitäjään? Julkaisetko tutkimustiedotteen keskustelupalstalla? Tee tietosuojailmoitus ainakin hankkeesi verkkosivuille, jos sellaiset on. Jos julkaiset tietosuojailmoituksen yliopiston sivuilla ole yhteydessä tietosuojavastaavaan.
- Huomioi eettisen toimikunnan lausunnon tarve erityisesti, jos et voi kysyä tutkittavilta eettistä osallistumissuostumusta eikä aineisto ole täysin julkinen.
Aiheeseen liittyvää luettavaa:
- Some-aineistojen tutkiminen kariutuu usein tekijänoikeuksiin ja käyttöehtoihin. Tietoarkiston blogissa julkaistu yhteenveto humanististen alojen aineistojen tietosuojaa ja tekijänoikeutta käsittelevästä seminaarista.
- Käytätkö somedataa tutkimuksessasi? Marko Ahteensuu avaa sosiaalisen median aineistojen käyttöön liittyviä oikeudellisia ja eettisiä kysymyksiä.
- Kuka saa päättää, mitä dataa tutkijalla on käytössään? Ei ainakaan amerikkalainen suuryritys. Rajapinta ry:n sivustolla julkaistua pohdintaa some-aineistojen käytöstä tutkimuksessa.
- Sosiaalinen media ja tutkijan etiikka. Artikkeli julkaistu Media & Viestintä -lehdessä.
- Taitavasti eettistä verkkotutkimusta. Salla-Maaria Laaksosen artikkeli Vastuullinentiede.fi -sivustolla.
- Miia Kososen koonti sosiaalisen median tutkimusmenetelmistä.
- Axel Bruns (2019) After the ‘APIcalypse’: social media platforms and their fight against critical scholarly research, Information, Communication & Society, 22:11, 1544-1566, DOI: 10.1080/1369118X.2019.1637447
- Freelon, D. (2018). Computational Research in the Post-API Age. PoliticalCommunication, 35(4), 665–668. https://doi.org/10.1080/10584609.2018.1477506
- Hiippala, T, Hausmann, A, Tenkanen, H & Toivonen, T 2019, ’ Exploring the linguistic landscape of geotagged social media content in urban environments ’, Digital scholarship in the humanities, vol. 34, no. 2, pp. 290-309 . https://doi.org/10.1093/llc/fqy049
- Jaakonmäki, R., Müller, O., & vom Brocke, J. (2017). The Impact of Content, Context, and Creator on User Engagement in Social Media Marketing. In Hawaii International Conference on System Sciences. https://doi.org/10.24251/HICSS.2017.136v