Tutkija suuntaa pyöräretkillään murrepitäjiin

Järvimaisema

Murrematkat ovat vieneet Olli Kuparisen sympaattisiin pikkukyliin. Tutkijantyössään hän analysoi puhekielen vaihtelua ja muutoksia. Sitä kautta hän on päätynyt laskennallisten menetelmien ja tekoälyn maailmaan.

Mitä yhteistä on pyöräilyllä ja murteilla? Ei varsinaisesti mitään, mutta pyöräilyä harrastava suomen kielen tutkija Olli Kuparinen on keksinyt tavan yhdistää ne. Hän sai pari vuotta sitten idean, että voisi lähteä pyöräretkille paikkakunnille, joilla on aikoinaan kerätty näytteitä suomen kielen murteista. Hän kirjoittaa matkoistaan blogia, jossa kertoo eri murrealueista ja murteiden ominaispiirteistä.

— Olen nähnyt uusia paikkoja, pieniä pitäjiä ja syrjäkyliä, joissa ei muutoin tulisi käytyä. Vastaan on tullut osi sympaattisia paikkoja, mielenkiintoisia kyläpuoteja ja hienoja maisemia, Kuparinen kertoo.

Olen nähnyt uusia paikkoja, pieniä pitäjiä ja syrjäkyliä, joissa ei muutoin tulisi käytyä.

Idean taustalla on 1960-luvulla Suomessa aloitettu laaja murteenkeruututkimus, jonka yhteydessä haastateltiin puhujia systemaattisesti eri puolilta maata. Lopputuloksena on ainutlaatuinen nauhoitearkisto, jossa ääninauhaa on tuhansia tunteja. Kotimaisten kielten keskus on kerännyt nauhoitteista kokoelman, joka sisältää 50 suomenkielistä pitäjää.

— Olin jo pidempään miettinyt, että olisipa kiva nähdä seutuja, joilta murrenäytteitä on kerätty. Nauhoitearkiston tietojen avulla murteenkeruupaikat voidaan paikantaa hyvin tarkasti, joten päätin ryhtyä tuumasta toimeen, Kuparinen kertoo.

Olli Kuparinen
Olli Kuparinen
Työ: Suomen kielen tutkija, Tampereen yliopisto.
Koulutus: filosofian tohtori 2021, filosofian maisteri 2015, Tampereen yliopisto.

Kielentutkija sukelsi tilastotieteen pariin

Kuparinen on käynyt pyöräretkillään muun muassa Vihdissä, Urjalassa, Pälkäneellä, Ikaalisissa, Juupajoella, Ilmajoella, Jurvassa, Liedossa ja Alastarolla.

— Paljon ajasta kuluu pyöräilemiseen, sillä pisimmät päivämatkat ovat olleet yli 200 kilometriä. Toisaalta kun pysähdyn, ihmiset tulevat mielellään juttelemaan. Keskustellessa on ollut kiva huomata kullekin pitäjälle tyypillisiä murrepiirteitä, Kuparinen kertoo.

Kuparinen on tutkijana tottunut kiinnittämään huomiota puhetapaan ja murteisiin. Gradunsa hän teki Helsingin puhekielen infinitiiveistä eli siitä, miten verbin perusmuodon käyttö on ajan myötä muuttunut monissa yhteyksissä. Usein sanotaan esimerkiksi ”mä voin relaa” sen sijaan, että käytettäisiin muotoa ”voin relata”. Väitöskirjassaan hän tarkasteli Helsingin puhekielen muutoksia 1970-luvulta 2010-luvulle. Niitä ovat muun muassa pronominien minä ja sinä käytön korvautuminen (mä, sä), sananloppuisen i:n häviäminen (tulis, viis) ja d:n kato h:n jäljessä (ahistaa, kaheksan).

Tutkimustensa myötä Kuparinen on perehtynyt käyttämään laskennallisia menetelmiä, joita tarvitaan kielen piirteiden analysoinnissa laajoista aineistoista. Lisäksi hän on tehnyt kieliteknologista tutkimusta.

— Olen hieman vaivihkaa uponnut yhä syvemmälle tilastotieteen menetelmien pariin. Ne ovat tärkeä apuväline, kun halutaan analysoida isoista aineistoista kielen ilmiöitä, Kuparinen kertoo.

Lukiolaisten kieli- ja murretietoisuutta tutkitaan kyselyllä

Parhaillaan käynnissä olevassa Arkisuomet-hankkeessa (LANGAWARE) Kuparinen kollegoineen aikoo kerätä kaikki murrealueet kattavan systemaattisen kyselyaineiston. Sen avulla selvitetään nuorten suomen kieleen ja sen vaihteluun liittyviä käsityksiä sekä tietoisuutta kielenkäytössä tapahtuvista muutoksista. Vastauksia toivotaan noin 2500-5000 lukiolaiselta.

— Toiveena on, että saamme kattavan aineiston nuorten kielikäsityksistä. Teemme myös aluekohtaisia kielitietoisuutta ja -asenteita mittaavia reaktiotehtäviä. Pyrimme omalta osaltamme samalla myös paikkamaan kansallista murteenseuruuhanketta, jota ei enää hallinnoi kukaan, Kuparinen kertoo.

Kansallista murteenseuruuhanketta ei enää hallinnoi kukaan.

Kotimaisten kielten keskuksen johtama murteenkeruututkimus lopetettiin säästösyistä 2000-luvun alussa, minkä jälkeen suomen kielen variaatiota kartoittavaa tutkimusta ei ole systemaattisesti tehty.

— Murteet sinänsä elävät ja voivat hyvin, mutta onhan se harmi, ettei säännöllistä seurantaa enää ole. Se on jäänyt yliopistojen tutkimusryhmien harteille.

Puhuttu ja kirjoitettu kieli sekoittuvat keskenään

Kuparisen mukaan kielentutkijana on kiinnostavaa seurata puhekielen lisäksi myös kirjoitetussa kielessä tapahtuvaa vaihtelua. Nykyisellä pikaviestinnän ja somen aikakaudella puhekieli ja kirjoitettu kieli sekoittuvat usein iloisesti keskenään.

— Esimerkiksi verkkokeskusteluissa ja somessa näkee, miten puhutun kielen ilmaisut ja murteet vuotavat kirjoitetun kielen puolelle, Kuparinen sanoo.

Puhutun kielen ilmaisut ja murteet vuotavat kirjoitetun kielen puolelle.

Ilmiö on molemminpuolinen: myös kirjoitetun kielen ilmaisut siirtyvät nykyisin puhekieleen. Esimerkiksi lyhenteitä esim., jne., ym. saatetaan käyttää sujuvasti puhekielen lomassa. Lisäksi nuorilla on omia lyhennesanontoja, kuten mp (mielipide), atm (at the moment, tällä hetkellä), joista osa on lähtöisin esimerkiksi englannin kielestä.

— Pikaviestintä, some sekä vieraista kielistä poimitut vaikutteet muuttavat arkista kielenkäyttöämme, Kuparinen toteaa.

Puheentunnistus ei vielä ymmärrä murteita

Kuparista kiinnostaa tulevaisuudessa myös puhesignaaliin ja puheentunnistukseen liittyvä tutkimus. Tietotekniikan ja tekoälyn alalla kehitys on nopeaa, mutta uudet tekniikat pitäisi vielä paremmin valjastaa kielentutkimuksen käyttöön.

— Nykyisin kielentutkijat edelleen analysoivat puhetta tyypillisesti litteraateista. Puhuttu kieli muutetaan ensin kirjoitettuun muotoon, mikä on hyvin hidasta, Kuparinen kertoo.

Käytännössä puhekielen aineistojen litterointi pitää tehdä ihmisvoimin. Nykyiset kielentunnistussovellukset ymmärtävät lähinnä yleiskieltä, joten niistä ei ole juuri apua puhekieltä tai murteita tutkittaessa.

— Kiinnostaisi tutkia, miten puhesignaalia voitaisiin analysoida suoraan hyödyntämällä laskennallisia ja koneoppimispohjaisia menetelmiä.

Jos kielellisiä eroja ja muutoksia voitaisiin havaita suoraan vertailemalla äänitiedostoja, kielentukijoiden työ helpottuisi huomattavasti. Tällaisista menetelmistä olisi todennäköisesti hyötyä myös laajemmin, sillä puheentunnistusta käytetään nykyisin monissa laitteissa puhelimista autoihin.

 

Teksti: Mari Heikkilä