Sanavalinnat kertovat käyttäjästä

Päivi Julin

Päivi Julin Tietovarastosuunnittelija

Tänä syksynä Helsinki Design Weekillä järjestettiin workshop, jossa luotiin typografiaa elintarvikkeista. Keittiö oli täytetty paitsi innokkailla bloggareilla, graafikoilla ja satunnaisilla tilastotieteilijöillä, myös sateenkaarenvärisillä hedelmillä, hiutaleilla, vaahtokarkeilla… Elintarvikelista oli loputon. Käyttäen maalaislimppua, anista ja kookoshiutaleita tilastotieteilijä valmisti sanan ’bro’. Mutta mikä on yhden sanan merkitys, kun käytössämme on niin paljon dataa, että on jo varaa valita mitä analysoi? Onko siis yhdellä sanalla enää merkitystä? Voisiko yksittäisistä sanoista saada mitään mielekästä tekstianalytiikkaa?

Voi.

Sana on merkkien muodostama jono. Yksittäin esiintyvä sana on vain havainto; toistuvana se muuttuu ominaisuudeksi. Yhtäkkiä sana onkin mittava muuttuja, josta voidaan tehdä päätelmiä. Mitkä sanat toistuvat datassa? Löytyykö maneereja? Paljastavatko kirjoitusvirheet, slangi- tai murresanat kirjoittajan taustaa, kulttuuria tai alkuperää? Onko sanoilla liittymäkohtia teemoihin ja taustamuuttujiin?

Sanat kertovat myös tilanteesta ja tunnelmasta: ehkä sanavalinnat paljastavat henkilön mielentilan, kirosanat ja huudahdukset kiihtymisasteen tai harkinnan tason. Ehkä sanavarasto on leveämpi etukäteen kirjoitetussa puheessa, kun taas yllättävä tai stressaava keskustelu käydään suppeammalla perusvalikoimalla. Työhaastattelussa käytetään voimakkaampaa suodatinta ilmaisunsa kanssa, kuin ystävien kanssa juteltaessa. Ja ehkäpä erityiset sanat ovat merkki kommunikaation vastavuoroisuudesta, kun vastapuolen käyttämiä sanoja omaksutaan itselle. Yksi sana voi yhdistää tekstiin niin monta tekijää kuin asiaakin.

Käytämme sanahakua etsintään, sanakomentoja kommunikointiin käyttöliittymille ja sanaluetteloita kuvaamaan ominaisuuksia profiileissa. Yksi sana voikin merkitä enemmän, kuin sen määritelmä on sanakirjassa. Vaikka käännösohjelma ei välttämättä pysty kääntämään koko lausetta, jo yksittäisten avainsanojen kääntymisellä saa tuntuman tekstin käsittelemästä teemasta.
Käänteisesti ajateltuna jopa yhden sanan puuttuminen voi olla merkki suuremmasta. Puuttuva toivotus mailin lopussa tai tervehdys käytävällä voi kieliä energiasta; puuttuva vastaus paljastaa empimisen tai mielenkiinnonpuutteen koko asian suhteen.

tekstianalytiikkaSanana ’bro’ ei ollut myöskään tavallinen sana. Se on lyhenne sanasta brother, veli, ja siksi siihen voi merkityksensä puolesta yhdistää monta viittausta aina kunnioituksesta veljeyteen. Tai vain henkilöön, joka jakaa samat ajatukset tai tilanteen; tässä tapauksessa konkreettisesti työskentelypöydän. Sanan kielivalinta tulee käyttäjän oletusasetuksista, lyhenteen käyttö puhetavasta ja persoonasta. Vaikka sanan piti olla vain hetken mielijohde, paljastaa tarkempi analyysi sanavalinnassa olleen sittenkin voimakkaampi poiminta-algoritmi.

Lisää aiheesta:

BI-palvelut: Anlytiikkapalvelut

Blogitekstit: Analytikka

Jaa blogiteksti: