Arkisto

Sanateknologiaa

Teknologia on arkipäivää. Emme kiinnitä sen olemassaoloon juurikaan huomiota, jos kyseessä ei ole kuljettajattomat autot tai 3D-tulostetut elimet. Pian emme kiinnitä huomiota niihinkään.

Emme mieti algoritmeja päivittäisessä elämässämme, vaikka algoritmit määrittävät, mitä uutisia luemme, mitä mainoksia näemme ja mitä hakutuloksia Google meille tarjoilee. Emme välttämättä edes ymmärrä algoritmeja.

Ja vaikka meitä kutsutaan diginatiiveiksi, ymmärrämme digiä varsin vähän.

Algoritmeja löytyy myös arkisen kielenkäyttömme takaa, kieliteknologiasta.

Kieliteknologian historian lähtökohtana pidetään konekääntämistä. Google-kääntäjän räpiköiviä suomi-englanti-käännöksiä katsoessa ei uskoisi, että kielten konekääntämistä on kehitetty 40-luvulta asti. Silloin ajateltiin, että ihmiskieli on vain monimutkainen koodikieli.

Kieliteknologia on laitteita ja sovelluksia, jotka analysoivat, muokkaavat sekä tuottavat tekstiä ja puhetta. Tietokonelingvistiikka on kielitiedettä ja tietojenkäsittelytiedettä yhdistelevä teoreettinen pohja, jota kieliteknologia soveltaa.

Aivan ensimmäiset digitaaliset sanakirjat pystyivät kääntämään vain yhden sanan kerrallaan. Kielet olivat kaksinapaisen maailmanjärjestyksen hengen mukaisesti englanti ja venäjä.

Aluksi kieliteknologiaan suhtauduttiin suurella innostuksella, mikä näin jälkeenpäin tuntuu hassulta huomioon ottaen alkukantaiset koodikielet ja koneet sekä rajoittuneen varastotilan. Yhden lauseen kääntäminen kesti parhaillakin koneilla 7 minuuttia.

60-luvulla konekäännöstutkimuksen rahoitus tyrehtyi Yhdysvalloissa, koska sitä pidettiin lyhytnäköisenä ja toivottomana. Mielenkiinto kääntyi teknologiaan, joka pystyisi vastaamaan ihmisten kysymyksiin. Yritykset fantasioivat kieli pitkällä koneista, jotka hoitaisivat yksinkertaisen asiakaspalvelun ja säästäisivät palkkakustannuksissa.

80-luvulla palattiin konekääntämisen tutkimiseen. 90-luvulla puheentunnistusta yhdistettiin kielen ymmärtämiseen. Tänä päivänä visiot puhetta ymmärtävistä asiakaspalveluroboteista ovat toteutuneet Sirin kaltaisissa virtuaaliassistenteissa.

Kiinnostus venäjän kieleen on laskenut tietokonelingvistiikan parissa siinä missä kiinnostus mandariinikiinaa ja arabiaa kohtaan on noussut. Suomi on pieni kieli ja suomalaiset puhuvat verrattain hyvin englantia, joten suomen konekäännöksen kehittämiselle ei ole samanlaista tarvetta kuin suurempien maailmankielien. Vain tuplasti puhutumpaa ruotsia on helpompi kääntää englanniksi, sillä kielet ovat huomattavasti lähempänä toisiaan. Huolimatta siitä, että Google-kääntäjä on meille tunnetuin kääntäjäkone, on kehittyneempiäkin, maksullisia käännösohjelmia olemassa.

Jo nyt on teknologiaa, joka helpottaa kääntäjien työtä, mutta kääntävätkö jonain päivänä koneet tv-sarjojen tekstitykset ja romaanit? Vaikka teknologia kehittyisi, voiko se koskaan tunnistaa kielestä kulttuurisia eroja ja vivahteita? Vai lisääntyvätkö suorat käännökset ja anglismit, tehdä kavereita ja kirjoittaa alas?

Verkossa käytävät keskustelut loivat kirjoitetun puhekielen. Nyt käymme leijonanosan keskusteluistamme verkossa. Vaikka kotimaisten kielten keskus kuinka yrittää, verkon uussanat eivät taivu näppäimistöllämme meitsieksi ja risuaidaksi.

Konekäännöksien lisäksi kieliteknologialle on tyypillistä kielen korjaaminen. Oikeinkirjoituksen tarkistus tekee virheettömien esseiden ja työhakemusten kirjoittamisesta vaivattomampaa. Kirjoitusvirheiden suhteen ei tarvitse olla jämäkkä, kun tietää Wordin lisäävän sinistä tai vaaleanpunaista siksakia lipsahdusten alle.

Ennakoiva tekstinsyöttö auttaa valinnoissamme tekstiviestejä kirjoittaessamme ja hakiessamme sisältöä esimerkiksi Googlesta ja YouTubesta. Sanoja ei tarvitse kirjoittaa loppuun asti, kun meille jo ehdotetaan mitä olimme ajattelemassa. Onko mahdollista, että ennakoiva tekstinsyöttö vaikuttaa hakukomentoihimme, ja lopulta haemme kaikki samoja sisältöjä?

Kieliteknologiaa tarvitaan sekä eri äidinkieltä puhuvien ihmisten väliseen viestintään sekä konekäännösten tapauksessa että ihmisten ja koneiden väliseen kommunikaatioon. Koneet eivät ymmärrä ihmiskieliä, ja konekielet ovat vaikeita opetella.

Tulevaisuudessa yksi kiinnostavimpia kieliteknologian sovelluksia on tekoälytutkimus. Tekoäly itsessään on kieliteknologiaa suurempi ja monimutkaisempi tutkimuksenala, mutta kieliteknologia on olennainen osa sitä.

Maaliskuussa Microsoft joutui sulkemaan tekoälyprojektinsa nimeltä Tay. Oltuaan alle 24 tuntia Twitterissä, ihmiskontaktia varten kehitetty Tay oli muuttunut ”niin metsä vastaa kuin sinne huudetaan” -tyyppisestä robotti-papukaijasta aggressiiviseksi sovinistiksi ja rasistiksi, joka kielsi holokaustin ja toivoi feministien kuolevan helvetin liekeissä.

Microsoft kertoi Tayn olevan paitsi tekninen, myös kulttuurinen ja sosiaalinen koe. Tay oli ikään kuin peili, joka oppi lukemalla muiden ihmisten twiittejä, eikä sen peilikuva Internetistä ja ihmiskunnasta ollut kovin mairitteleva.

Arkisto

Tahdotko nähdä sinistä?

Kuinka vaikeaa on erottaa sininen ja vihreä toisistaan? Sehän on helppoa. Vai onko?

TEKSTI Erik Räsänen

Namibialaisheimo, jonka kielessä ei ole jaottelua siniseen ja vihreään, asetettiin tekemään yksinkertaista testiä: tietokoneen ruudulle ilmestyi kaksitoista neliötä, joista yksitoista oli vihreitä ja yksi sininen. Tehtävä oli etsiä sininen. Testi olisi esimerkiksi meille suomalaisille naurettavan helppo, mutta heimolaisille se tuotti vaikeuksia: sinisen neliön löytämisessä kesti kauan ja virheitä tapahtui yllättävän paljon.

Sininen väri tarjoaa kiinnostavan näkökulman kielen vaikutuksesta ajatteluun. Kieli kehittyy usein erotellen alkuun tumman ja vaalean, sitten nimeten punaisen, keltaisen ja lopulta vihreän. Sininen käsitetään vihreän sävynä, kuten namibialaisheimon tapauksessa, kunnes kielen kehittyessä se eroaa omaksi värikseen.
Antiikin ajan klassikkoeepos Odysseiassa merta kuvaillaan viinintumman väriseksi, ja muissakin aikalaiskuvauksissa taivasta ja merta kuvaillaan yhtä mielenkiintoisilla ilmaisuilla. Oudosti yksikään antiikinaikainen teos ei kuvaile näitä sinen symboleja sinisiksi.
Nykyaikana itsestäänselvyydeltä tuntuva värikartta on yllättävän tuore – esimerkiksi japanin kieleen vihreän ja sinisen erottelu saapui toisen maailmansodan jälkeen länsimaiden vaikutuksesta. Ihmissilmä on nähnyt sinistä kautta aikain, mutta sitä ei ole osattu aina havaita. Vasta kieli on tehnyt sinisestä helposti tunnistettavan: sille on annettu nimi.

Kielen vaikutuksesta ajatteluun on toistaiseksi olemassa valitettavan vähän tutkimusta. Toistaiseksi ilmaan on kuitenkin heitetty joitain ajatuksia. Väitetään, että saksan ja espanjan kaltaisissa kielissä, joissa sanat voivat olla maskuliinisia, feminiinisiä tai neutraaleja, esiintyy enemmän sukupuolisyrjintää. Ihmiset, joiden äidinkielessä ei ole futuuri-muotoa, väitetään sijoittavan rahojaan hanakammin, koska kieli ei tee selkeää erottelua nykyhetkeen ja kaukaiseen tulevaisuuteen. Aika näyttäytyy aikajanan sijasta enemmänkin ympyrämäisenä, jolloin sijoitus kannattaa tehdä heti, sillä tulevaisuus on nyt.
Väitteissä on spekuloivia piirteitä, mutta ne herättävät ajatuksia. Voiko esimerkiksi Suomen edelläkävijäasemaa sukupuolten välisen tasa-arvon toteuttajana selittää se, ettei kielessämme ole erillistä hän-pronominia miehille tai naisille?

Yksilön kielitaidon kehittyessä myös kyky ajatella kehittyy: yliopisto-opiskelijan olisi vaikea käsitteistää oppimaansa samalla sanavarastolla kuin seitsemänvuotiaana. Kieli jäsentää ajattelua, se toimii työkaluna maailman ymmärtämiseen.
Eläinten parissa kasvaneet susilapset ovat ääriesimerkki siitä, millaista elämä on ilman äidinkieltä: ihmisten keskelle myöhemmin päätyneet villilapset ovat oppineet parhaimmillaankin vain muutaman sataa sanaa, eikä kommunikointi toisten ihmisten kanssa tahdo onnistua. Äidinkielettömälle on mahdotonta – tai ainakin hyvin vaikeaa – selittää, mitä ovat ironia, aurinkokunta tai ihmisoikeusongelmat.

Äidinkielen osaaminen on laskussa. Nykynuoret lukevat entistä vähemmän. Vaikka Suomi on edelleen Euroopan kärkeä Pisa-testeissä, on peruskoululaisten kyky ymmärtää luettua heikentynyt. Äidinkielen ylioppilastutkinnon vaatimuksia on jouduttu höllentämään, ja jopa yliopistomaailmassa nuorten kielitaidon rapautuminen huolestuttaa. Hektisessä kosketusnäyttömaailmassa ei ole aikaa lukea tai kehittää kieltään. Koska kieli avartaa maailmaa, kehitys on surullista – aivan kuin meillä ei olisi enää aikaa nähdä sinistä.

Silloin maailma alkaa näyttää valitettavan harmaalta.

Arkisto

Saarna, jota ei tule siteerata

”Ainoastaan lahjakas ihminen pystyy kirjoittamaan hyvän lauseen.” Näin laukoi Elinkeinoelämän valtuuskunnan johtaja Matti Apunen jossain seläntaputteluseminaarissa muutama vuosi sitten. Perään hän uhosi lukeneensa monta ”niin sanotusti hyvää romaania, jossa ei ole ollut yhtään hyvää lausetta.”

TEKSTI Juho Valta

Mutta millainen on hyvä lause tänä päivänä? Mitä ylipäätänsä tarkoittaa olla hyvä kielenkäyttäjä?

Instagram-profiileille, twitterdebaateille, vaaliteeseille, motivaatiopuhujille, massaelokuville ja mainoksille jatkuvasti altistuvan sukupolven pitäisi osata vastata näihin kysymyksiin vaivattomasti.

Modernissa maailmassa hyvä lause on asioita yksinkertaistava, paatoksella pumpattu mukaviisaus, jonka voi vaivatta lätkäistä villapaidan etumukseen. Se on helposti siteerattavissa oleva naseva mantra, joka tuo turvaa ja toivoa arjen absurdien ongelmien keskellä. Sitä ei tarvitse lukea tai kuulla kuin kertaalleen, koska se ei halua aiheuttaa kenellekään päänvaivaa.

Hyvä lause on valmiiksi pureskeltu rihkama-aforismi, joka pystyy hetkeksi järjestämään mieliemme kaaosta. Se on yleispätevyys, jonka pitää kyetä lumoamaan kaikki aina kulmabaarin kolmen promillen lärveistä kärsivästä elämänkoululaisesta kauppiksen tulevaan kaverikapitalistiin. Se pärjää omillaan ja on vapaa kontekstin kahleista. Sen korkein tavoite on helppoja vastauksia havittelevan vastaanottajan irstas virnistys.

Mitä jos lakkaisimme jahtaamasta lyömättömiä sananlaskuja ja alkaisimme sen sijaan harjoittamaan pitkämuotoisempaa ja enemmän pitkäjänteisyyttä vastaanottajalta vaativaa kielellistä ilmaisua? On suuruudenhullua ajatella, että maailman kompleksisuus olisi kompressoitavissa pikkunokkelaan iskulauseeseen. Se on moraaliton akti, koska se pyrkii tekemään totuudesta pikaruokaa.

Näitä totuuden pikaruokaravintoloitsijoita valtaosa aikamme kielitaitureista on. Jopa Groteskin tämän numeron kansikuvapoika, kiistatta lahjakas ja rohkeasti musiikkigenrensä konventioille keskisormea näyttävä Paperi T, paljastaa tavoittelevansa täydellistä one-lineria.

Tämä on sääli, sillä kiinnostavimmat tekstit ovat niitä, jotka on kohdattava nimenomaan kokonaisuutena. Niiden läpi ei kulje mitään teoksen sanoman kiteyttävistä pääkohdista koostuvaa oikotietä, jollaisen Paavo Väyrynen valehteli löytäneensä aikoinaan Dostojevskin tuotannosta. Ne eivät alistu tulemaan silmäillyksi tai selatuksi. Marcel Proust on juuri siksi historian parhaita kirjailijoita, ettei yksikään hänen teoksistaan spoilaannu Wikipediassa.

Amerikassa ihmisten pakkomielle iskeviin heittohaikuihin on mennyt niin pitkälle, että ensimmäinen asia, jonka CNN postittaa presidentinvaalidebaatin jälkeen YouTubeen on kokoelma illan sanasodan sukkelimmista letkautuksista. Debaatin voittajaksi julistetaan se, kuka roastaa rankimmin. Ja sitten surkutellaan, että miksei kenelläkään ole mitään vitun hajua siitä, millaisen terveydenhuoltojärjestelmän Donald Trump kyhäisi virkaan astuttuaan. 86-vuotias Jürgen Habermas harjoittelee jo pyörimistä siinä haudassa, johon hän on pian menevä.

Arvotamme tiedostamattamme kielenkäyttäjän taidot sen mukaan, kuinka kykeneväinen hän on manipuloimaan meitä. Aikamme sanasepot eivät haasta tai hajota, he vain hallitsevat huvittamalla.
Haluamme oraattoreita, joilla on viekas kyky saada meidät kokemaan ensirakkauden tunne antiikkisten ajatustemme kanssa. Haluamme kielenkäyttäjiä, joiden tosiasiassa konventioita vaalivat korulauseet löyhkäävät tuoreilta ideoilta.

Vuoden ensimmäisessä Groteskissa Jussi Parviainen totesi suomalaisen taiteen tulevaisuuden piilevän Jouko Turkassa. Ehkä Turkan opeista on louhittavissa ratkaisu tähänkin ongelmaan. Hänen 90-luvulla lähetetty televisiosarjansa Kiimaiset poliisit julkaistiin tänä keväänä DVD:nä. Aikoinaan Turkka julisti kohua herättäneen sarjan olevan rangaistus Suomen kansalle ulkomaalaisten poliisisarjojen palvonnasta.

Tätä eettisempää lausuntoa ei modernissa maailmassa taiteilija tai kukaan muukaan tekstintuottaja voi antaa. Hyvä kielenkäyttäjä rankaisee älyllisestä laiskuudesta ja vallitseviin ajattelumallien mukautumisesta. Hän rakastaa lukijaansa tai kuulijaansa vihan huudoin. Hän ei palvele viestin vastaanottajaa, mutta ymmärtää vastaanottajan olevan silti kiinnostavin asia kaikissa teksteissä, sillä luovuus voi levitä ainoastaan sen ajatusten kaaoksen kautta, jota teksti parhaimmillaan vastaanottajan mielessä synnyttää. Ja ilman luovuutta ihmisellä ei ole tulevaisuutta.

Arvoisa lukija, olet varmaan jo huomannut, että kaikkien pappien tavoin olen tekopyhä ja itsekin syntinen. Tämän vuoksi näenkin sopivana, että päätän saarnani hyvään lauseeseen, jonka tunnustan olevan mukaelma erään suuren valtiomiehen sanallisen arkun aarteista. Hyvä työ luo työtä.

Arkisto

Minä olen minä vain suomen kielellä

Missään ei ole kauempana kotoa kuin siellä, missä yhteistä kieltä ympäristön kanssa ei ole.

TEKSTI Roosa Kontiokari

Sanotaan, että jos kieli kuolee, kuolee myös sitä puhuva yhteisö. Kieli onkin ihmisille enemmän kuin pelkkää viestinnän apuväline: se on yksilöt yhteen sitova yhteinen koodi, joka auttaa ymmärtämään maailmaa, luomaan merkityksiä ja rakentamaan omaa identiteettiä.

Kysymys kuuluukin: mitä minusta jää jäljelle, jos äidinkieleni yhtäkkiä muuttuu käyttökelvottomaksi?

Sitä yritin selvittää menemällä jonnekin, missä puhuttua kieltä en ymmärrä.

Joulukuu 2014. Kevytmoottoripyörä kapuaa määrätietoisesti kolisten hiekkatietä Kathmandusta kohti Kaaulea, pientä vuoristokylää Langtangin juurella. Matkaa on noin sata kilometriä, mutta Nepalin surullisenkuuluisa tieverkosto venyttää keston lähemmäs neljää tuntia. Matkantekoa pitkittää myös kuskina toimiva ystäväni: säännöllisin väliajoin hän hidastaa tervehtiäkseen milloin ohikulkevaa maanviljelijää, milloin vastaantulevaa bussikuskia. Nepalinkielinen keskustelu on soljuu korvissani sutjakkaana, mutta hatara kielitaitoni riittää vain suurten linjojen ja yksittäisten sanojen ymmärtämiseen. Hei, hyvää kuuluu, töitä riittää, maanvyörymä, pitää mennä, nähdään ylihuomenna. Nopeat sananvaihdot ovat ohitse ennen kuin ehdin edes harkita mukaan liittymistä.
Lopulta ystäväni vetää hengityssuojan tiiviisti kasvojensa suojaksi. Maskin takaa paistaa kuitenkin virnistys. ”Etteivät kaikki tunnistaisi minua. Muuten ei olla ikinä perillä.”

Neljän tunnin ajon ja kahden tunnin kävelyn kuluttua saavumme suuren savitalon pihaan. Meitä vastassa odottaa ystäväni perhe: äiti, veli, veljen vaimo ja kaksi pientä lasta. He tervehtivät minua ja minä heitä. Minulle tarjoillaan kupillinen teetä ja paahdettua maissia, joista kiitän. Sen illan kommunikaatio jää siihen.

Seuraavana päivänä istun taloa kiertävällä tiiliaidalla. En ole puhunut mitään kahdeksaan tuntiin. Luen puhelimestani tekstiviestejä, joita olen lähettänyt viisi kuukautta sitten: tutut sanat kuulostavat vierailta, kuin jonkun muun kirjoittamilta. Talon sisällä perhe laittaa ruokaa ja juttelee tamangiksi, omalla äidinkielellään, jota en ymmärrä sanaakaan.

Viimein perheen veli tulee ulos ja ohjaa minut sisälle syömään.
”Voit puhua heille nepalia”, hän ohjeistaa murretulla englannilla, ”sitä he ymmärtävät.”

Istuudun syömään. Perheen äiti kysyy minulta jotain nepaliksi.
En ymmärrä.
Äiti toistaa.
Nyt ymmärrän sanat sinä, riisi, maistua ja miltä. Miltä ruoka maistuu, sitä hänen on täytynyt
kysyä.

Jos voisin puhua suomea, sanoisin tarjotun aterian peittoavan mennen tullen kotopuolen pohjaanpalaneet keittiökatastrofini, utelisin ehkä myös salaisia ainesosia reseptin takana. Mutta en voi.

”Tämä ruoka…on minulle hyvää. Tämä peruna on hyvä”, takeltelen sen sijaan. Kakistamani persoonaton töksäytys on valovuosien päässä kieliopillisesti oikeasta nepalista, mutta ehkä ydinviesti meni läpi. Äiti hymyilee kiusaantuneena.

Maistan ruokaa uudestaan huomatakseni, ettei siinä edes ole perunaa.

Ja niin, hiljaisessa Kaaulen kylässä Baabelin tornini saavuttaa lakipisteensä ja romahtaa korkeuksistaan eteeni läpitunkemattomaksi muuriksi. Minusta tulee yhtä aikaa sekä sokea että näkymätön: en osaa kommunikoida, eivätkä muut näe minusta kuin persoonattoman kuoren vailla sisältöä.

Persoonallisuuteni on kadoksissa, muttei kuollut. Se suomenkielinen minäni viruu ehkä kielimuurin takana käyttökelvottomana, koska se on koodattu ympäristölleni vieraalla kielellä, mutta se on yhä olemassa. Kun käännöksessä hukkaa sekä itsensä että ympäristönsä, tuntuisi toki helpolta vain puristaa silmät kiinni ja odottaa, että kaikki olisi ohi.

Huomattavasti parempi vaihtoehto on kuitenkin yrittää murtaa kielimuuri ja rakentaa sen palasista uusi identiteetti. Se ei tarkoita vanhan ja tutun identiteetin hylkäämistä ja muuttumista joksikin, mitä ei oikeasti ole: olen Nepalissa, mutta en ole nepalilainen, eikä minusta koskaan tule nepalilaista. Olen suomalainen, joka pitää kääntää uudelle kielelle. Uusi identiteetti heijastelee uutta ympäristöä ja on kielensä näköinen, mutta silti originaalille uskollinen.

Aika ottaa katsaus alkuperäisteokseen. Mitä suomalainen minäni tekisi tässä tilanteessa?

Varmaan naureskelisi, että näköjään biologiasta voi kirjoittaa laudaturin, vaikka perusjuuresten identifiointi on ihan retuperällä. Siihen nepalin sanavarastoni ei vielä ihan riitä, mutta onneksi aina voi nauraa itselleen. Ja niin teenkin. Nauru tarttuu, tunnelma keittiössä kevenee, ja muuri on yhden tiilen kevyempi.

Arkisto

Rajaa jo

Yksi rasittavimmista ja eniten väärinymmärretyistä filosofisista anekdooteista on tämä Ludwig Wittgensteinin lause:

“Kieleni rajat ovat maailmani rajat.”

Ottamalla silmän kauniiseen käteen kuka tahansa voi nähdä, että maailma jatkuu oman kielen (lat. glossa) ulkopuolella.

Se, onko maailmaa rajattomasti kielen ulkopuolella, on eri kysymys. Yksi rajan määritelmä on kahden erillisen kokonaisuuden välinen yhtymäkohta. Jos maailmankaikkeus on loputon, se on vain yksi kokonaisuus. Jos se on kokonaisuus, sillä on määritelmällisesti raja. Mitä sen jälkeen tulee?

Kuten arvoisa lukija huomaa, rajaaminen on yksi journalistin vaikeimmista tehtävistä. Ylitin aihe-alueeni ja osaamiseni rajat jo ensimmäisessä lauseessa. Tämä lause venyttää lähinnä annetun merkkimäärän rajoja.


Kielen päällä –kirjoituksissa tarkastellaan kunkin numeron teemaa kielen näkökulmasta.