Konekääntäminen – mistä oikein on kyse?

Konekääntäminen – mistä oikein on kyse?

”Mihin me teitä tarvitaan, kun on Google-kääntäjä?” Tällaisenkin kysymyksen olen kuullut asiakkaan esittävän käännöstoimistolle. Vaikka luovalle kääntäjälle on paikkansa, on kysymyksen aihepiiri – konekääntäminen – silti käännösalalla ajankohtainen, myös Suomessa.

Julkaistu 19.11.2015

Mikä konekääntäminen?

Konekääntämisestä puhuttaessa on hyvä tarkentaa, mistä oikeasti puhutaan. Konekääntäminen ei ole sama asia kuin koneavusteinen kääntäminen, jossa käännöksen tekee aina ihminen hyödyntäen erilaisia käännöstyökaluja kuten käännösmuistiohjelmia ja termistötyökaluja. Käytännössä kaikki ammattimaisen kääntäjän tekemät käännökset tuotetaan nykyään tällä tavoin.

Kun taas napsautat Googlen hakutuloksissa ”käännä tämä sivu”, on kyse puhtaasta konekääntämisestä eli koneen tekemästä käännöksestä: konekäännin pilkkoo ensin tekstin pieniin palasiin ja yhdistelee sitten tietokannoistaan löytyvistä vastaavista suomenkielisistä tekstinpätkistä valmiin ”käännöksen”.

Konekääntämiseen liittyvää teknologiaa on monenlaista. Google hyödyntää tilastollista konekääntämistä (statistical machine translation), jossa kääntimen perustana on tietokanta tekstejä molemmilla kielillä, joista teksti tuotetaan tilastollisia algoritmejä hyödyntäen. Tilastollisiin kääntimiin voidaan myös syöttää sanalistoja ja viiteaineistoa, jotta kone oppii tuntemaan vaikkapa tietyn erikoisalan termistön ja tyylin.

Toinen eniten käytetyistä teknologioista on sääntöpohjainen konekääntäminen, jossa konekääntimen toiminta perustuu kielioppisääntöihin ja sanastoihin. Näiden avulla analysoidaan käännettävän tekstin rakenne ja tuotetaan käännös kohdekielen sääntöjen perusteella. Lisäksi on kääntimiä, joissa on pyritty yhdistämään molempien teknologioiden parhaat puolet.

Kone-kääntäjä?

Käytettävästä teknologiasta riippumatta puhtaan konekäännöksen vaihtoehtona on post-editointi (post-edited machine translation). Post-editoinnilla tarkoitetaan sitä, että ihminen muokkaa koneen tuottamaa käännöstä. Konekääntäminen onkin nykypäivänä yksi kääntäjän apuvälineistä käännösmuistien ja sanastojen lisäksi. Lopullisen käännöksen tekee aina ihminen, vaikka on käytetty konekäännöstä. Kone ikään kuin tuottaa raakakäännöksen, jonka kääntäjä muokkaa lopulliseen asuunsa. Tämä nopeuttaa kääntäjän työtä, kun yksi työvaihe jää pois tai vähintään nopeutuu laadun kuitenkaan kärsimättä.

Konekäännöksen laatu – riittävän hyvä?

Entäs konekäännöksen laatu sitten? Monesti kuulee sanottavan, että suomi on niin hankala kieli, ettei konekääntäminen toimi suomesta tai suomeen päin. Tästä todistavat lukuisat nettimeemit, joissa nauretaan huonolla suomella kirjoitetuille käyttöohjeille ja huijaussähköposteille. Nykypäivänä konekäännös toimii kuitenkin suomenkin osalta jo suhteellisen hyvin. Ei konekäännös toki vastaa laadultaan ihmisen tekemää käännöstä, mutta tekstityypistä ja käyttötarkoituksesta riippuen puhtaan konekäännöksen laatukin voi olla riittävän hyvä.

Konekäännöksen käyttäminen riippuukin käännöksen käyttötarkoituksesta ja laatuvaatimuksista. Luovia markkinointitekstejä ei välttämättä kannata kääntää koneen voimin. Jos tavoitteena on, että lukija vain ymmärtää mistä alkutekstissä puhutaan tai jos tarvitaan raakakäännös pitkästä tekstistä erittäin nopealla aikataululla, on konekäännös hyvä vaihtoehto. Tuskin autokaupastakaan ostetaan Ferrari, jos perheelle tarvitaan ”kauppakassi”.

Millaisille teksteille konekäännös soveltuu?

Kaikille teksteille konekäännös ei sovellu, mutta konekäännökseen soveltuvat hyvin esimerkiksi tekniset tekstit, kuten erilaiset käyttöohjeet. Ne sisältävät paljon toistoa ja niillä on tietty rakenne. Tekstiä voi olla paljon ja tekstejä saatetaan päivittää usein. Tällaisissa tilanteissa perinteinen ihmisen tekemä käännös saattaisi olla liian kallis tai viedä liikaa aikaa. Asiakkaalle konekäännös – post-editoinnilla tai ilman – voikin oikeassa paikassa käytettynä tuoda merkittäviä säästöjä käännöskustannuksiin.

Ja palatakseni vielä laatuun, tässäkin blogikirjoituksessa oli yksi englannista konekäännetty lause. Mahdoitkohan löytää sen?

Viimeisimmät blogipostaukset