Viimaste aastate jooksul on tehnoloogia areng muutnud pöördumatult viisi, kuidas me keeli mõistame ja tõlgime. Soome ja Eesti, olles naaberriigid ning jagades sarnast keelepuud, on tihedas majanduslikus ja kultuurilises läbikäimises, mis tähendab igapäevaselt tuhandete dokumentide, e-kirjade ja veebilehtede tõlkimist. Kui veel kümnend tagasi oli masintõlge pigem naljanumber, mis pakkus humoorikaid ja arusaamatuid lausekonstruktsioone, siis tänapäevased neurovõrkudel põhinevad lahendused nagu DeepL, Google Translate ja hiljuti areenile ilmunud suured keelemeudelid (nt ChatGPT) on tõstnud lati uskumatult kõrgele. Kuid kas tehisintellekt on tõesti valmis asendama professionaalset inimtõlkijat, eriti nii nüansirohkes keelepaaris nagu soome-eesti? Otsustasime vaadata fassaadi taha ja analüüsida, kus jookseb piir tehnoloogilise mugavuse ja keelelise täpsuse vahel.
Miks on soome-eesti tõlge masinale keerulisem kui inglise-hispaania?
Esmapilgul võib tunduda, et kuna eesti ja soome keel kuuluvad samasse soome-ugri keelkonda, peaks masinal olema neid lihtne teineteiseks ümber panna. Reaalsus on aga mõnevõrra keerulisem. Kuigi grammatiline struktuur on sarnane, on mõlemad keeled aglutineerivad ehk sõnadele liidetakse tohutul hulgal muutelõppe, tunnuseid ja liiteid. See tähendab, et ühe sõna käänamisel võib tekkida sadu erinevaid vorme.
Inglise keelel põhinevad tõlkemootorid õpivad sageli inglise keele kaudu (nn vahekeele meetod), mis tekitab soome-eesti suunal kadusid. Masin peab esmalt mõistma soomekeelse lause konteksti, tõlkima selle oma “sisemisse loogikasse” ja seejärel väljastama eestikeelse vaste. Siin tekivadki peamised komistuskivid:
- Käänete rohkus: Eestikeelsed 14 käänet ei kattu alati soomekeelsete käänetega üks-ühele. Masin eksib sageli just sihitise käänete (partitiiv vs. genitiiv) määramisega.
- Sõnajärg: Mõlemas keeles on sõnajärg suhteliselt vaba, kuid rõhuasetuse muutmiseks kasutab inimene spetsiifilist järjestust, mida masin ei pruugi tajuda, muutes lause tuimaks või kohmakaks.
- Kontekstitundlikkus: Soome keel on sageli kaudsem ja viisakam, eesti keel konkreetsem. Otsetõlge võib muuta eestikeelse teksti liiga “ümmarguseks” või vastupidi, soomekeelse originaali nüansid lähevad kaduma.
Testi tulemused: Kus tehisintellekt põrus ja kus üllatas?
Analüüsisime erinevaid tekstitüüpe, et mõista masintõlke tegelikku võimekust. Tulemused jagunesid selgelt vastavalt teksti keerukusele ja eesmärgile.
1. Tehnilised juhendid ja tootekirjeldused
Siin tegi tehisintellekt üllatavalt head tööd. Kuna tehniline keel on standardiseeritud ja laused on reeglina lühikesed ning konkreetsed, suutsid parimad tõlkemootorid anda edasi täpse info. Siiski esines probleeme spetsiifilise terminoloogiaga. Näiteks sõna “pultti” tõlgiti kohati valesti, sõltuvalt sellest, kas tegemist oli ehitus- või elektroonikatekstiga.
2. Turundus ja loovtekstid
See on valdkond, kus masin jäi inimesele selgelt alla. Turundustekstide eesmärk ei ole mitte ainult info edastamine, vaid emotsiooni tekitamine ja lugeja veenmine. Masintõlge tootis sageli “puist” keelt, mis oli grammatiliselt korrektne, kuid stiililiselt elutu. Kaduma läksid sõnamängud ja kultuurilised viited. Soomekeelsed idioomid tõlgiti tihti sõna-sõnalt, mis muutis eestikeelse tulemuse naeruväärseks või arusaamatuks.
3. Juriidilised tekstid ja lepingud
Kõige ohtlikum tsoon. Juriidikas võib üks vale kääne või valesti valitud vaste muuta lepingu sisu täielikult. Testisime lihtsamaid lepingupunkte ja märkasime, et kuigi üldine mõte anti edasi, eksis masin juriidiliste terminite täpsuses. Soome “hallitus” võib tähendada nii valitsust kui ka ettevõtte juhatust. Valesti tõlgituna võib see tekitada tõsiseid juriidilisi tagajärgi.
“Valesõbrad” – Masintõlke suurim lõks
Üks huvitavamaid aspekte soome-eesti masintõlke juures on nn “valesõbrad” (false friends) – sõnad, mis kirjapildilt või kõlalt on sarnased, kuid tähenduselt täiesti erinevad. Kuigi tipptasemel AI peaks suutma konteksti lugeda, näitas meie test, et keerulisemates lausetes komistavad masinad endiselt nende otsa.
Mõned klassikalised näited, millega masinad aeg-ajalt hätta jäävad:
- Hallitus: Soome keeles ‘valitsus’ või ‘juhatus’, eesti keeles ‘seenetanud kord’. On suur vahe, kas riiki juhib valitsus või hallitus.
- Koristaa: Soome keeles ‘kaunistama’, eesti keeles sarnaneb sõnaga ‘koristama’ (puhastama). AI võib sisekujunduse teksti muuta koristusjuhendiks.
- Pulma: Soome keeles ‘probleem’ või ‘mure’, eesti keeles seostub abielu ja peoga. Lause “Minulla on pulma” tõlkimine kui “Mul on pulmad” on konteksti arvestamata suur viga.
Masintõlke järeltoimetamine (MTPE) – uus normaalsus
Arvestades testi tulemusi, on tõlketööstuses kanda kinnitanud uus teenus: masintõlke järeltoimetamine (Machine Translation Post-Editing). See on protsess, kus tehisintellekt teeb “musta töö” ehk toortõlke, ja inimtõlkija, kes valdab mõlemat keelt emakeele tasemel, toimetab teksti ladusaks ja terminoloogiliselt täpseks.
See meetod on eriti efektiivne suurte andmemahtude puhul, näiteks e-poodide tootekataloogid või tehnilised manuaalid. Siiski on oluline mõista, et järeltoimetamine ei ole alati kiirem ega odavam kui nullist tõlkimine. Kui masina toodang on ebakvaliteetne (näiteks liiga keerulise algteksti puhul), kulub toimetajal vigade parandamisele rohkem aega kui ise uuesti tõlkides.
Korduma kippuvad küsimused
Kas Google Translate on piisav ametlike dokumentide tõlkimiseks?
Ei ole soovitatav. Kuigi Google Translate on aastatega paranenud, ei taga see juriidilist täpsust ega konfidentsiaalsust. Ametlike dokumentide, lepingute või meditsiiniliste tekstide puhul tuleks alati kasutada vannutatud tõlki või professionaalset tõlkebürood, et vältida kulukaid vigu.
Milline tõlkemootor on soome-eesti suunal parim?
Hetkel näitavad testid, et DeepL suudab sageli pakkuda loomulikumat ja grammatiliselt täpsemat teksti kui Google Translate. Samuti on suured keelemudelid nagu GPT-4 võimelised paremini mõistma konteksti ja stiili, kuid neil on kalduvus “hallutsinatsioonidele” ehk info väljamõtlemisele.
Kas masintõlge asendab kunagi täielikult inimtõlkijat?
Rutiinsete ja lihtsakoeliste tekstide puhul on see juba suuresti juhtunud. Siiski, tekstide puhul, mis nõuavad kultuurilist tunnetust, emotsiooni, loomingulisust või ülimat juriidilist täpsust, jääb inimese roll asendamatuks veel pikaks ajaks. Inimene suudab lugeda ridade vahelt, masin loeb ainult ridu.
Miks tõlgib masin vahel nimesid või aadresse?
See on masinõppe eripära. Kui algoritm “arvab”, et tegemist on tõlgitava sõnaga, mitte nimega, võib ta selle eestindada. Soome-eesti suunal on see tavaline, kuna paljud nimed omavad ka sõnalist tähendust (nt perekonnanimi “Mägi” või tänavanimi “Sadama”). Inimtõlkija teab instinktiivselt, millal nimi jätta muutmata.
Strateegiline lähenemine tõlketehnoloogiale
Tehisintellekti ja masintõlke kasutamine ei ole enam valiku küsimus, vaid oskus, mida tuleb rakendada targalt. Ettevõtjatele ja eraisikutele, kes vajavad soome-eesti tõlget, on võtmesõnaks riskide maandamine ja eesmärgi teadvustamine. Kui vajate kiiret arusaamist saabunud e-kirjast, on masin asendamatu abimees. Kui aga plaanite siseneda Soome turule uue tootega või allkirjastada koostöölepingut, on investeering professionaalsesse inimtõlkesse või põhjalikku järeltoimetamisse kriitilise tähtsusega.
Parima tulemuse saavutamiseks tasub kombineerida masina kiirust ja inimese taiplikkust. Enne tõlke usaldamist masinale veenduge, et algtekst oleks võimalikult selge, lihtne ja vaba keerulistest metafooridest. Mida üheselt mõistetavam on sisend, seda kvaliteetsem on väljund. Lõppkokkuvõttes ei ole küsimus selles, kas masin võidab inimest, vaid selles, kuidas inimene suudab masinat enda kasuks kõige efektiivsemalt tööle panna.
