A neurális gépi fordítás (Neural Machine Translation, NMT) egyértelműen 2017 legdivatosabb kifejezése lett a fordítóipar különböző szereplői – szabadúszók, fordítóirodák, fordításokat beszerző cégek – és mindenekelőtt a számítógépes nyelvészettel foglalkozók körében.
Ez a blogbejegyzés egy gyors áttekintést kíván adni az NMT mai állásáról azoknak, akik még csak ismerkednek a témával, illetve szeretnék megérteni ennek az új technológiának a jelentőségét. Arról is szó lesz röviden, hogy kell-e rettegniük a fordítóknak, azaz felválthatja-e az emberi fordítást a gépi, és ha igen, mikor és hogyan?
De mielőtt eljutnánk ehhez a vissza-visszatérő nyelvfilozófiai kérdéshez, kezdjük egy kis történelmi áttekintéssel és helyzetfelméréssel.
Hogy működött eddig a gépi fordítás?
Az NMT-t megelőző időszakban is többféle gépi fordítási modell létezett, például a szabályalapú, amely nyelvtani szabályok és egy szótár segítségével igyekezte reprodukálni az eredeti szöveget a célnyelven.
Hasonlóan működött az ún. példaalapú gépi fordítás, amely már meglévő fordítások alapján logikai lépésekkel következtette ki az egyes szavak és kifejezések célnyelvi megfelelőjét (pl. Ha az „I drink” magyarul „Iszom”, az „I don’t drink” pedig „Nem iszom”, akkor a „don’t” fordítása minden bizonnyal „nem”).
Mindkét modellnek megvoltak a maga előnyei – és persze a korlátai is. A 2000-es években pedig mindkettőt felváltotta a statisztikai gépi fordítás (SMT), amely óriási meglévő korpuszok (kétnyelvű és egynyelvű szövegek) segítségével, előfordulási statisztikák alapján próbálta kikövetkeztetni a szavak és szókapcsolatok helyes fordítását.
A Google Translate egészen 2017 elejéig minden nyelvpárban statisztikai gépi fordítást használt (habár bizonyos ritkább nyelvpárokban a kétnyelvű korpuszok híján egy köztes angol fordításra is sor került).
Mindhárom fent leírt modell (és az ötvözésükből készült többféle hibrid megoldás is) több sebből vérzik: amellett, hogy nyelvtanilag sokszor helytelen mondatokat produkál, egyrészt az árnyaltabb jelentéseket nem képes „megérteni”, visszaadni, minden terminusnak a legalapvetőbb vagy legnépszerűbb jelentését fogja előnyben részesíteni. Másrészt – és ez még nagyobb akadály a tökéletesítésben – a szövegkörnyezetet és a témakört ignorálja.
Bár a fordítómotort lehet „tanítani”, témakörökre specializálni, finomhangolni, de alapvetően mindegyik modell szegmenseket (mondatokat) fordít, és az előttük lévő vagy az őket követő mondatok nem tudnak hatással lenni a fordításra. Sőt, szegmensen belül is tovább szegmentál (kissé leegyszerűsítve: a lehető leghosszabb egyező mondatrészt keresi, ami már megvan a korpuszban), és ezen mondatrészek fordításai sincsenek hatással egymásra.
Laikusoknak sem kell magyarázni, hogy miért óriási hátrány ez egy összefüggő, folyó szöveg fordításánál. Az SMT sokak szerint elérte teljesítőképessége határát, és finomhangolás nélkül (amely persze jelentős idő- és pénzráfordítást is igényel) már nem képes szignifikáns javulásra.
Hogyan működik és miért népszerű a neurális gépi fordítás?
A tavalyi év nagy bejelentése a Google részéről az volt, hogy tesztjeik alapján bizonyos környezetekben, bizonyos nyelvpárokban és bizonyos szövegtípusokon az NMT majdnem olyan jó minőséget tud produkálni, mint az emberi fordítók. Számokban kifejezve: egyes izolált esetekben akár 60%-kal kevesebb hibát vétett a korábbi modellekhez képest.
Hiába az óvatos fogalmazás, erre felkapta fejét az egész világ, és a fordítóiparon kívüli média (pl. az Economist) és más óriáscégek (pl. Facebook) is aktívan foglalkozni kezdtek a témával, illetve szinte heti szinten jönnek a hírek arról (e héten például az Amazontól), hogy a gépi fordítással foglalkozó nagy cégek átállnak a neurális modellre.
Oka lehet ennek a Google bejelentése mellett az is, hogy az NMT egy teljesen új, mondhatni gyerekcipőben járó technológia, egy új megközelítés, amely előtt számos lehetőség áll, és mégis megközelíti vagy meghaladja a korábbi modellek minőségét (szövegtípustól függően).
A mesterséges intelligencia kutatásával kéz a kézben járó NMT az első olyan modell, amely az emberi gondolkodást olyan szinten próbálja imitálni, hogy gyakorlatilag teljesen elrugaszkodik a forrásszöveg szórendjétől és strukturális kötöttségeitől – mindemellett figyelembe veszi a szövegkörnyezetet is.
Anélkül, hogy a részletekbe és a számítógépes nyelvészet mélyebb bugyraiba beleásnánk, körülbelül úgy lehet megmagyarázni a folyamatot, hogy a gép gyakorlatilag megpróbálja leképezni a forrásszöveg jelentését egy nyelvtől független szinten, majd ezt a szintet „újrafogalmazza” a célnyelven.
Sokkal kevésbé kötődik szószinten és strukturálisan a forrásszöveghez, és éppen ezért sokkal kevesebb szórendi és ragozási/egyeztetési hibát vét, mint például a statisztikai gépi fordítás.
Megszokott és újszerű kihívások
Az NMT, bármennyire népszerű, szinte már körberajongott megoldás, azért nem szabad elfelejteni, hogy a gépi fordítás egyik szakértőjének, John Tinsley-nek a londoni SlatorCon konferencián használt szavaival élve „végső soron csak a gépi fordítás egy újabb fajtája”.
Téves lenne tehát azt gondolni, hogy a korábbi gépi fordítási modellek összes hibáját kiköszörüli, és minden téren tökéletes fordításokat fog produkálni.
Bár a fejlesztése még korai szakaszban van, már most kirajzolódik, hogy az NMT-nek is meggyűlik a baja a hosszabb mondatokkal, és inkább rövid szegmenseken igazán hatékony.
Ez egyébként a korábbi modelleknél is szokásosnak nevezhető probléma volt, főleg a magyarhoz hasonló nyelveknél.
Továbbá bármennyire is gördülékeny, természetesen hangzó mondatokat produkál néha a neurális modell, könnyen becsaphatja az embert, ugyanis képes kihagyni szavakat, szókapcsolatokat vagy akár teljes mondatrészeket is (ami viszont az eddigi modellekre kevésbé volt jellemző).
Az eddigi tapasztalatok alapján az agglutináló nyelvek ugyanúgy nehezebben dolgozhatók fel vele, mint a szegmentáltabb latin és germán nyelvek. A hibák javítását pedig lassítja, hogy sokkal mélyebben kell leásni a programba ahhoz, hogy megállapítsuk egy adott fordítási hiba okát, és nem is biztos, hogy megéri az erőfeszítést.
Végül pedig a gépigényt kell megemlítenünk: jelenleg csak a legnagyobb cégek, illetve az NMT fejlesztésére külön költségvetéssel rendelkező szervezetek engedhetik meg maguknak az üzemeltetéshez szükséges géppark és neurális hálózatok fenntartását.

Mire számítsunk a jövőben?
A közeljövőben inkább a kutatás és a fejlesztés terén számíthatunk előrelépésre, a fordítócégek szokásukhoz híven valószínűleg kicsit lassabban fognak reagálni – azaz bár figyelemmel kísérik az eredményeket, és tesztelik a lehetőségeiket, nem valószínű, hogy azonnal átállnak egy NMT + emberi utószerkesztés modellre, hacsak nem kifejezetten szűk alkalmazási területen és csak bizonyos „sikernyelvpárokban” teszik ezt.
Egyelőre a kelet-ázsiai nyelvekben (pl. kínai, japán) látható kiemelkedő javulás a gépi fordítások minőségében. A magyar nyelv – mondhatni, szintén szokásához híven – egyelőre kevésbé tűnik alkalmasnak arra, hogy NMT-vel az emberihez hasonló minőségben lehessen fordítani rá angolból (vagy ellenkező irányba).
Elsősorban a technikai jellegű szakszövegek és a hasonló sémára épülő, adott szakterületet érintő szövegek esetében látható és várható további javulás.
És hogy mikor váltja fel az NMT az emberi fordítást?
Erre a szakemberek általában azt válaszolják, hogy bizonyos területeken, bizonyos szövegtípusoknál és bizonyos nyelvpárokban lehetséges, hogy átveszi az uralmat – akár egy-két évtizeden belül is –, de kreatív emberi fordításra mindig is szükség lesz.
Az NMT jelentősége tehát inkább abban van, hogy a fordítássegítő eszközökbe beépülve még jobban segíti, gyorsítja a fordító munkáját, hogy a nyelvésznek több ideje legyen a kreativitást, elvonatkoztatást igénylő mondatok és szövegrészek fordítására.
Továbbá nem szabad elfeledni a nem szakmabelieknek nyújtott segítséget sem, hiszen ma is elsősorban a forrásnyelvet nem beszélő, de egy adott szöveget megérteni próbáló laikusok, nem pedig nyelvészek teszik ki a Google Translate és más gépi fordítómotorok felhasználóinak nagy részét.
Az ember általi ellenőrzést és utószerkesztést egyáltalán nem kívánó gépi fordítások kora viszont egyelőre még nincs a láthatáron.