A világ a mesterséges intelligencia lázában ég, manapság bármerre fordulunk, a ChatGPT-vel kapcsolatos cikkekbe botlunk. Van, aki a főzést próbálja feldobni a segítségével, olyan is akad, aki az adatvédelemi aggályokra hívja fel a figyelmet, és van, aki szerint kutyája ennek köszönheti az életét.
A szolgálatás nevében megjelenő GPT a Generative Pre-trained Transformer rövidítése, a kifejezés pedig egy mélytanulásos módszerrel létrehozott, emberi visszajelzések segítségével finomított nagy nyelvi modellt takar, amely képes önálló szövegalkotási feladatok elvégzésére a felhasználó által megadott parancsok alapján. A ChatGPT a felület neve, amelyen párbeszédes formában léphetünk interakcióba a nyelvi modell 3-as verziójával. Ez a szolgáltatás egyébként regisztráció után bárki számára ingyenesen elérhető, és több nyelven használható.
Azonban nem csak több nyelven használható, de kérésünkre le is fordítja a beírt szöveget az általunk választott nyelvre. Ennek köszönhetően azonnal felfigyelt rá a fordítóipar is. Egyesek az iparág gyökeres megváltozását várják tőle, akárcsak korábban a gépi fordítástól, míg mások próbálnak előnyt kovácsolni a felhajtásból. Elvégre ha a blokkláncláz idején meg lehetett háromszorozni egy cég tőzsdei értékét egy névváltással, akkor most is érdemes lehet megpróbálni a ChatGPT által generált szövegek fordítására irányuló szolgáltatást értékesíteni.
Félretéve ezeket a speciális eseteket, természetesen komoly iparági szereplők is megvizsgálták, milyen képességekkel rendelkezik az új modell a fordítás terén. A különböző tesztek megegyeznek abban, hogy elkülönítve vizsgálják a nagyméretű korpusszal rendelkező nyelveket és a kevésbé gyakori nyelvpárokat.

A Microsoft által végzett vizsgálatban a ChatGPT mellett további GPT-modelleket hasonlítottak össze a vezető tudományos és üzleti neurális gépi fordítórendszerekkel. A különböző megoldásokat mondat- és dokumentumszinten is vizsgálták, és egyaránt alávetették automatikus és emberi kiértékelésnek. A vizsgált 18 nyelvpárból a német–angol, japán–angol és kínai–angol párok esetében a GPT 3.5-ös rendszer (amely a ChatGPT-nél újabb) jobb eredményt produkált a megszokott NMT-megoldásoknál, a többi nyelvpáron pedig azokhoz hasonlóan teljesített. A kutatók így arra jutottak, hogy a nagy korpusszal rendelkező nyelvek esetében versenyképes fordítások állíthatók elő az új rendszer segítségével, azonban a komplex mondatok esetén az gyakran a természetes megfogalmazástól eltérő megoldásokkal rukkolt elő, így szakszövegek fordítására kevéssé lehet alkalmas.
Az Intento kutatása jóval korlátozottabb adatmennyiséggel dolgozott, ám szintén a GPT 3.5-ös rendszer képességeit vizsgálta. A nagy nyelvi modell angol–spanyol és angol–német nyelvpárban mérte össze képességeit a népszerű NMT-modellekkel (pl. Google, DeepL, Microsoft). Az angol–spanyol nyelvirányban, általános szövegek esetében közel azonos teljesítményt nyújtottak, ám az angol–német GPT-fordítások már csak a középmezőny eléréséhez voltak elegendőek. Egészségügyi és jogi szövegek esetében pedig a GPT 3.5 mindkét nyelvpáron jelentősen rosszabbul teljesített a neurális gépi fordítórendszereknél. További fontos különbség, hogy a GPT rendszerének szegmensenként 3-4 másodpercre volt szükség a fordításhoz, amely körülbelül tízszer lassabb az NMT-rendszerek működésénél.
A neurális gépi fordításokra specializált szolgáltató, a Tencent is végzett egy kutatást a témában, ők a Google, a DeepL és a saját NMT-rendszerükkel vetették össze a ChatGPT rendszerét (amely az előzően említett vizsgálatok tárgyával ellentétben a GPT 3-as verzióját használja). Ebben az esetben az angol, a német, a román és a kínai nyelvek kerültek terítékre. Hasonlóan a Microsoft eredményeihez, a modell a neurális rendszereket megközelítő teljesítményt nyújtott általános témák, illetve a gazdag korpusszal rendelkező nyelvpárok (pl. angol–német) esetén, míg a kisebb szövegbázisra támaszkodó nyelvpárok esetében jelentősen gyengébben teljesített. A rendszerek közti olló még tovább nyílt, ha olyan specializált témák vizsgálatára került a sor, mint az élettudományi szövegek.

Mint a fenti kutatásokból kiderül, a ChatGPT és az alapjául szolgáló GPT-modellek megjelenése egyelőre nem eredményez gyökeres változást a fordítóipar működésében, bár az mindenképp meggyőző, hogy más megközelítés használatával is a létező neurális gépi fordítómotorok teljesítményéhez konvergáló megoldásokra képesek, még ha azoknál sokkal lassabban is. Figyelembe véve pedig, hogy az NMT-motorok már viszonylag érett technológiának számítanak, a generatív modellek képességei pedig az utóbbi időben rohamos fejlődésen mennek keresztül, elképzelhető, hogy utóbbiak néhány éven belül megelőzik vetélytársaikat.
Bár egyelőre még nem érdemes az utószerkesztendő anyagok új forrásaként tekinteni a ChatGPT-re, talán mégis van helye a fordítók mindennapjaiban, hiszen segítséget nyújthat bizonyos fordítással kapcsolatos feladatok esetében. Megkérhetjük például, hogy rövidítsen le számunkra egy adott szöveget (akár pontosan megadott karakterszámra), elősegítheti a kutatómunkát hosszabb anyagok összefoglalásával, vagy akár stilisztikai segítséget is nyújthat, ha megkérjük, fogalmazza újra nekünk a célmondatot más regiszterben.
Ezen a ponton fontos megjegyezni, hogy a jelenleg ingyenesen elérhető ChatGPT felületre bevitt adatokat felhasználják a modell további tökéletesítésre, így a rendszer természetesen nem használható éles fordítási projektek segítésére. A fizetős verziók azonban szavatolják az adatok biztonságát, valamint alkalmazásprogramozási felületet, vagyis API-t is kínálnak, így hosszú távon akár üzleti felhasználásra is alkalmassá válhatnak.
E cikk elkészítéséhez nem kértük a mesterséges intelligencia segítségét, de a témáról való tájékozódás során nem egy olyan cikkbe belefutottunk, amelyet érzésre a ChatGPT-vel írattak meg. Ez remekül ráirányítja a figyelmet arra, hogy ha közvetlenül a fordításban nem is, a tartalomgyártás világában azért készülhetünk néhány gyökeres változásra a közeljövőben.