Plakátháború: a Google Translate is tiltakozik?
Nem mindegy, hogy a bevándorók veszik el a kormány szerint a magyarok munkáját, vagy fordítva: a magyarok veszik el a bevándorlók munkáját. A Google Fordító szerint ez egyre megy.
A kormány bevándorlóknak vagy menekülteknek címzett óriásplakátjainak durván menekültellenes szövege már a megjelenés előtt kiverte a biztosítékot. A plakátra válaszul már mémek is születtek. A plakátokat magyar nyelven nyomtatták ki, tehát a címzettek nyelvismeret híján nem is értik, mi van rájuk írva. Sebaj, segít a Google Translate! Ám mint Bede Márton, a 444! újságírója rámutatott, a magyar mondat fordítóprogram által előállított angol fordítása egészen mást mond, mint amit a kormány – állítólag a Nemzeti Konzultáció eredményeként – üzenni szeretett volna. Szándékosság állna a háttérben?
A következő szöveggel ellátott plakátok már kint is vannak az utcákon, és jelentős tiltakozáshullámot generálnak.
Kormány információ
Ha Magyarországra jössz, nem veheted el a magyarok munkáját!
Nemzeti konzultáció a bevándorlásról és a terrorizmusról
Ha az üzenetet beírjuk a Google fordítójába és angolra fordíttatjuk, a következő mondatot kapjuk vissza.
If you come to Hungary, Hungarians can not take your work
’Ha Magyarországra jössz, a magyarok nem vehetik el a munkádat’
Hogy állhat elő ez a fordítás? Vajon titkos erők működnek a háttérben, akik aláássák a kormány szándékait? Szó sincs róla. A Google Translate egy statisztikai gépi fordító, mely hatalmas adatbázisokon működik. A véletlen hozta úgy, hogy ezt a fordítást hozta ki nyerőnek. Próbáljuk meg kitalálni, miért! Alábbi elemzésünkben az első tagmondattal, amit jól fordított a gép, nem foglalkozunk.
Amint azt statisztikai gépi fordítókról szóló cikksorozatunkban részletesen bemutattuk, az ilyen típusú fordítóprogramok óriási adatbázisokon dolgoznak. A fordítást úgynevezett párhuzamos korpuszok segítségével állítják elő. Tehát vannak magyar szövegek és azok angol fordításai, melyek alapján a program kiszámolja, hogy az egyes szavakat és szószerkezeteket mire szokták fordítani, melyik magyar szövegrészlet melyik angol szövegrészletnek feleltethető meg. Minél több ilyen párhuzamos szöveg áll rendelkezésre, annál több adattal dolgozhat a program, és elméletileg annál pontosabb lesz.
Ha a Google Translate ominózus fordításában a végzetes hibát okozó your work ’te munkádat’ kifejezésre állítjuk az egérkurzort, kiderül, hogy a program ezt a darabot az el ... munkáját szövegrész alapján fordította. Ha még rá is kattintunk a your work kifejezésre, a következő lehetséges fordítások jelennek meg, gyakorisági sorrendben. A fordításokat mi adjuk.
your work ’a te munkád / a ti munkátok’
their jobs ’az ő állásaik’
their work ’az ő munkájuk’
Mi következik ebből? A munkáját szó a magyarban a következő szerkezetekben fordulhat elő, melyeket angolra különbözőképpen fordíthatunk.
az ő munkáját – his/her work
mentse el a munkáját – save your work
a tanárok munkáját – the teachers’ work
Mi történhetett tehát a plakát fordítása közben? Feltehetően a program adatbázisában a magázó formák voltak többségben, így született meg a your work fordítás. A tagmondat darabjaira tehát ezek a fordítások adódtak:
el ... munkáját – your work
a magyarok – Hungarians
nem veheted – can not take
Ebből a három angol darabból csak a program által kiadott jó felépítésű angol mondat rakható össze. Mivel a Google Translate legnagyobb adatbázisa angol nyelvű, a program az angolra való fordításkor nagy valószínűséggel jó szerkezetű angol mondatokat ad ki. Eközben pedig a jelentés néha elsikkad.
Ám vannak esetek, amikor még a fordításként megadott angol mondat sem jó. Legyünk például precízek, és tegyük a mondat után a felkiáltójelet is. A kép rögtön változik, és egy hibás angol mondatot kapunk. Ezt próbáljuk visszaadni a magyar fordításban is.
If you come to Hungary, Hungarians work can not take it!
’Ha Magyarországra jössz, magyarok dolgoznak nem tudja elvenni!’
Ha megnézzük, milyen részekre vágta fel a program ezeket a mondatokat, ezt kapjuk:
a magyarok – Hungarians
munkáját! – work
nem veheted el – can not take it!
Arra sajnos nem tudunk választ adni, hogy felkiáltójel hiányában a program miért az el ... munkáját darabokat párosította össze. De amint az írásjeles és írásjel nélküli változat fordítása mutatja, az eredeti mondat valós jelentése a program számára tökéletesen mindegy. Csak nekünk, magyaroknak és a bevándorlóknak nem.
szerintem nem csupán statisztikai alapon működik a fordítójuk, lehet benne nyelvtani modul is. azzal meg nem nagy Kunst egyeztetni a 'veheted'-ben megtalált nyelvtani személyt a két névszói szerkezet közül a helyessel.
@Fejes László (nyest.hu): Köszönöm!
@Szalakóta: www.hir24.hu/Root/Shared/Pictures/2015/06/07/plakatvalasz.jpg
Ha pedig a bevándorló/menekült/katonaszökevény mégiscsak érti a szöveget, akkor azt hiszi, hogy az anyaország elárulta a külföldön élő magyarokat.
Volt egy plakát a kultúráról, alatta egy fekete muszlim viseletbe öltözött nő, egy V jelet mutatva. Még a keze is fekete kesztyűben. Azóta sem találom.
Randomgenerátorok:
oli.stickman.hu/stuff/markov/#mukodes
Egyébként a Google Translatet is lehet tanítani, sőt most hogy nézem már ilyen kis gamification-ös rendszer is van hozzá.