0:05
Főoldal | Rénhírek

Szexista a Google Translate?

A Massachusetts Institute of Technology két kutatója igen érdekes felfedezést tett, kísérletük eredménye néhány napja kering a Facebookon. De mire mutat rá az eset?

Fejes László | 2012. február 15.

Manapság a fordítóprogramok főként statisztikai alapon működnek: fognak egy nagy szöveggyűjteményt (korpuszt), melyben ugyanazok a szövegek szerepelnek mind a két nyelven. Ezután egy algoritmus megpróbálja „megtanulni”, hogy az egyik nyelv szavainak milyen szó vagy szavak felelnek meg a másik nyelvben, illetve milyen környezetben, alakban stb. Amikor pedig a programmal fordítunk, akkor ami történik, az nem is igazán fordítás, hanem azt kapjuk meg, hogy a gép szerint az általa ismert szövegek alapján mi a legvalószínűbb: egy ember hogyan fordítaná le a szöveget.

Vannak azonban olyan esetek, amikor az emberi fordító nem tudná eldönteni, hogyan is fordítsa az adott szót, mivel a forrásnyelv nem fejez ki egy olyan jelentésbeli vonást, amelyet a célnyelven feltétlenül ki kell fejezni. (Régi nyelvészeti közhely, hogy a nyelvek nem abban különböznek, hogy mit lehet rajtuk kifejezni, hanem hogy mit kell.) Az angolban például van nyelvtani nem, de ezt gyakorlatilag kizárólag az egyes szám harmadik személyű névmással fejezik ki: he ’ő (hímnem)’, she ’ő (nőnem)’, it ’az (semlegesnem)’ (a sorrend nem értékítéletet fejez ki, hanem hagyományosan ebben a sorrendben szokás felsorolni ezeket a szavakat). Ezzel szemben például a héberben a második és harmadik személyű, egyes és többes számú személyes névmások is jelzik a nemet, sőt, a melléknevek és a jelen idejű igék is. Az oroszban az angolhoz hasonlóan csak az egyes szám harmadik személyű névmások különböznek, de a héberhez hasonlóan a melléknevek és bizonyos igealakok (a múlt idejűek) szintén jelölik a nemet (igaz, csak egyes számban).

Mindebből az következik, hogy bizonyos angol mondatokról nem tudhatjuk, hogy azok férfiakra vagy nőkre vonatkoznak-e. Ilyenek például azok a mondatok, melyeknek alanya az I ’én’ személyes névmás. Ha egy tolmácsot kérünk meg ennek lefordítására, többféleképpen viselkedhet: ha tudja, ki a mondat alanya, akkor annak megfelelően fordíthatja, esetleg visszakérdezhet, vagy több megfelelő fordítást is adhat, vagy közölheti, hogy megfelelő információ hiányában nem tud megoldással szolgálni. De az is lehet, hogy óvatlanul a nemekre vonatkozó sztereotípiáit építi be a fordításba: az autószerelésről szóló mondatot önkéntelenül hímnemű alakokkal, a mosogatásról szólót nőnemű alakokkal fordítja. De mit csinál egy fordítóprogram, amelyiktől a felhasználó azonnali, egyféle és határozott megoldást vár?

Hadas Kotek, a Massachusetts Institute of Technology (MIT) harmadéves nyelvészet és filozófia szakos MA-hallgatója a Google fordítóprogramjával kísérletezett. Összeállított néhány mondatpárt, melynek hasonló jelentése van, de amelyekről különböző okokból feltételezhető, hogy egyikük főszereplőjét sztereotipikusan inkább nőnek, másikukat inkább férfinak gondolnánk. Meglepő vagy sem, a fordítóprogram pontosan elvárásaink szerint viselkedett. Hadas Kotek eredetileg az angolról héberre fordítást vizsgálta, az alábbi ábrán az angolról oroszra fordítás eredményét látjuk. A képet David Pesetsky, az MIT nyelvészprofesszora készítette.

Szexista a Google Translate?
Forrás: Hadas Kotek & David Pesetsky
Megfürdettem a kutyát. Megfürdettem a gyerekeket.
Kitakarítottam a garázst. Kitakarítottam a házat.
Hülye voltam. Csúnya voltam.
Nevettem. Kuncogtam.
A gyárban dolgoztam. Az iskolában dolgoztam.
Húst ettem. Salátát ettem.
Matematikát tanultam. Művészetet tanultam.
Imádtam dolgozni. Imádtam táncolni.
Építettem egy házat. Varrtam egy ruhát.

A bal oldali oszlopban szereplő mondatokat a Google fordítója következetesen hímnemben, a jobb oldaliakat nőnemben fordítja. Miért? Természetesen statisztikai alapon.  A fordítónak ugyanis fogalma sincs olyan grammatikai kategóriákról, mint a nyelvtani nem. Azt, hogy az igének milyen alakba kell kerülnie, úgy dönti el, hogy megvizsgálja, hogy (az adott alany mellett) az ige milyen alakban fordul elő gyakrabban. A fordító mindössze azt mutatja, hogy nők gyakrabban írják magukról, hogy kuncogtak, de ritkábban, hogy matematikát tanulnak, mint a férfiak.

Szexista a Google fordítója? Szó sincs róla! A fordítóalgoritmus még arra is képtelen, hogy elkülönítse egymástól, mik a statisztikákban megjelenő nyelvi tulajdonságok, és mik a bennük megjelenő nyelven kívüli információk. Tulajdonképpen azt is mondhatjuk, hogy a fordító éppen így működik jól, hiszen azt a fordítást adja meg, amelyikre nagyobb valószínűséggel lesz szükségünk – legalábbis az általa ismert adatok alapján.

Rendben, de akkor miért nevezünk egyes embereket mégis szexistáknak? Ha valaki egy mesekönyvet ír, és abban apa újságot olvas, míg anya főz, ráadásul a történet szerint mindez a dolgok természetes rendje, biztos, hogy ki fogja váltani egyesek felháborodását. Az illető nyugodtan védekezhet azzal, hogy – legalábbis az ő tapasztalata szerint – ez a tipikus, nem is írhatna mást.

Ez a védekezés részben megalapozott, mégsem fogadható el. A Google fordítója egy gép, amely nem ismeri fel az egyes statisztikai adatok társadalmi jelentőségét. Az meseíró azonban ember, akinek lehetősége van felmérni, hogy az általa leírt, akár valóban tipikus jelenségek mennyire rendjén valók. Lehetősége van ezeket a tipikusnak megfelelően, de kritikusan, akár ironikusan ábrázolni – vagy szándékosan szembemenni a tipikussal, és megmutatni azt, hogy a sztereotípiák legfeljebb a jellemzőt, de nem az egyedüli lehetségest vagy a követendő példát mutatják. Az embernek van ilyen felelőssége, a gépnek nincs.

Kapcsolódó tartalmak:

Hasonló tartalmak:

Hozzászólások (3):

Követem a cikkhozzászólásokat (RSS)
12 éve 2012. február 15. 23:18
1 Annie

jé… arabul is, ha beírom, hogy „i am pretty”, akkor nőnemben fordítja, ha azt írom, hogy „i am strong”, akkor hímnemben. viszont az okosat ha úgy írom be, hogy clever, akkor hímnemben fordítja, ha úgy, hogy smart, akkor nőnemben :D

9 éve 2014. május 7. 15:09
2 fhb

a héberben nem csak a jelen idejű igék jelzik a nemet, hanem a múlt- és jövő idejű igék is, E2-3 és T2-3 esetekben. E1 és T1 esetében nincs különbség a két nem között.

9 éve 2014. május 7. 16:12
3 Sultanus Constantinus

A spanyol esetében még mindig teljesen reménytelen a Google-fordító. Kipróbáltam @Annie: példáit: az "I'm clever" helyett azt fordítja, hogy 'El vagyok készülve' (Estoy listo), az "I'm smart" kivételesen jó (Soy inteligente), ez viszont pechünkre épp egy olyan melléknév, ami nem különbözteti meg a nemeket, tehát nem tudtam tesztelni. Erre fel kipróbáltam azt, hogy "I'm good", de ezt meg úgy fordítja, hogy 'Jól vagyok' (Estoy bien), a határozószó meg szintén nem jelöl nemeket. Ez után kipróbáltam az "I'm beautiful"-lal, na az is elég érdekes eredményt produkált: ha pont nélkül írtam, akkor hímnemben fordította (Soy hermoso), ha pontot is tettem a végére, akkor nőnemben, viszont elé tett egy 'hogy~hiszen' kötőszót, aminek aztán semmi értelme nincs megint (Que soy hermosa).