A Google robottolmácsot épít
Nehéz eldönteni, a balta vagy a fa a nagyobb: a Google – saját bevallása szerint – arra készül, hogy pár éven belül telefonjait idegen nyelveket „szinte azonnal” fordító szoftverrel szerelje fel.
Akár szenzációszámba is mehetne az a bejelentés, miszerint a Google telefonjain pár éven belül olyan szoftver fut majd, amivel két idegen nyelvet beszélő személy automatikusan tolmácsoltathatja mondandóját. „Mint a Galaxis útikalauz stopposoknak bábelhala” – írja lelkendezve a hírhozó timesonline.co.uk. És hogy nem gurigáznak akármivel a keresőóriás ambiciózus mérnökei, arról a cikk következő bekezdése tanúskodik: az angol újság szerint a „már létező” hangfelismerési és automatikus fordítási technológiákra épülő rendszer, ha működik, átalakítja a több mint hatezer nyelvet beszélő földkerekség kommunikációját. A cél bemérve, kezdődhet a verseny.
A cikk két, már létező Google-alkalmazást említ, amiből arra következtethetünk, hogy a keresőcég következő (utáni? utáni-utáni? azutáni?) Nagy Durranása a már létező, kizárólag statisztikai alapon működő online webfordítóra (ez az ünnepelt Google Translate) és a GPS-navigációs szoftverekhez nemrég bevezetett hangfelismerési rendszerre (segítségével vezetés közben bepötyögés helyett bediktálhatjuk a címet) épülne.
Az elképzelés szerint a két szolgáltatás integrálásával létrejövő új eszköz folyamatosan figyelné az elhangzó szöveget és – az emberi tolmácshoz hasonlóan – azt „csomagokban” értelmezné – azaz kivárná, amíg valami olyasmi érkezik, amit a rendszer már felismer, ezt aztán a fordítószolgáltatás lefordítaná, majd egy beszédszintetizátor „letolmácsolná” a másik fél számára.
A lap idézi a Google fordítási szolgáltatásainak vezetőjét, Franz Ochot, aki igen optimistának tűnik: „Úgy gondoljuk, a beszédről-beszédre töreténő fordítás aránylag jól fog működni néhány éven belül”. A csapat ennek érdekében nagy pontosságú fordítás és hangfelismerés kifejlesztésén dolgozik. A Google kizárólag a statisztikai alapon működő fordítás mellett tette le a voksát, és nem alkalmaz olyan nyelvi algoritmusokat (azaz szabályokat), amelyeket például a MorphoLogic webforditas.hu szolgáltatása. Azt a véleményt, miszerint a statisztikai fordítás önmagában gyengébb minőségű fordítást eredményez, ezért érdemes azt megtámogatni a szabályalapú fordítással, a Google határozottan elutasította eddig. És úgy tűnik, ezen az alapon kíván maradni továbbra is: Och a számtalan lelkes segítőre számít, akik ingyen fejlesztik számára a rendszert, hiszen „minél több adatot adsz meg, annál jobb lesz a minőség”. Magyarországról nézve tehát lesz még min dolgoznia a „számos lelkes nyelvrajongónak”, akik szabadidejükben fejlesztgetik a rendszert – még ha például egyes jobban megfeleltethető nyelvek esetén (a cseh-szlovák fordításon kívül is akad egy-kettő) talán értékelhető(bb) lesz is az eredmény.
Több kutató az egyszerűbb feladatnak tűnő nyelvfelismerés problémáján is fennakad: a lap által idézett kutató például érdeklődve várja, hogyan birkózik majd meg a szolgáltatás a glasgowi kiejtés rejtelmeivel. Erre a Nyest egyik kutató barátja azonban azt javasolta, hogy esetleg személyre szabva is lehetne „edzeni” a szoftvert: elég ismételgetéssel majd megtanulja, hogy mi a különbség a pesti „kerek” és a palóc ”kárëk” között.
Mindenesetre a nyest.hu érdeklődéssel várja a robottolmács megjelenését. Az biztos, hogy ha a beszédkutatás a gébetűs cég várakozásainak megfelelően fejlődik az elkövetkezendő hónapokban, továbbá a statisztikai alapú gépi fordítás is felzárkózik mellé, valami egészen fantasztikus dolgot hozhatnak létre. Emellett szól, hogy a beszédkutatásban már ma is áttörésről beszélnek a kutatók – akik egyébként hagyományosan irtóznak a nagy szavaktól (pl. robottolmács, szerkesztőségünk ezúton is pironkodva kér elnézést az illusztrációért).
Más kérdés azonban, hogy az olyan produktív nyelveknél – azaz különböző szóalakokat számolatlanul létrehozni képes nyelveknél, mint amilyen például a magyar vagy a török – nem lesz egyszerű úgy optimalizálni a fordítás minőségét, hogy az kiejtve is legalább elviselhető minőségű legyen. Őszintén szurkolunk annak, hogy a magyar nyelvű szolgáltatás ne legyen annyira kellemetlen, mint ahogy Dougles Adams a bábelhal a fülbe helyezésének folyamatát ábrázolja...