Tényleg használható a gépi fordítás?
Mindenki tudja, milyen vicces, ha egy program fordít. Egyesek szerint ezért már nem is gépi fordításról kellene beszélnünk, hanem „fordítástámogatásról”. Sophie Hurst alábbi írásában számba veszi, hogy milyen bevett és gyakorlati alkalmazása van az üzleti életben a számítógépes fordításnak.
Mind hallottunk már történeteket interneten automatizált vagy gépi fordítási (gépi fordítás) szolgáltatást használó emberekről, meg az így keletkező bizarr fordításokról. Ukrajnában voltam egy étteremben, amikor az étlapon a következőt láttam: „Submit in a teapot” (benyújtás teáskannában), ami elgondolkoztatott arról, hogy a teáskannában vajon miféle benyújtásra is kerülhet sor. Amikor a pincért megkérdeztem, elmondta, hogy gépi fordítás segítségével nyersfordításokat alkalmaznak.
Nemrég jelent meg egy cikk a Guardianban (Egyesült Királyság), ami elég kedvezőtlen képet festett az gépi fordításról. A cikkben izraeli újságírókról esett szó, akik egy internetes gépi fordítás-motor segítségével tettek fel kérdéseket a holland külügyminiszternek. A dolog komoly bonyodalmakhoz vezetett, mivel a gép összekeverte az izraeli ha (ha'im) szót az anya (ha'ima) szóval. A mondat így szólt: „Szevasz, haver, mellékeltem öt kérdést a külügyminiszter tiszteletére: Az anya az Ön izraeli látogatása alvás tiszteletére vagy az ágyba Ön gondol a konfliktusról izraeli palesztinok.” A sajtó szerint „majdnem diplomáciai incidensről” volt szó.
Szóval tekintve, hogy sokaknak ez a tapasztalata a gépi fordítással, lehetséges egyáltalán, hogy a többnyelvű tartalomszolgáltatás e formája alkalmazható üzleti szituációban is, ahol a vállalkozások számára fontos a konzisztencia, a minőség és a márka arculata? A válasz: igen. A varázsszó az integráció, de ennek kifejtése előtt vessünk egy pillantást a gépi fordítás történetére.
Az automatizált fordítás múltja...
A korszerű automatizált fordítás kezdetei az 1950-es évekbe nyúlnak vissza, amikor a Georgetown Egyetem és az IBM közös projektbe fogott. Egy számítógép-operátor orosz nyelvű szöveget vitt be egy IBM nagygépbe. A nyomtató kisvártatva teljesen érthető angol tartalmat adott ki. A hírek gyorsan terjedtek, és az újságok rövidesen ilyen címekkel cikkeztek: „A számítógép agya szabályos angol nyelvre fordít orosz szövegeket”. Ez aztán nagy izgalmat váltott ki a találmány kapcsán.
Kezdetben úgy gondolták, hogy az automatizált fordítás részben, majd teljesen átveszi az emberi fordítás szerepét. Az optimizmus azonban elhalt az USA kormányának egyik bizottsága által 1966-ban készített jelentést követően, mely szerint az automatizált fordítás túl drága, pontatlan és lassú, és még további finanszírozást és kutatást tesz szükségessé. Az automatizált fordítás alkalmazása csak az 1980-as években kezdődött újra, erősebb, megbízhatóbb számítógépekkel. A munkahelyek számítógépesítésével, az információk internetes hozzáférhetőségével és végső soron a globalizáció előretörésével az automatizált fordítás üzleti igényként jelentkezett, és ezt egyre inkább a hagyományos emberi fordítás valós alternatívájának kezdték tekinteni.
...és jelene
Mivel korunk számítógépei jóval erősebbek, mint a 60 évvel ezelőttiek, az automatizált fordítás alkalmazása drámai változásokon ment keresztül. Mára az automatizált fordításnak két fő stratégiája, valamint azok ötvözete alakult ki: statisztikai, szabályalapú és a kettőt kombináló hibrid módszerek.
Az automatizált fordítás önmagában egy szoftver segítségével, emberi beavatkozás nélkül fordít tartalmat egyik nyelvről a másikra.
A szabályalapú gépi fordítás elemző megközelítést alkalmaz, melynek során nagymértékben támaszkodnak a nyelv grammatikai reprezentációjára, vagyis azon szabályokra, amelyek a tartalom elemzését végzik, majd az elemzés során nyert reprezentációból más nyelven szöveget (felszíni formát) generálnak. Kétnyelvű szótárakból származnak a fordításban megjelenő konkrét szavak, kifejezések.
A statisztikai gépi fordítás korábban már lefordított szövegek statisztikai elemzésével dolgozik. A fordítási folyamat a grammatikai elemzés helyett valószínűségi alapon megkísérli előrejelezni adott kontextusban adott szó vagy kifejezés megfelelő fordítását. A statisztikai rendszerek általában több lehetséges fordítást is generálnak, és azt tartják meg, melyben a szavak és a kifejezések a legvalószínűbb sorrendben jelennek meg.
Természetesen mindkét módszernek megvannak a maga előnyei és hátrányai is.
Nyersfordítás
Persze a minőségi követelmények eltérnek a különböző helyzetekben. A csevegőalkalmazásokban például nagyon hasznos tud lenni a gépi fordítás, és ott nem is fontos a minőségi kimenet. Más esetekben az ember egy idegen nyelvű e-mailt szeretne megérteni, és egy olyan weboldalra látogat, ahol bizonyos információkat gyorsan lefordíthat. Ezekre a célokra az automatizált fordítás az eredeti szöveg lényegét kifejező nyersfordítást ad.
Egyes szervezetek egyre tágabb körben használják a nyersfordítást, és pl. dokumentációs anyagok, súgók vagy egyéb tudásalapú információk esetében az ügyfelek választhatják meg, hogy kérnek-e nyersfordítást, amivel az idegen nyelvű tartalom megértésében segítséghez jutnak. A gépi fordítástól nem várnak pontosságot, csupán azt, hogy képet kapjanak arról, hogy adott tartalomban van-e olyan információ, ami teljes fordítást tesz szükségessé.
Az értékesítési támogatás és a gépi fordítás területén egyre növekszik az érdeklődés, mivel az ilyen tudásbázisok és rendszerek nagy mennyiségű tartalmat fognak át, ahol az óriási mennyiségű tartalom csak a forrásnyelven áll rendelkezésre. Többen úgy érzik, hogy a gépi fordítás is jobb a semminél; hagyományos fordítási módszerekkel ekkora mennyiség lefordítása túl hosszadalmas és drága lenne. No de mi van akkor, ha az olvasók biztosak akarnak lenni abban, hogy az általuk olvasott információ helytálló, és valóban az általuk megvásárolt vagy megvásárolni tervezett termékkel vagy szolgáltatással kapcsolatos? A megoldás a fordítási memória, a gépi fordítás, a terminológiakivonatolás és a szótárak olyan integrált módon történő kombinálása, amikor a szakértők ellenőrzik a forrásnyelvi tartalmat, és utólag szerkesztik a kimenetet. Egy ilyen teljes körű megoldás magas színvonalú, közzétehető tartalmat eredményez. Ilyesfajta rendszereket alkalmaz pl. a Best Western, a CA, a CNH, The Chrysler Group, a HP, a Microsoft és az RS Components.
Az integrálás előnyei
Az automatizált fordítás előnyei – gyorsabb piacra jutási idő és alacsonyabb fordítási költség – nem elérhetetlenek, azonban csak akkor, ha a gépi fordítást más technológiákkal kombinálják, illetve ha emberi beavatkozással biztosítják, hogy a minőséget nem áldozzák fel a folyamat során. Jó integrációval elérhető, hogy a rendszer a nem megfelelő pontokon korrigálható legyen, így a fordítás időről időre jobb lesz.
A szervezeteknek azonban gondosan meg kell ezeket a folyamatokat tervezniük. Ez olyan, mint amikor arról kell dönteni, hogy autót veszünk, vagy hogy magunk építünk saját autót, és projektvezetési módszereket alkalmazunk az autó sikeres üzemeltetéséhez szükséges valamennyi összetevő integrálása érdekében.
Mindezeken felül az is biztosítandó, hogy a szerkesztőket kiképezzék az automatizált fordítással készült szövegek kezelésére, hiszen ez egészen más készségeket kíván, mint ami a hagyományos fordításhoz kell.
A forrásnyelvi tartalom és a gépi fordítás kimenete
A forrásnyelvi tartalom igen fontos az automatizált fordítás világában. Ha ugyanis ennek minősége rossz, akkor a fordított tartalomé sem lehet jó. Ez természetesen a hagyományos fordításra is igaz, az automatizáltra azonban még inkább.
Követelmény a konzisztens terminológiahasználat, annak érdekében, hogy a gép minden egyes szó lefordításakor tudja, hogy azt helyesen fordítja; a betűszavak és a rövidítések következetes használata; a zsargon kerülése; a konzisztens kis- és nagybetűhasználat; a kétértelműség elkerülése; illetve valamennyi dokumentumon belül egységes stílushasználat. A szerzői eszközökkel a szövegírók alkalmazkodhatnak néhány ilyen követelményhez, ezáltal javítva a forrásnyelvi tartalom minőségét, illetve fejlesztve a fordítási folyamatot.
A gépi fordítás jelenlegi korlátai
A gépi fordítás a leghatékonyabban a formális szövegek – mint például műszaki adatlapok, szervizkönyvek, katalógusok – esetében működik, és jelenleg a sajátos stílust és idiómákat alkalmazó kreatív tartalommal nem nagyon tud mit kezdeni. Az ilyesfajta tartalomban ugyanis sokkal gyakoribbak a többjelentésű szavak és a szójátékok. A marketingtartalom az egyik legnehezebben fordítható típusú szöveg emberi fordítási folyamatoknál is, nem meglepő tehát, hogy a gépi fordítás használata itt egyelőre kudarcra van ítélve.
Összefoglalás
Ebben a cikkben a gépi fordítás történelmi és mai szerepét vizsgáltuk – mely utóbbit szofisztikáltabb, erősebb számítógépmotorok jellemeznek –, illetve az egyes vállalkozások számára a gépi fordítás jelentette előnyöket. A gépi fordítás iránt egyre fokozódik az érdeklődés, amint a globális közönség számára egyre nagyobb mennyiségben biztosítanak tartalmat. A szervezetek számára továbbra is bonyolult feladat olyan megoldást találni, amely az ügyfeleknek megfelel, mégis egyre több olyan vállalat van, mely sikeresen alkalmaz gépi fordítást.
Sophie Hurst
az SDL International vezető termékmarketing-menedzsere