Angol–magyar: az összecsapás
Vajon miről szólnak a slágerek? Az internet jóvoltából csak néhány gombnyomás, és máris rendelkezésre áll a szöveg. Angolul. Ha nem vagyunk elégedettek az automatikus fordítással, akkor szótárazhatunk. De melyik számítógépes szótárat válasszuk? A legfrissebb vagy a legnagyobb hagyományokkal rendelkező a legjobb? Kétrészes cikkünkben ennek járunk utána.
A lapozgatással járó szótárazás mára nagyrészt a múlté, kivéve a nyelvvizsgán. Egyre kevesebben bástyázzák körül magukat különféle nyomtatott szótárakkal, hiszen a számítógépen néhány billentyű lenyomásával megtalálható a fordítás. Most az angol–magyar, magyar–angol szótárak közül a számítógépen használható változatok közül vizsgálunk meg hármat. Jelen cikkünkben az angolról magyarra fordítás eredményességét vizsgáljuk.
A bemutatott szótárak
alapszókészlet: Vonyó Attila
szerkesztő: Pataki Balázs
szakszókincs: EU, zöldségtermesztés
méret: 185 ezer szópár (?)
jelenlegi változat: 1995
Akadémiai MobiMouse – Morphologic Kft.
alapszókészlet: Országh László (1960)
főszerkesztők: Magay Tamás, Futász Dezső, Kövecses Zoltán (1998)
szakszókincs: számos szakterület + informatika
méret: nyelvenként 120 ezer szócikk
jelenlegi változat: 2002
Lázár–Varga – Morphologic Kft.
alapszókészlet: Lázár A. Péter, Varga György (2000)
szerkesztők: Varga György, Lázár A. Péter
szakszókészlet: pénzügyi, gazdasági, jogi, oktatási, hazai közélet
méret: nyelvenként 75 ezer szócikk
jelenlegi változat: 2010 óta havonta frissül
A vizsgálat tárgyát képező három szótárat a legszélesebb körben használtak közül választottuk ki. Az első az ingyenesen, online használható SZTAKI-szótár. A második az Akadémiai Kiadó felújított angol–magyar, magyar–angol nagyszótárainak 2002-es kiadásából készült MobiMouse-szótár (a továbbiakban AMM). A harmadik pedig a Lázár–Varga féle egyetemes szótár MobiMouse-változata.
Mindhárom szótárban lehet úgy keresni, hogy begépeljük a keresett szót. A SZTAKI-szótárnál négy lehetőség közül választhatunk. Ezeket a pal – haver, cimbora szó példáján mutatjuk be. Az alapbeállítás az, hogy azokat a tételeket adja ki a szótár, amik a begépelt betűsorral kezdődnek (pl. a pal begépelése esetén a palm – tenyér szópárt is). Lehetőség van arra is, hogy pontosan a begépelt szót keresse (pal), illetve, hogy csak olyan tételeket keressen, amiben a begépelt betűsor önálló szót alkot (pen-pal – levelezőtárs). A „bármilyen egyezés” opciónál a begépelt szó a tétel bármely pozíciójában szerepelhet (napalm – ua.). Ezen kívül azt is választani lehet, hogy a kis- és nagybetűk, valamint az ékezetes és nem ékezetes betűk között különbséget tegyen-e a program.
Az AMM- és a Lázár–Varga-szótár keresőfelülete ugyanaz, egyszerre több szótárban is lehet keresni. A programba minden nyelvhez automatikus morfológiai elemzőt is építettek. Ez azt jelenti, hogy ha ragozott alakot keresünk (pl. goes – ő megy), a program akkor is megtalálja a szótövet és az összes erre a szótőre (go – megy) illeszkedő találatot kiadja. Ez különösen a ragozó nyelveknél praktikus, hiszen például a terhet szóra is megtalálja a teher szótőt. A tő megtalálására a SZTAKI-szótár nem képes. Ezen felül a két MobiMouse-szótárnál lehetőség van arra is, hogy ne kelljen begépelni a keresett szót. Ekkor egy szövegben az egérkurzorral a kérdéses szóra állva automatikusan feljön egy ablak a találatokkal. A MobiMouse keresőfelülete azonban különbséget tesz kis- és nagybetűk között. Így a bécs szót nem találja meg, csak a Bécs-et.
Az összehasonlításhoz először egy eléggé gyakori szavakat tartalmazó mondatot próbáltunk meg lefordítani a szótárakra támaszkodva. Vizsgálatunk során arra voltunk kíváncsiak, az egyszerű felhasználó szemszögéből miben különböznek a szótárak. Tesztmondatunk egy népszerű, angol nyelvű sláger egyik sora: I talked to your dad, go pick out a white dress ’Beszéltem apáddal, menj, válassz egy fehér ruhát’.
Az első benyomások
Vizsgálatunk során egyszerűen kikerestük a fenti mondat szavait a szótárakból. Az már a viszonylag szűk jelentéskörrel bíró szavaknál – mint például a dad ’apuka’ vagy dress ’(női) ruha’ – is kiderül, hogy míg az AMM- és a Lázár–Varga-szótár belső szerkezettel rendelkező szócikkeket ad ki találatként, a SZTAKI-szótárban egyszerű szópárokat találunk. Ez a különbség a széles jelentéskörrel rendelkező szavaknál még markánsabban jelentkezik. Az is hamar kiderül, hogy a SZTAKI-szótár valójában két adatbázisból dolgozik: egy alapszótárból és egy ún. „kibővített szótárból”. A második adatbázis találatai az első listától elkülönülten, az oldal alján jelennek meg. Ezt csak akkor veszi észre a felhasználó, ha nagyon rövid a találati lista vagy ha legörgeti az oldalt.
A két adatbázis találatai átfedik egymást. Például a dress szó megfelelője (alapbeállításnál) az első listában ruha, amit 43 másik olyan sor követ, amiben a dress betűsor megtalálható (köztük pl. to dress – öltözködik, dresser – fiókos szekrény, komód). A kibővített szótárrészben újra találkozunk a dress sorral: öltözik; öltözködik; ruha fordításokkal. Azaz a kibővített szótárban szereplő dress jelentései az alapszótárban már szerepeltek.
Kérdésünkre Pataki Balázs, a SZTAKI-szótár szerkesztője elmondta, hogy a szótár két adatbázisa összesen185 ezer szópárt tartalmaz. Minden sor külön szópárnak számít – tehát az átfedések miatt nem mondható meg pontosan, valójában hány különböző angol–magyar szópárból áll az adatbázis. Bár az adatpárok jó része mindkét nyelvből egy-egy szót vagy kifejezést tartalmaz, előfordulnak olyan sorok is, ahol valamelyik nyelven több ekvivalenst tartalmaznak, pl. pal, mate, friend – barát.
Szócikkek
Míg a nagyon kevés jelentéssel rendelkező szavaknál mindkét típusú szótárban könnyű kiválasztani a megfelelő fordítást, a több különböző jelentéssel bíró tételeknél – pl. talk ’beszél, beszélget, pletykál, beszéd stb.’ már markáns különbségek mutatkoznak. Az AMM- és a Lázár–Varga-szótárban a szócikkek belső struktúrával rendelkeznek. Szófaji és stílusbeli információk, magyarázatok és aljelentések segítik a szótárhasználót az eligazodásban. Egy-egy aljelentésen belül a leggyakoribb fordítást adják meg elsőként. Így a lehetséges fordítások köre elég jól leszűkíthető.
Az AMM szócikkei azonban igen bonyolultak. A finomabb jelentésárnyalatok elkülönítése érdekében esetenként négyszintű beágyazást tartalmaznak, így nehezen átláthatók. A komplikált struktúrába gyakran csúsznak hibák. A dress ’ruha’ címszónál az I. 1. a) és I. 1. c) jelentés teljesen megegyezik. Hasonlóképpen, a white ’fehér’ címszónál a ’fehér hajú, ősz’ jelentés kétszer szerepel: az I. 1. a) és I. 1. c) pontban. A szócikkek ilyen fokú bonyolultsága nehézkessé teszi a keresést.
Ezzel szemben a Lázár–Varga szótárban a különböző szófajú jelentések külön szócikket alkotnak. Egy szócikken belül számozott listában állnak a külöböző jelentések. Ezekhez magyarázat vagy példa tartozik, ám az aljelentések nincsenek további alosztályokra bontva. Ezáltal sokkal gyorsabban meg lehet találni a keresett fordítást, mert a lista áttekinthető.
Szócikkek nélkül
A SZTAKI szótár egész más megközelítést alkalmaz. Itt a célnyelvi jelentések – tekintet nélkül az ekvivalensek, azaz lehetséges fordítások szófajára, használati körére és gyakoriságára – egy sajátos ábécérendben (ékezetes betűk az „ábécérend” végén) jelennek meg. Ez roppant mód megnehezíti – kezdők számára lehetetlenné is teszi – a megfelelő fordítás kiválasztását.
A white ’fehér’ szó például – ami az AMM-ben egy, a Lázár–Vargában két címszó, több aljelentéssel – 45 szópárban található meg a SZTAKI-alapszótárban (a „teljes egyezés” opció esetén). Tehát ebből a 45 tételből kell minden fogódzó nélkül kiválasztani a megfelelő fordítást. A találati listában melléknevek pl. szeplőtlen, sápadt, főnevek pl. céltábla szélső köre, mellétalálat és a magyarban többértelmű szavak pl. ősz egyaránt előfordulnak. Ennyi fordítás el sem fér egyetlen ablakban.
Mindennek tetejébe a felsorolt fordítások egy része valójában nem ekvivalens, hanem magyarázat. Jó példa erre a szó ’kommunistaellenes’ jelentése. Ennek a jelentésnek a magyar megfelelője szintén fehér (vö. Amúri partizánok dala). Egy hagyományos szócikkekkel rendelkező szótárban ez legfeljebb így szerepelne: „[kommunistaellenes] fehér”. A „mázatlan porcelán” jelentésre pedig más forrásban nem sikerült rábukkanni.
Ugyancsak figyelemre méltó a go ’megy’ szócikke. A go az egyik leggyakoribb angol ige. Ennek a szónak van számos főnévi jelentése is, melyeket sokkal ritkábban használnak. A SZTAKI-alapszótárban a go-hoz ekvivalensként csupán tíz főnév (az alku-tól az üzlet-ig) van megadva. Ezek egy része csak bizonyos kifejezésekben használható valójában. Igei jelentést egyáltalán nem találunk. A „kibővített szótárban” bukkan csak fel a ’megy, menni’ fordítás, a többi igei jelentés pedig teljesen hiányzik. Ez azt mutatja, hogy a szótárban szereplő jelentések köre elég esetleges. Míg a white-nál számos, alig használt ekvivalenssel találkozhatunk, a go leggyakoribb jelentése csak elrejtve található meg a szótárban. Ha ugyanis az alapbeállítást választjuk, a go- kezdetű találatok nagy száma miatt (összesen 84) a „kibővített szótár”, s ebben az igei jelentés, csak a negyedik lap alján jelenik meg.
Ritkább szavak
Egy korábbi szótárvizsgálatban néhány szótárt három kifejezéssel teszteltek. Ehhez hasonlóan, egy angolul tanulók számára készített magazinból választottunk három ritkább szót, hogy ne csak a leggyakoribb szavakon teszteljük a szótárakat.
A sleepover ’ottalvós buli’ kifejezés csak a Lázár–Varga szótárban szerepelt, jó ekvivalenssel. A leafy ’zöld, zöldellő’ szó mindhárom szótárban megtalálható, helyes jelentésekkel, de a leafy suburb ’zöldövezet’ kifejezés egyikben sem jelent meg. A groovy szó számos nagy egynyelvű szótár tanúsága szerint kizárólag a ’klassz, menő, divatos’ jelentésben használatos. Ez mindhárom szótárban megtalálható – azaz a SZTAKI-szótárnak csak a kibővített részében. Ám az AMM és a SZTAKI „barázdás, hornyos, megszokott, rovátkás, rutin, rutinos, sablonos” jelentést is ad. A groove ’rovátka, megszokás’ szóból elvileg képezhető melléknév y képzővel. Ám a rovátkás jelentés kifejezésére inkább a grooved szót használják, míg a rutinos szóra az experienced egy jó megfelelő. Tehát a SZTAKI- és az AMM-szótárban szereplő – meglepően hasonló – ilyen értelmű jelentések hibásak.
Részeredmények
A három vizsgált szótár közül legeredményesebben a Lázár–Vargában lehet keresni a szócikkek átláthatósága miatt. A véletlenszerűen kiválasztott ritka szavak esetében is ez a szótár szerepelt legjobban. Az Akadémiai szótárban általában egy kicsit több ekvivalens van, de néha elavult fordítások is előfordulnak. A komplikáltabb szócikkek sokszor nem átláthatók, esetleg felesleges ismétléseket tartalmaznak.
A SZTAKI szótár csupán a szűk jelentéskörű szavaknál használható eredményesen. Legnagyobb hátránya, hogy nincsenek szócikkek, ami nagyban megnehezíti a megfelelő fordítás kiválasztását. Ugyanis a lehetséges jelentések minden magyarázat nélkül, előfordulási gyakoriságra való tekintet nélkül egy egyszerű listában jelennek meg. A szótárban sok a hibás fordítás is. Az ekvivalensek száma pedig nem feltétlenül tükrözi a szó forrásnyelvi jelentéseinek számát.
Cikkünk második részében azt vizsgáljuk majd, hogy magyar szavakat, mondatokat milyen eredménnyel lehet a fenti három szótár segítségével lefordítani angolra. Míg az angolról magyarra fordítás során egy magyar anyanyelvű embernek könnyű dolga van abból a szempontból, hogy az eredmény az anyanyelvén van, a másik irányban nem támaszkodhat ilyen mértékben a nyelvi intuícióra. Ilyenkor még hangsúlyosabb szerepet kap a használt szótár minősége.
A folytatás megjelenéséig arra biztatjuk olvasóinkat, hogy próbálják ki a három ismertetett szótárat. A SZTAKI-szótár teljes adatbázisa szabadon használható. Az Akadémiai MobiMouse szótár ingyenesen kipróbálható változata az a betűvel kezdődő szavakat tartalmazza, míg a Lázár–Varga egyetemes szótár a k betűig ingyenesen kereshető.
@peterbodo: A sztaki kétségtelenül ingyenes, de rosszabb, mint ha nem is lenne, ugyanis konkrétan rosszat tanulsz meg belőle egy csomó esetben. A szellemi környezetszennyezés kategóriája, a horoszkópokkal és az egyensúlykarkötővel egy szinten.
Azt esetleg vedd még észre, hogy a Lázár-Varga szótárban egyetlen adóforint sincs benne, mivel egy kft adja ki, nem az MTA.
A sztaki szótár legnagyobb gyengéje, hogy csak szópárokat tartalmaz, hiányoznak a rendes szótári információk, mint pl. példák, kollokációk, kifejezések, ragozási osztály stb.
A harc a startvonal eldőlt. A sztaki ingyenes. Az 1828 óta az adófizetőkből élő kiadó a fizetős szótárakat meg kenje hajára.