Szótárutópia: álom-e a legnagyobb magyar e-szótár?
Képzeljünk el egy távoli jövőt, amikor elég csak begépelnünk, avagy még inkább kiejtenünk egy szót, és máris minden olyan információt megkapunk, amit egy nyelven belül el lehet mondani róla. Szótárakkal foglalkozó sorozatunk második részében az ötlet részletes leírását tárjuk az olvasók elé.
A korábbi cikkben röviden áttekintettük, hogy az értelmező szótárak milyen információkat tartalmaznak egy-egy szóról. Az elképzelt Nagy magyar e-szótárnak ezeket mind magában kell foglalnia. Olyan, mintha minden egyes szónak egyesével felfejthetnénk a történetét: kezdve azzal, hogy miként jelent meg nyelvünkben (etimológia), milyen formában (helyesírás, kiejtés), mit jelent (értelmezés), mire használjuk (stílusminősítés), egészen addig, hogy milyen szólások, közmondások ismertek vele kapcsolatban, vagy éppen mely írónk, költőnk élt vele előszeretettel. Az ötlet kivitelezése azonban számtalan buktatót rejt magában: most ezeket tekintjük át nagy vonalakban. Amennyiben Önben is felmerül olyan szempont, amit a szótár tervezése során szem előtt kellene tartani, kérjük, ne legyen rest azt kifejteni a honlapunkon található fórumban.
Hogyan találjuk meg azt, amit keresünk?
A Nagy magyar e-szótár egy olyan fiktív szótár, ami a magyar nyelv minden szavát tartalmazza, és minden tudnivalót összefoglal róluk. Másképpen fogalmazva az összes létező szótártípust egyesíti magában. Ez azt jelenti, hogy minden olyan szó megtalálható benne, amit az emberek használnak, függetlenül attól, hogy az nyelvileg helyes-e. Fontos azonban, hogy az olvasó tájékoztatást kapjon arról, mi a nyelvi norma szerint elfogadott: vagyis a szótárnak először is helyesírási szótárként kell működnie. Már az is tekinthető szűrőnek, hogy mi az, amire egyáltalán találatot kapunk a keresés során. Ha a keresés eredménytelen, az nemcsak azért lehet, mert hibás a begépelt alak, hanem azért is, mert a szó még nincs benne a szóanyagban. A szótárnak alternatívákat kell adnia a vélhetően keresett szóra, illetve az olvasónak lehetőséget kell adni arra, hogy javaslatot tegyen a szótár bővítésére.
Van véleménye az ügyben?
Ossza meg az olvasókkal a cikkről nyitott fórumtémában!
Vannak azonban olyan szavak, amiket többféle írásképpel használunk, azonban a helyesírás egyelőre csak az egyik formát tartja elfogadottnak. Például az SMS szót nagyon gyakran írjuk kisbetűvel, sms alakban, sőt akár fonetikusan is esemesként. Az e-szótárnak mindegyiket tartalmaznia kell, de jelezni kell, hogy melyik az előnyben részesített. Hasonlóképpen kell eljárni a szavak kiejtésénél is: első helyen kell szerepelnie az elfogadott ejtésnek írott és meghallgatható formában is, majd ezt követik a további használt, ám a nyelvi normától eltérő alakok (például a posta szó [pósta] ejtése). A szótárnak további helyesírási kérdésekben is el kell igazítania. Nem mindegy például, hogyan toldalékolunk egy szót. Gyakran jelent nehézséget a nyelvhasználóknak, hogy a kerete vagy a keretje alakot válasszák-e. De egy szó sor végi elválasztása sem olyan egyszerű, gondoljunk csak a guillotine-ra. Az e-szótárba tehát ezeket az elemeket is fel kell venni.
Így használd, használod vagy használhatnád
Ha sikeresen megtaláltuk a szót a szótárban, először arról kapunk tájékoztatást, hogy milyen közegben használhatjuk azt. A régebbi értelmező szótárak a magyar irodalmi és köznyelv szavainak leltározását tűzték ki célul, így például a nyelvjárások vagy a szleng kifejezései közül csak keveset vettek fel. Az sem mindegy, hogy ezeket hogyan tárták az olvasók elé. Lanstyák István cikkében részletesen elemezte A Magyar Nyelv Értelmező Szótára, illetve a Magyar értelmező kéziszótár (első és második kiadásának) nyelvművelő szemléletét. A hétkötetes mű összeállítása során az a cél vezette a szerkesztőket, hogy ne csak leírják, hanem minősítsék, sőt szabályozzák is a nyelvhasználatot. Erre szolgált a stílusminősítés, a helytelen alakok megcsillagozása, sőt csak a helyesnek ítélt kiejtés feltüntetése is. Kérdés, hogy miért vettek fel egyáltalán olyan szavakat a szótárba, amelyeket helytelennek ítéltek: azért, mert gyakoriak. A gond ezzel csak az, hogy ha a szótárban kerülendőnek minősítenek egy sokak által használt szót, azzal közvetve a beszélőt is megbélyegzik.
Egy ideális szótárnak úgy kell eligazítania az olvasót nyelvhasználati kérdésekben, hogy az ne legyen diszkriminatív. El kell különíteni mind a területi (nyelvjárások), mind a társadalmi (csoportnyelvek, szaknyelvek), mind a köznyelvi (írott és beszélt, sőt írott beszélt nyelv) változatokat, és a megfelelő stílusminősítésekkel kell ellátni őket. A dialektológusok a nyelvjárásokat különböző régiókra osztják aszerint, hogy mely területeken beszélik az adott változatot. Az e-szótár tervezése során meg kell határozni, hogy melyik felosztást tekintjük mérvadónak. A nyelvjárási szavak esetében egy térképen lehetne megtekinteni, hogy mely területeken használják őket – mint ahogy azt a nyelvjárási atlaszok tartalmazzák. A társadalmi változatoknál érdemes lehet visszanyúlni a régebbi szótárak minősítéseihez, de a magyarázatukat pontosítani kell – mint arra Lanstyák István is utalt. Az infokommunikáció térnyerésével a köznyelv számtalan új elemmel bővült. A chat és az SMS-írás során használt nyelvet írott beszélt nyelvnek is nevezik, hiszen a szövegek szerkezete a spontán beszédhez közelít, mégis írott formájúak. Ezek a szavak részei a magyar nyelvnek, ezért nem hiányozhatnak egy teljes magyar szótárból. Ráadásul online közegben tulajdonképpen terjedelmi korlátok sincsenek, így válogatás nélkül minden szót fel lehet venni – de mindenképpen utalni kell a használati körükre.
Mit tartalmaz a szótár?
Az e-szótár legfontosabb része a jelentések megadása, hiszen minden más erre épül rá. Értelmezni bármilyen szót lehet függetlenül attól, hogy az idegen szó, szlengszó vagy éppen új szó. A mai szótárak általában valamilyen szempont szerint gyűjtik egybe a szavakat, vagyis a nyelvnek csak egy-egy szeletét vizsgálják az adott kötetben. Ennek részben terjedelmi okai vannak, mivel csak véges számú szót lehet egy szótárban elhelyezni; részben természetesen üzleti szempontok is szerepet játszanak. Az e-szótárban elég csak stílusminősítésekkel utalni arra, hogy a kifejezés a szleng része, vagy éppen a nyelvünkben még meg nem honosodott, idegen szó. Az értelmezés során az aljelentések elkülönítését megkönnyíti a szófaj megadása. Például ha a link szó etimológiájára vagyunk kíváncsiak, más eredeztetést fogunk olvasni, ha az melléknév és mást, ha főnév. A szófaj megadása azonban nem mindig segít, ezért kell az értelmezésnek pontosnak és egyértelműnek lennie. Az egyes aljelentésekhez lehet utána hozzáadni a példamondatokat, szinonimákat, ellentéteket. Például a levél szónak ’elektronikus levél’ jelentésében szinonimája lehet az e-mail, a Süss nekem egy ízes levelet! mondatba azonban mégse helyettesíthetjük be.
Miután elkülönítettük az értelmezéseket, olvasható a szó etimológiája. A szótárnak adatot kell tartalmaznia arról, hogy az adott kifejezés mikor jelent meg nyelvünkben először írott formában. Ez alapján lehet olyan címkét létrehozni, hogy új szóról van-e szó. Fordítva azonban nem működik a dolog, hiszen a kéz is egyike legkorábbi szavainknak, mégsem mondhatjuk rá, hogy archaikus. Az etimológián belül továbbá meg kell jelölni egy átadó nyelvet, ahonnan a magyarba került a szó. Ez sokszor nem könnyű, mégis a szótár hipertextként való használhatósága szempontjából elengedhetetlen. Ezt követi az eredeztetés részletes kifejtése, majd a létrejött származékok hiperlinkekként.
Az etimológián kívül olyan szójárásokat, szólásokat és közmondásokat is fel kell tüntetni a szótárban, amikben a tárgyalt szó szerepel. Ezeken belül csak az alapszófajokat van értelme hiperlinkké tenni, vagyis igéket, főneveket, mellékneveket, számneveket. Ez részben megfelelne a mai nyomtatott szótárak kulcsszavainak, ám jóval több szót is ki lehetne emelni egy szóláson belül. A link egy olyan gyűjtőoldalra mutatna, ahol minden olyan szólás (közmondás, szójárás, vagy amit a szótárhasználó bejelölt mint keresett elem) megtalálható, amiben a tárgyalt szó szerepel. Például ha a bor szócikkét olvassuk éppen, ott megtalálhatjuk az összes olyan szólást, amiben ez a szó szerepel, többek között a bor megoldja valakinek a nyelvét mondást is. Ebben a megold igére kattintva a kettévágja [megoldja] a gordiuszi csomót szóláshoz jutunk, a nyelv főnévtől továbbindulva viszont a nyelvét koptatja kifejezéshez érünk el. A szójárások sokszor híres személyektől származnak: ilyenkor fel kell tüntetni, kitől ered a szófordulat. Hasonlóképpen közhasználatúvá válhatnak szépirodalmi idézetek is. A szó értelmének szemléltetése során a példák közül nem hiányozhatnak költők, írók szövegei sem.
A webes környezetnek köszönhetően a szótárat – a Wordnikhez hasonlóan – bővíteni lehetne képekkel, blogbejegyzésekkel és statisztikákkal. A Wordnik grafikont közöl arról, hogy az adott szó a századok alatt milyen gyakorisággal fordult elő. Emellett érdemes lenne azt is megmutatni, hogy a mai magyar nyelvben mennyire gyakori a keresett kifejezés. A magyar nyelvre már rendelkezésünkre áll egy olyan korpusz, ami reprezentatívnak tekinthető: ez pedig a Magyar Nemzeti Szövegtár. Természetesen kérdéses, hogy ezt fel lehetne-e használni a Nagy magyar e-szótárhoz, és milyen feltételekkel.
(Forrás: Leslie Watts/sxc.hu)
A webes környezet további előnyei
Egy e-szótár számos előnnyel rendelkezik a papír alapú szótárakhoz képest: gyorsan lehet benne keresni, korlátlanul bővíthető, könnyebb tárolni, és még papírra sincs szükség az előállításához. Hátránya természetesen, hogy csak a megfelelő eszközzel használható. Amiért mégis megéri, hogy olyan új lehetőségeket ad a webes környezet, amik egy nyomtatott szótárnál fel sem merülnek: ezek pedig az összetett keresés és a hipertextualitás. A Nagy magyar e-szótárat úgy kell létrehozni, hogy mindkét szempontnak eleget tegyen. Ha már rendelkezésünkre áll egy teljes adatbázis, úgy keresni lehessen benne a mai szótárkategóriáknak megfelelően is: tehát lehessen csak etimológiai szótárként használni, vagy csak 2000 után létrejött szavak után kutatni benne. A szócikkekben minden, ami csak lehet, hiperlinkként működjön: kilistázhatóak legyenek csak az azonos szófajú szavak; meg lehessen nézni, mely szavakat vettük át a törökből; együtt láthassuk a macska szóval alkotott közmondásokat.
A keresésnek látszólag csak a fantáziánk szabhat határt, azonban ez nem így van. Mint arra Aczél Petra is rávilágított előadásában: a hiperlinkek eleve adottak. A szótárban hatalmas választási lehetőséggel rendelkezne a szótárhasználó, mégis egy zárt rendszeren belül mozogna. Az internetes közegnek köszönhetően azonban a kutatók is profitálhatnának a szótárból: nem lenne szükséges nyomtatott szótárakat lapozgatva kigyűjteniük az információkat, hanem sokkal egyszerűbben hozzájuthatnának ahhoz, amit keresnek.
A megvalósítás nehézségei
Mint az a tervezetből is kitűnik, a Nagy magyar e-szótár előállítása hatalmas munkát és anyagi ráfordítást igényelne. A szótár anyagának jó részét azonban a mai nyomtatott szótárak már tartalmazzák. Kézenfekvőnek tűnik, hogy ezt az információhalmazt kellene felhasználni, a webes közegbe átültetni és bővíteni. Ám a szerzői jogok a kiadóknál vannak. Egy kiadó bevételének nagyobbik részét hazánkban ma még a nyomtatott könyvek eladása teszi ki. Ha a kiadványok tartalmát teljes egészében hozzáférhetővé tennék az interneten, az súlyos anyagi következményekkel járhatna a cégre nézve. Kivéve persze akkor, ha a kiadónak elég nagy mennyiségű bevétele lenne a projektből, vagy ha kellően nagy összegű külső támogatásban részesülne.
A másik lehetőség, ha újonnan kezdenénk el felépíteni egy ilyen adatbázist. Működhetne a Wikipediához hasonló elven: bárki tölthetne föl tartalmakat, ám lennének a szótárnak belső szerkesztői is, akik mindent átolvasnak és pontosítanak. Problémát jelenthet, ha az olvasók nyomtatott szótárakból másolnák be az információkat – ez még akár plágiumperbe is torkollhatna. Lehetne azonban a Wordnikhez hasonló elven is megvalósítani a szótárt: bizonyos tartalmakat csak a belső szerkesztők írhatnának meg, míg a többihez bárki hozzáférhetne, bár természetesen ezeket is lektorálni kellene.
A projekt kivitelezésének legnagyobb nehézsége azonban az anyagi háttér megteremtése. Bármelyik módon kezdjünk is hozzá, indulótőke nélkül aligha jutnánk előbbre. Az ideális az lenne, ha a szótár ingyenes lenne. Ám kérdéses, hogy a működtetéshez szükséges költségeket az oldalon lévő reklámfelületek eladása fedezné-e. Már ma is van olyan kiadó, ami pénzt kér az online szótárai használatáért. Elképzelhető, hogy a jövőben csak ezzel a módszerrel lehet majd igényes tartalmakat létrehozni az interneten.
Források:
Aczél Petra: MINDIGITÁLIS. Nyelv, kommunikáció és kultúra az újmédiában. Előadás a Szarvas Gábor napon. 2010. június 17.
Lanstyák István: A Magyar értelmező kéziszótár a nyelvhelyesség fogságában. Magyar Nyelvőr. 2003/4: 370–388.
Magyar dialektológia. Szerkesztette: Kiss Jenő. Osiris Kiadó, Budapest, 2003.