Hogyan tegyünk minél több információt egy szótárba?
Régóta létezik az az elképzelés, hogy egy nyelv szótára akkor lehet teljes, ha minden olyan információt tartalmaz, amit csak el lehet mondani egy szóról. A sorozat első részében a papír alapú értelmező szótárak és egy online változat adatait tekintjük át.
A mai olvasó, ha egy bizonyos szóról információkat szeretne gyűjteni, több dolgot tehet: először is levesz egy szótárat a polcról. Már ha van a közelben. Ha szótára nincs is, de azért internet-hozzáféréssel rendelkezik, keresgélhet egy online változatot. Na de mi történik akkor, ha nem tudja, hogy írják helyesen az adott szót? És esetleg kíváncsi az etimológiájára is? Sőt időközben felmerül benne, hogy a jelentését sem ismeri pontosan, és szeretne inkább egy szinonimát használni helyette a szövegben? S ha jól emlékszik, van vele egy szólásunk is… A sort még hosszasan folytathatnánk, mindenesetre a problémafelvetés rávilágít a lényegre: az ember ilyen esetekben csak sok-sok keresgélés és több szótár használata után tudna hozzájutni a szükséges ismeretekhez.
Papír alapú adattárak
Az ötlet korántsem új keletű: mind nyomtatott formában, mind elektronikusan létrehoztak már olyan szótárt, amibe a szerkesztők igyekeztek minél több információt belesűríteni. A papír alapú kiadványok előnye, hogy kézbe lehet fogni őket, és nem szükséges semmilyen más eszköz a használatukhoz (számítógép, internet, e-book olvasó stb.). A legtöbb szótárhasználó szembesült már azzal a pozitívummal is, hogy – miközben az adott szót keresi – óhatatlanul megnéz más szócikkeket is, így észrevétlenül bővül a tudása. Ugyanakkor éppen a lapozgatás következtében az információhoz jutásig eltelt idő nagyobb, mint egy elektronikus szótár esetében. Arról nem is beszélve, hogy a papír alapú kiadványok használatához az olvasónak az ábécébe sorolás szabályait is ismernie kell.
A szótárak legalapvetőbb típusa az értelmező. Bármilyen más szótárat használjunk is – amiben nem adják meg a szavak magyarázatát –, mindegyik feltételezi az olvasóról, hogy tisztában van a szavak jelentésével. Érdemes tehát először a magyar értelmező szótárakat szemügyre venni a tekintetben, hogy milyen információkat adnak meg egy-egy szóról. Az 1862 és 1871 között szerkesztett Czuczor–Fogarasi-féle A magyar nyelv szótára a szavakat az akkori ábécérendben közli. A címszavak mellett megadja azok szófaját, az egy szóhoz tartozó értelmezéseket számozással különíti el, a jelentéseket pedig szépirodalmi idézetekkel szemlélteti. Már ez a mű sem nevezhető kizárólag értelmezőnek, hiszen a szerkesztők nemcsak megmagyarázzák benne a szavakat, hanem az eredeztetésüket is részletesen taglalják – bár ezt a fajta etimológiai módszertant a tudomány máig vitatja. Szintén a 19. században jelent meg Ballagi Mórtól A magyar nyelv teljes szótára, amiben ugyan a szavak etimológiája nem szerepel, ám a szépirodalmi idézetekből vett példákon túl szójárások, szólások és közmondások egészítik ki az értelmezéseket. A szerző helyenként zárójelbe tett rövidítésekkel utal arra, hogy mely szaknyelvhez tartozik az adott kifejezés.
Hasonló módon épül fel a hétkötetes, 1959 és 1962 között kiadott A Magyar Nyelv Értelmező Szótára, ebben azonban már a szavak kiejtését, elválasztását is feltüntetik. A stílusminősítések a nyelvváltozatok szélesebb körét fogják át, mint a Ballagi-féle szótárban, ilyen például a bizalmas vagy a hivatalos jelölés. A nyelvhelyességi szempontból kifogásolhatónak vélt szavak után csillagot tettek.
Az először 1972-ben kiadott Magyar értelmező kéziszótár első kiadását is e nyelvművelő szemlélet keretében állították össze. Amit azonban mindenképp meg kell jegyezni ezzel a szótárral kapcsolatban, hogy utalást tartalmaz a szavak etimológiájára: a szócikkek végén szögletes zárójelben tüntetik fel az átadó nyelv nevét. Amennyiben nemzetközi szóról van szó, azt az nk. rövidítéssel jelölik. A szótár 2003-ban megjelent második kiadása a magyar szótárirodalomban elsőként adatokat is megad a szavak gyakoriságáról. A mutatót a Magyar Nemzeti Szövegtár (MNSZ) segítségével hozták létre. Az MNSZ jelenleg 187,6 millió szövegszót tartalmaz, és „a mai magyar írott köznyelv általános célú reprezentatív korpusza kíván lenni” – mint az az MTA Nyelvtudományi Intézetének oldalán olvasható. Tehát a szövegek válogatása során a készítők ügyeltek arra, hogy a különböző stílusú szövegek megfelelő arányban szerepeljenek a szövegtárban. A Magyar értelmező kéziszótár gyakorisági adataihoz a szerkesztők innen válogattak össze egy olyan szövegkorpuszt, ami reprezentatívnak tekinthető. A szótárban ez alapján a gyakoriságot ötfokú skálán jelölik a ritkától a leggyakoribb szavakig.
Az eddig tárgyalt szempontokat mind ötvözi magában az Értelmező szótár+, amely egyedinek tekinthető az értelmező szótárak sorában. Nemcsak a jelentéseket adja meg, hanem gyakorisági adatokat, állandósult szókapcsolatokat, szólásokat és közmondásokat is. Emellett szerepelnek benne szinonimák, ellentétek, és egy mondatban összefoglalja a szavak etimológiáját is. A szócikkek belsejében olvashatunk a nyelvhasználatra vonatkozó tanácsokat, ami tükrözi a szerkesztők szemléletét: vagyis hogy a nyelv szavait nem csupán egybe akarták gyűjteni, hanem ajánlásokat is tettek azok alkalmazására.
Bár sokféle információt tartalmaznak napjaink papír alapú szótárai, hátrányuk mégis maga a formátum. Könnyen belátható, hogy ha a magyar nyelv több százezer szavát szeretnénk ilyen módon egybegyűjteni, az csak hatalmas mennyiségű kötetben férne el. Nem elég, hogy nagyon sok papírra lenne szükség a kinyomtatásukhoz, és térre a tárolásukhoz, ráadásul csak azon kevesek juthatnának hozzá, akik meg tudnák fizetni. Márpedig egy ilyen szótár a nagyközönségnek szólna, így számukra is elérhetővé kellene tenni. Arról nem is beszélve, hogy egy nyelvben folyamatosan születnek, illetve honosodnak meg új szavak: mire a szótár utolsó kötete elkészülne, az egész munkát kezdhetnék elölről.
Az online környezet lehetőségei
Egy ilyen nagyszabású munkát a mai technikának köszönhetően érdemes inkább elektronikus formában megvalósítani. Ezen az elképzelésen alapul az az oldal, ami Erin McKean 2007-ben nyilvánosságra hozott ötletéből született. A szótár 2009. június 8-án indult el – mint arról a Nyelv és Tudomány portál is hírt adott. A szerkesztőgárda célkitűzése: minden szót felkutatni, és mindent elmondani róluk, amit csak lehet. A Wordnik ígéretes vállalkozás a témában, hiszen a szavak jelentésén túl – természetesen példamondatokkal szemléltetve – megadnak szólásokat, szinonimákat, ellentéteket, sőt a szavak etimológiáját is. Mindez még az Értelmező szótár+-hoz hasonló felépítést jelent, ugyanakkor néhány olyan funkcióval is rendelkezik a szótár, amit csakis az online környezet tesz lehetővé. Így például a szavak kiejtését nemcsak a nemzetközi fonetikai ábécé szerinti átírással olvashatjuk, hanem meg is hallgathatjuk; nézegethetünk képeket a Flickr.com-ról; böngészhetünk Twitter-blogbejegyzések között, továbbá statisztikákat is elemezhetünk. A szótár jelenleg közel 1,7 millió szót tartalmaz, és folyamatosan bővül.
A Wordnikbe bárki javasolhat újabb szót, amit a szerkesztők felvesznek a szótár anyagába. Sőt a bejelentkezett felhasználók jegyzeteket is fűzhetnek a tartalmakhoz, saját kiejtést rögzíthetnek egy-egy szónál, címkéket adhatnak hozzá, és bővíthetik a kapcsolódó kifejezések listáját. A szótár tehát részben beilleszkedik a szabadon szerkeszthető tudásbázisok sorába, ugyanakkor a Wikipediával ellentétben a lényegi tartalmakat a lexikográfusok teszik közzé. Ezzel megelőzhető az, hogy pontatlan információk kerüljenek bele. Ami azonban ennél fontosabb kérdés, hogy a Wordnikbe válogatás nélkül minden szót felvesznek. Ez annyit tesz: nem számít, hogy a szó nyelvtanilag helyes-e, vagy éppen melyik stílusrétegbe tartozik, kivétel nélkül minden belekerül a szótárba. „A Wordnikben azt mutatjuk meg, hogyan használják az emberek valójában a nyelvet, nem pedig azt, hogyan szeretnénk, hogy használják – olvasható a gyakori kérdésekre adott válaszok között. – Csak azért, mert egy szó szerepel a Wordnikben, nem jelenti azt, hogy használd is!” Vagyis a szótár leíró jellegű, nem pedig előíró. Nem lenne ezzel semmi probléma, ha feltételezzük, hogy a Wordnik használói rendelkeznek a kellő tudással, és képesek az információkat megfelelően kezelni. Azonban egy tizenéves vagy még inkább egy nyelvtanuló – és erre az angol mint világnyelv esetében mindenképpen gondolni kell – nem ismeri olyan szinten a nyelvet, hogy útbaigazítás nélkül szelektálni tudjon a kifejezések között, így az információk félrevezetőek lehetnek.
Érdemes a helyesírás felől is szemügyre venni a Wordniket. Ha a felhasználó a keresőfelületen elkezd egy szót beírni, a program kilistáz lehetőségeket, amik közül választani lehet. Fölöttébb hasznos megoldás, például ha az ember nem tudja, hogy a sentence szót hogy írják. Ugyanakkor beírhatja téves formában is (*sentense), és a szótár – értelmezést nem, de – megannyi példamondatot fog adni rá. Ha a Wordnik névből nem lenne egyértelmű, és mégis szimpla v-vel gépelnénk be a *vord szót, szintén kapunk példamondatokat, továbbá felteszik nekünk a kérdést, hogy vajon nem a cord szóra gondoltunk-e. Ebből már nyilvánvaló, hogy a Wordnik mint helyesírási szótár nem állja meg a helyét. Igaz, nem is ezzel a céllal hozták létre. Ám ha tovább keressük cikkünk következő részében egy teljes magyar szótár megalkotásának kritériumait, idővel ez is fontos lesz.
Források:
A Magyar Nyelv Értelmező Szótára. Főszerkesztő: Bárczi Géza – Országh László. Akadémiai Kiadó, Budapest, 1959–1962.
A magyar nyelv szótára. Szerkesztette: Czuczor Gergely – Fogarasi János. Emich Gusztav, Pest, 1862–1871.
A magyar nyelv teljes szótára. Szerkesztette: Ballagi Mór. Heckenast Gusztáv, Pest, 1868.
Értelmező szótár+. Értelmezések, példamondatok, szinonimák, ellentétek, szólások, közmondások, etimológiák, nyelvhasználati tanácsok és fogalomköri csoportok. Főszerkesztő: Eőry Vilma. Tinta Könyvkiadó, Budapest, 2007.
Magyar értelmező kéziszótár. Szerkesztette: Juhász József – Szőke István – O. Nagy Gábor – Kovalovszky Miklós. Akadémiai Kiadó, Budapest, 1972.
Magyar értelmező kéziszótár. Főszerkesztő: Pusztai Ferenc. Második, átdolgozott kiadás. Akadémiai Kiadó, Budapest, 2003.