A nyelvek összehasonlíthatóságáról
Cikkünkből kiderül, hogy hogy a nyelvek közötti különbségeket igenis számszerűvé lehet tenni, s így össze is lehet hasonlítani őket – azonban nem érdemes. Mellékesen az is kiderül, hogy miért nem szabad megbíznunk a focibajnokságok eredménylistáiban, ugyanakkor miért nem kell mégsem bosszankodnunk azon, hogy igazságtalanul pontozzák a csapatokat.
Olvasónk, Sebi, nemhogy kérdéssel, valóságos felhívással fordult hozzánk:
Már régóta foglalkoztat, hogy vajon két nyelv közötti különbség nagyságát össze lehet-e hasonlítani két másik nyelv közötti különbség nagyságával. (pl. a spanyol és a portugál hasonló, de eltérő; a német és a holland is hasonló. Kérdés, hogy lehet-e olyat mondani, hogy a holland és a német közötti különbség hozzávetőleg azonos/ kisebb/ nagyobb, mint a sp.,pt. között)
Amennyiben létezik ilyen nyelvészeti módszer, szerintem megérne egy cikket.
Kit ne izgatna, hogy a román jobban hasonlít-e a franciára, mint a jiddis a svédre?
Természetesen vannak ilyen módszerek, és azt is ki lehet találni, hogy e módszerek mérésekre és számításokra épülnek (éppen ezért kvantitatív módszereknek hívjuk őket). A nyelvészet kompetenciája itt tulajdonképpen arra terjedhet ki, hogy mit számoljunk. Természetesen a különbségeket, na de melyeket és hogyan?
(Forrás: Wikimedia Commons / Pieni Tietosanakirja)
Az első kérdés, hogy szótárral és nyelvtanokkal dolgozzunk-e, vagy szövegekkel. Nem mindegy ugyanis, hogy egy jelenség mennyire gyakori – lehet, hogy egy szótárban egy szó különbözik, de nem mindegy, hogy ezeket a szavakat milyen gyakran használjuk: ha ritkán, alig van jelentősége, ha gyakran, fontos szerepe lehet. Hasonlóképpen a nyelvtanban: ha ez egyik nyelvben megvan egy eset, amelyik a másikból hiányzik, akkor is lehet, hogy ezt az esetet amúgy is ritkán használják, és nincs nagy jelentősége a dolognak, de az is, hogy gyakran, és a különbség nagyon nehezíti a megértést. Ha viszont szövegeket választunk, akkor nem mindegy, hogy ezek milyen témájúak: lehet, hogy két nyelvben a szakszókincs jobban vagy kevésbé tér el, mint a hétköznapi élet kifejezései, vagy éppen a szépirodalmi stílusban más a nyelvtani alakok, szerkezetek aránya, mint mondjuk a jogi szövegekben.
Akár a szótárakat és a nyelvtant, akár a szövegeket választjuk, az első nehézség, hogy tipikusan írott szövegekkel dolgozunk. Ezek nem mindig tükrözik az ejtésbeli különbségeket. Lehet, hogy két nyelvben ugyanúgy írnak egy szót, de nagyon különbözően hangzanak, de az is előfordulhat, hogy az írásmód különböző, viszont a hangzás azonos. (Ez utóbbinak extrém esete, amikor ugyanazt a nyelvet különböző írásokkal írják.) Persze a nyelv elsősorban a hangzó nyelv – de ha még fonetikus átírásokat vetünk össze, akkor is kérdéses, hogy két hang különbségét mennyinek számoljuk. Mondjuk ha az egyik nyelvben [b] van, a másik nyelvben [p], az ugyanakkora különbség, mintha a [b]-nek [f] vagy [h] felelne meg? Vagy ha az egyik nyelvben egy magánhangzó hosszú, a másikban rövid, akkor az ugyanakkora különbség, mintha egy teljesen más magánhangzó állna ott? (Továbbmenve: ugyanakkora különbség, ha az egyik nyelvben azért rövid a magánhangzó, mert abban a nyelvben hosszú magánhangzók nincsenek is, mint amikor vannak, csak éppen abban a szóban mégis rövid a magánhangzó?)
És máris beleütközünk egy paradoxonba. Mert szeretnénk azt hinni, hogy a nyelvek távolságának mutatója azt is jelzi, hogy e nyelvek beszélői mennyire értik meg egymást. Ha viszont egy különbség gyakran jelentkezik, akkor a számításban ennek köszönhetően magas különbségi értéket kapunk, viszont a valóságban ezt a különbséget a nyelvhasználók nagyon gyorsan felismerik, és nem zavarja őket a különbség. Például a finnek hamar hozzászoknak, hogy „az észtek gyakran elhagyják a szóvégi magánhangzót”, és ennek köszönhetően az ilyen különbségeket úgyszólván semmibe veszik. (Arról nem is szólva, hogy mi van, ha a két szó hasonló – de legalábbis azonos eredetű–, de mégis sok különbség van közöttük, illetve ha egészen más szót használ a két nyelv: hogyan vessük össze, ugyanakkorának számítsuk-e a különbséget, vagy vegyük figyelembe a minimális hasonlóságokat is? Ha két nyelv egészen különböző szót használ, de véletlenül mindkettő [v]-vel kezdődik, akkor ezt számoljuk hasonlóságnak? Vagy vehetjük-e extra különbségnek, ha a használt szavak hossza is jelentősen eltér?)
Ha a szavak szintjén vesszük a különbségeket, akkor is rengeteg kérdés merül fel. Például számoljuk-e, hogy egy szó azonos eredetű, vagy csak a hangzásbeli hasonlóságot figyeljük? De nem csak a szó alakja kérdéses, hanem a jelentése is. Lehet, hogy két szó ugyanúgy hangzik, csak más a jelentése. A jelentés is nagyon sokféleképpen különbözhet. Lehet, hogy ugyanannak a szónak két nyelvben egészen más a jelentése, lehet, hogy különböző, de hasonló (például az egyikben ’szarvasmarha’, de a másikban csak ’bika’, vagy az egyikben ’ló’, a másikban ’öszvér’), de az is lehet, hogy ugyanaz az alapjelentésük, de mások a mellékjelentéseik. (Ez utóbbinak például olyan következményei lehetnek, hogy egy szóvicc csak az egyik nyelven érthető.) De lehet, hogy különbség nem is a jelentésben, hanem a stílusban van. Ha egy közeli rokon nyelvünkön írt szövegben a kutyákat folyamatosan ebeknek neveznék, tökéletesen megértenénk, de mégis furcsának találnánk.
Ott van aztán a nyelvtan. A nyelvtanban nagyon sok minden különbözhet. Milyen különbségeket mérjünk? Vegyük a következő példát. Tegyük fel, hogy szövegeket hasonlítunk össze. Az egyik szó különbözik a két különböző nyelvű szövegben. A különbség oka kettős: az egyik az, hogy az egyik nyelvben az adott ige mellett a névszónak – mondjuk – tárgyesetben kell állnia, a másik mellett részes esetben (azaz más az ige vonzata), a másik az, hogy a két alak egyébként is különbözne. Most akkor ezt két különbségnek számoljuk, vagy csak az a fontos, hogy az adott mondatban a két szó különbözik? Ráadásul azt is figyelembe kell vennünk, hogy az alak egyébként létezik a másik nyelvben, vagy nem: az már komoly kérdés, hogy abban az esetben nagyobb a különbség, ha létezik (mert akkor félreértésekhez vezethet, különösen, ha más vonzattal az ige mást jelent), vagy ha nem (mert akkor az alak teljesen idegen a másik nyelv beszélői számára.
Mindez rámutat arra a problémára, hogy ilyen számításokkal arra az eredményre juthatunk, hogy például a román francia füllel idegenebb, mint a francia román füllel (vagy fordítva). Ez egyébként nem olyan meglepő, hiszen a svédek nehezebben értik a dán beszédet, mint a dánok a svédet, hiszen dán füllel a svéd körülbelül olyan, mintha a leírt dán szavakat betűről betűre kiejtenék – a svédek számára viszont olyan, mintha a dánok minden második hangot elfelejtenének kiejteni. (Aki figyelt, annak feltűnt az is, hogy a dánok azért értik jobban a svédet, mert a dán írás konzervatív, és nem a mai kiejtést tükrözi. Az írásnak tehát ilyen közvetett módon is szerepe lehet egy rokon nyelv megértésében.) Az olvasónk által kért kutatást elvégezve tehát juthatnánk olyan eredményre, hogy a román ugyan jobban hasonlít a franciára, mint a svéd a jiddisre, de a francia nem hasonlít annyira a románra, mint a jiddis a svédre...
(Forrás: Wikimedia Commons / Vaszilij Pukirev)
A fő gond azonban mégis az, hogy nincs egyértelműen jó megoldás arra, hogy ezt a sokféle különbséget miképpen osztályozzuk. Mi a nagyobb különbség: ha egy ige jelentése az egyik nyelvben ’eszik’, a másik nyelvben ’fal’, vagy ha az egyik nyelvben lehet mellette tárgy, a másik nyelvben nem? Vagy például mi a nagyobb különbség: ha az egyik nyelvben lehet az adott ige mellett tárgy, míg a másikban nem, vagy ha az egyikben lehet, de a másikban egyenesen kötelező? Ezekre a kérdésekre nincs pontos válasz. Ha valaki mégis ilyesmi méricskéléssel próbálkozik, juthat érdekes eredményekre, de ha valaki kicsit más pontozással mér, megint más eredményre juthat.
Mindenki ért a focihoz
Ez így túl bonyolult? Próbáljuk meg egy egyszerű példával megvilágítani. Tegyük fel, hogy focibajnokságot rendezünk: azt szeretnénk megtudni, melyik a legjobb csapat. A bajnokságban 12 csapat van, a jövő héten két olyan csapat játszik egymással, amelyik már játszott a többi tízzel. Meg szeretnénk tippelni, melyik az erősebb – feltételezzük, hogy az, amelyik eddig a legtöbbre vitte, közelebb áll a bajnokság megnyeréséhez.
A mérkőzéseket úgy pontozzuk, hogy aki veszít, nem kap semmit, döntetlen esetén 1 pont jár, a győztes pedig 2 pontot kap. Vegyünk két csapatot: az egyik tíz forduló során végig döntetlent játszott, a másik öt meccset megnyert, ötöt elvesztett. A pontozási rendszerünk alapján így mindkét csapat 10 pontot szerzett, tehát a bajnokság állása egyformán erős csapatoknak mutatja őket. Ugyanakkor a bajnokság szervezője mondhatja azt is, hogy a győzelmet többre értékeli, mint két döntetlent, és a győztes csapatnak 3 pont jár. Ebben az esetben a két csapat között jelentős különbség mutatkozik: az egyiknek ebben az esetben is 10 pontja van, a másiknak viszont 15. Az eredményeik ugyanazok, a két rendszer mégis egészen más erősségű csapatnak mutatja őket.
De számolhatunk úgy is, hogy a mérkőzésekre a csapatok nem kapnak pontot, csak a gólarányra figyelünk. Aki mindig döntetlent játszott, az az összesítésben is nyilván pont ugyanannyi gólt kapott, mint lőtt. Aki azonban hol nyert, hol vesztett, nagyon különböző eredményeket produkálhat: ha mindig sok góllal veszett, de csak kevés góllal nyert, sokkal rosszabbnak mutatkozhat az a csapat, mely az előző számításnál sokkal erősebbnek tűnt! De a gólarányokat is számolhatjuk különbözőképpen. Tegyük fel, hogy az egyik csapat a bajnokságban 4 gólt lőtt, és 2-t kapott, míg egy másik 10 gólt lőtt, de 8-at kapott. Itt számolhatunk úgy is, hogy mindkét csapat 2 góllal lőtt többet, mint kapott, tehát egyforma erősek – de úgy is, hogy az egyik kétszer annyi gólt lőtt, mint kapott, míg a másik a kapott gólok számának alig negyedével tudott több gólt rúgni.
Vegyük észre, hogy a focibajnokság esete sokkal egyszerűbb, mint a nyelveké, hiszen itt eleve számszerű eredményeket kell összehasonlítanunk: a mérkőzések gólarányát. Még bonyolultabb lenne a helyzet, ha figyelembe kellene vennünk a kihagyott helyzeteket, hogy mennyi ideig melyik térfélen tartózkodott a labda, vagy éppen melyik csapatnál volt – hogy az olyan kérdésekről ne is szóljunk, mint a játékstílus.
E számítások egyikére sem mondhatjuk, hogy eleve hibás, és nem alkalmas a csapatok erősségének meghatározására. Az azonban, hogy egy másik, szintén jó rendszer más erőviszonyokat mutatna, rávilágít, hogy a módszer mégsem igazán jó, hiszen más mérések más eredményt hoznak. Az egyetlen vigaszunk az lehet, hogy ha egy másik módszert választanánk, az sem lenne jobb. Ez megnyugtató lehet egy sportbajnokság esetében (ilyenkor a csapatok úgy választhatják meg stratégiáikat, hogy az adott pontozási rendszerben a legjobb eredményt érjék el), de nem megoldás a tudományban. Ki kell mondanunk: a nyelvek közötti különbség nem mérhető precízen.
@scasc: Köszönjük, javítottam!
Zseniális az utolsó elôtti illusztrációtok!
Viszont az elsô feliratába egy szerkesztési hiba csúszott: "...Melyik hasonlít legjobban a francia:a románra..." recte: Melyikre.