A méret számít?
Mitől függ, hogy egy adott nyelven milyen hosszú lesz egy szöveg? Mit is kell mérnünk, és miért? Miért érezhetünk egy szöveget rövidebbnek vagy hosszabbnak? Van-e nyelvészeti vagy más jelentősége a kérdésnek? Ismét egy olvasónk levelére válaszolunk.
Igor nevű olvasónk a következő kérdést tette fel:
Már sok érdekes témát dolgoztak fel olvasói kérdések alapján, ezért gondoltam szerencsét próbálok. Engem az érdekelne, hogy történtek-e kisérletek, hogy meghatározzák bizonyos nyelvek hosszát? Persze, itt elsősorban az írott nyelvre gondolok, és tudom, hogy nem minden betűt ejtenek ki, ami le van írva. Azzal is tisztában vagyok, hogy ez relatív. Egy nyelvben az egyik mondat rövidebb, míg egy másik mondat hosszabb lehet, mint egy másik nyelvben, de úgy gondolom, hogy egy terjedelmesebb könyvnek a különböző nyelvű fordításaiból elég jó átlagérték kapható. Kiváncsi lennék, hogy az európában beszélt nyelvek milyenek ebben a tekintetben. Azt gondolnám pl. az angolokról, hogy ők rövidebben fejezhetnek ki dolgokat, de az oroszról meg a finnről ránézésre azt tételezném, hogy hosszabban, és persze, érdekel hol áll ezen belül a magyar, baszk, német, török, spanyol stb. Félre ne értsenek, tudom, hogy egy nyelv hosszúsága nem jelent semmit, csak érdekesnek találnék egy ilyen felmérést. Előre is köszönöm a választ.
Bevalljuk, először kissé megijedtünk, mert fogalmunk sem volt, mi az, hogy a „a nyelv hossza”. Szerencsére az olvasó érthetően kifejti, mire is gondol: arra, hogy egy adott, változatlan tartalmú szöveg milyen hosszú lesz annak köszönhetően, hogy milyen nyelvre fordítjuk. Az olvasónak igaza van, amikor hosszabb könyvre gondol, mert rövidebb szövegeknél a véletlen is nagy szerepet játszhat, például hogy tesztmondatunkban magyarul a kutya vagy az eb szót használjuk, vagy a megfelelő angol mondatban a dogot vagy a canine-t. Hasonló a helyzet a nyelvtani alakokkal: az adj és az adjál szabadon felcserélhetőek, de hosszuk eltérő. Ha a kiinduló mondat angol nyelvű, akkor nem mindegy, hogy magyarra tegező vagy magázó formával fordítjuk-e (vágsz, de vágtok). Azt viszont már okkal feltételezhetjük, hogy az ilyen különbségek hosszú távon kiegyenlítődnek.
Könyvvel könnyebb?
Nagyobb probléma az, hogy mit számolunk. Egy könyv esetében célszerű lenne az oldalszámot nézni, de ennek nyilván csak akkor van értelme, ha azonos betűmérettel számolunk. Igen ám, csakhogy a különböző írásrendszerek azonos betűméret esetén is különböző helyet foglalnak el. Míg a latin betűk között van jópár keskeny (f, i, j, l, t), addig a cirill betűk mind szélesek: a lift betűsor sokkal kevesebb helyet foglal el, mint a лифт. (És akkor ne is beszéljünk az ezektől sokkal inkább eltérő írásrendszerekről!)
Az sem segít, ha nem az elfoglalt helyet nézzük, hanem a betűk számát. Mert ha könyvről beszélünk, elsősorban arra gondolnunk, hogy olyan kiadványról van szó, mely az adott nyelv helyesírását használja. Márpedig ami a nyelvben azonos hosszúságú, az írásban különböző is lehet. Gondoljunk arra, hogy a magyarban a sós és szósz szavak egyaránt egy szótagból és három hangból állnak, de míg az előbbit három karakterrel írjuk le, az utóbbit öttel. Öt karakterrel azonban három szótagos, öt hangból álló szavakat is leírhatunk: arató.
Hangmérők
Jó, akkor maradjunk annyiban, hogy a beszédhangokat számoljuk! Ennek azonban az lesz az eredménye, hogy a kabala és a sószóró egyaránt hat hangból és három szótagból áll, de nyilvánvaló, hogy az utóbbi hosszabb, hiszen a hosszú magánhangzó hosszabb ideig tart, mint a rövid. Na de mennyivel? Számoljuk kettőnek? Vagy másfélnek? Az a baj, hogy a mérések azt mutatják, hogy a hossz valójában ingadozó. Ráadásul a mássalhangzók képzési ideje is eltérő. A legjobb, ha nem is a beszédhangokat számláljuk, hanem felolvastatjuk a szöveget, és lemérjük, mennyi ideig tart.
Persze ennek csak akkor van értelme, ha az olvasó azonos tempóban olvas. De hogyan biztosítjuk, hogy két különböző nyelven azonos legyen a tempó. Hogyan mérjük az olvasás tempóját? Tipikusan karakter/percben vagy beszédhang/percben szokták... Megint ott vagyunk, ahol a part szakad.
Szavak és részeik
Mondhatnánk arról is valamit, hogy egy nyelvben mekkora az átlagos szóhossz. Vegyünk két ugyanolyan kaliberű szótárat egy-egy nyelvből, és számolgassunk. Na de mit? Ezzel megint óvatosnak kell lennünk: nem mindegy – a fentiek értelmében – hogy beszédhangokat, szótagokat vagy karaktereket számolunk. Aztán nem árt, ha észben tartjuk, hogy a szótár alapján csupán a szótövek átlagos hosszáról (bármiben is számoljuk) kapunk adatokat, a szóalakokéról nem. És itt jön a következő nehézség.
A nyelvek „hosszáról” kialakult intuíciónk nyilvánvalóan nem a szótári tövek hosszán, hanem a szövegben használt szóalakok hosszán alapul. Itt azonban nagy eltérések lehetnek a nyelvek között attól függően, hogy az adott nyelv milyen alaktani nyelvtípusba tartozik. Az izoláló nyelvek (amilyen például az angol) gyakorlatilag alig toldalékolnak, egy-egy szónak kevésféle alakja van: in the water (’a vízben’). Benyomásaink szerint több, rövidebb egység. Ha azonban egy nyelv (mint például a magyar) agglutináló, akkor egy-egy szónak nagyon sokféle alakja van, a szavakat különböző toldalékokkal tudjuk hizlalni: el-gond-ol-kod-tat-hat-ná-tok. Ha egy nyelv az úgynevezett inkorporáló típusba tartozik, akkor pedig akár mondatnyi hosszúságú szóalakok is előfordulhatnak benne, mert minden nyelvtani információ egyetlen alakban tömörül. Az már kérdéses azonban, hogy ez milyen irányban befolyásolja a hosszúságról alkotott intuíciónkat.
Elképzelhetőek olyan mondattani jelenségek is, amelyek befolyásolhatják a hosszról alkotott elképzeléseinket. Ilyen lehet például a nyelveknek az a tulajdonsága, hogy el lehet-e hagyni belőlük a különböző nyelvtani szerepű személyes névmásokat. A magyar olyan nyelv, amelyben szinte kötelező is elhagyni a harmadik személyű alanyi szerepű névmásokat, hacsak nincs a mondatban kiemelés (például fókusz):
Pista elment vásárolni. Megvette az utolsó kenyeret. Amikor kilépett az üzletből, már zártak is.
Ebben a szövegben tudjuk, hogy mindhárom mondat alanya Pista – anélkül, hogy akár a nevét, akár a rá utaló személyes névmást (ő) kitennénk a mondatban. csak akkor tudjuk kitenni, ha valamit hangsúlyozni akarunk, ha Pistát szembe akarjuk állítani másokkal:
Pista elment vásárolni. Ő vette meg az utolsó kenyeret. Amikor kilépett az üzletből, már zártak is.
Ebből a leírásból az derül ki, hogy Pistának akadtak vetélytársai, akik elől ő happolta el az utolsó kenyeret.
Tehát a magyarban az alanyi szerepű személyes névmás kihagyása kötelező, ha nincs ilyenfajta szembeállítás. Sőt, a magyarban olyan eset is előfordul, amikor akár a tárgyi szerepű névmást is el tudjuk hagyni: Utállak. Ebben az egy szóalakban benne van az, hogy az alany egyes szám első személyű, és a tárgy egyes szám második személyű.Az olyan nyelveket, melyekben a (személyes vagy mutató) névmás elhagyható, a szakirodalomban pro-drop nyelveknek: a pro az angol pronoun ’névmás’ rövidítése, a drop pedig (ebben az esetben) ’(ki)dobás’-t, ’(ki)ejtés’-t jelent.
Ugyanezt angolul nem tudjuk megtenni: minden esetben ki kell tenni mind az alanyi, mind pedig a tárgyi szerepű személyes névmást: I hate you. Ami magyarul egyetlen szóalak volt, az angolul egy háromszavas mondat. Elképzelhető tehát, hogy a nyelveknek ez a névmáselhagyhatósági tulajdonsága is befolyásolja a hosszúságra vonatkozó intuíciót.
Az azonban továbbra is kérdéses, hogy milyen irányban. Melyik tűnik hosszabbnak (nagyobbnak): ha valami több kisebb egységből áll, vagy az, ha valami kevesebb, de hosszabb egységből épül fel? – Pszichológiai vizsgálatok választ adhatnak erre a kérdésre, és a nyelvre vonatkozó beszélői intuíciót általános kognitív elvekkel magyarázhatják.
Összefoglalás
Láthatjuk tehát, hogy olvasónknak igaza van: akármit is mérünk, nyelvészeti szempontból nem túl érdekes kérdés, hogy ugyanaz a szöveg különböző nyelveken milyen hosszú. Éppen ezért nem csodálkozhatunk azon, hogy a nyelvészek ilyen irányú kutatásokat nem igazán végeztek. Ez azonban nem jelenti, senkit nem érdekelnek ezek a problémák: vannak, akik számára igen fontosak.
Elég, ha egy könyvkiadóra gondolunk: ha egy idegen nyelvű könyvet szeretne magyarul kiadni, akkor tudnia kell, hogy az várhatóan milyen terjedelmű lesz. Hasonló probléma merül fel a filmek feliratozásakor, vagy éppen a weboldalak fordításakor. A témára a neten rákeresve leginkább ilyen oldalakat találunk. különösen az utóbbi téma népszerű. Olvasónk kérdése tehát egyáltalán nem mondható érdektelennek, csak nem elsősorban nyelvészeti kérdés.Az 1917-es orosz helyesírási reform eltörölte az addigra funkciótlanná vált szóvégi ъ betűt, mely egyes mérések szerint a szöveg 3,5%-át foglalta el.
www.nyest.hu/hirek/minel-gyorsabb-egy-nyelv-annal-kevesebbet-mond
Az angolban gyakran elhagyjuk a személyes névmást, főleg egyes szám első személyben, pl simán mondhatom valamire reagláva, hogy 'never heard of it' persze tudom ez nem ugyanaz a helyzet, de lehetséges.