Ha gyakori, akkor rövid?
Bármilyen meglepő, de van összefüggés a szavak hossza és gyakorisága között. A gyakori szavak rövidülnek – méghozzá sokkal gyorsabban, mint képzelnénk.
„Egy olvasó” fedőnevű olvasónk írja:
Néhány európai nyelvvel (felszínesen) megismerkedve arra figyeltem fel, hogy a feltételezhetően őseink által is gyakran használt szavak a legrövidebbek, egy-két szótagosak (íj, vad, víz stb.). A kérdésem az volna, hogy ez szabályszerűnek tekinthető-e, több nyelvben is érvényes-e ez a megfigyelés, vagy csak statisztikai mintavételezési hiba (értem ezalatt pl. a szavak nagy része rövid, következésképpen a régen használt szavak nagy része is rövid).
Olvasónk nem téved nagyot, amikor arra keresi a választ, hogy mi köze van a szavak átlagos hosszúsága és használata között. Annyi az igazság a megérzésében, hogy a gyakori szavak átlagos hossza rövidebb, mint a ritkáké. (Viszont vannak igen ritka rövid szavak is, például az ír ’(gyógy)szer’.) Ez minden nyelvben mindig érvényesül, tehát az őseink által használt igen gyakori szavak nyilván rövidebbek voltak az ő idejükben, és ha fennmaradtak, akkor ma is rövidek, még ha ma igen ritkák is (ezért nem szerencsés példa az íj és a vad: lehet, hogy ezek valaha gyakoriak voltak, de ma nem).
Mi az oka a gyakori szavak rövidségének? Meggyőződésem, hogy a nyelv általános sajátosságainak (az ún. univerzáléknak) a gyökereit a nyelv használatában és a nyelvhasználók, az emberek szervi és idegrendszeri felépítésében kell keresni. Így például a hangtani univerzálék egyrészt a hangképző szerveinknek és a hallószervünknek a törvényszerűségeiből fakadnak, másrészt abból, hogy az idegrendszerünk hogyan befolyásolja a beszédtevékenységünket és azt, ahogy a beszédet felfogjuk, feldolgozzuk. Ezek a tényezők magyarázzák azt is, hogy melyek a tipikus nyelvi változások, és a tipikus változások magyarázzák azt, hogy milyen a nyelvek tipikus felépítése.
Ha mindez igaz, tehát hogy a gyakori szavak rövidebbek szeretnek lenni, és hogy ezért az emberi szervezetet és a nyelvhasználatot kell felelőssé tenni, akkor úgy kell állnia a dolognak, hogy van egy tipikus nyelvváltozási irány, amely a gyakori szavak rövidülésében nyilvánul meg (és nem szabad tipikusnak lennie az ellenkező irányú változásnak, gyakori szavak nyúlásának vagy ritka szavak rövidülésének). Azt gondolom, hogy ez így is van. Az a tipikus változás, amely a gyakori szavak rövidüléséhez is vezet, a már sokat emlegetett gyengülés (leníció).
A gyengülésről korábbi válaszaimban mindig elmondtam, hogy rövidüléshez, egyszerűsödéshez vezet, és hogy olyan nyelvi formákat érint, amelyek kevéssé informatívak, például hangtanilag nehezen felismerhetőek, vagy más szempontból nem hordoznak elég fontos információt. Mi köze ennek a gyakorisághoz? Az információelmélet alapjaihoz tartozik, hogy az információérték összefügg a váratlansággal. A gyakoribb jelenségek kevésbé informatívak, mint a váratlanok. Ezt persze nem úgy kell érteni, hogy a gyakoribb szavak általában nélkülözhetők vagy akár elhagyhatók lennének. Viszont ha egy szónak csak egy részletét halljuk (pl. az elejét, vagy csak a magánhangzóit vagy csak néhány jellemző hangját), akkor könnyebben azonosítjuk valamelyik gyakori szóval, előbb ugrik be róla gyakori szó, mint ritka. Ezért a gyakori szavakból könnyebb hangokat vagy más jellemző vonásokat elhagyni anélkül, hogy az érthetőséget ez zavarná. Gondoljunk csak arra, hogy például a köszönések vagy a káromkodások milyen szívesen rövidülnek (szasz, ’pot, baeg), hiszen a kimondás környezetéből és néhány jellemző hangból mindenkinek azonnal beugrik, hogy mit is akartunk mondani.
Érdekes kísérleti bizonyítékok is mutatják a gyakoriság és a rövidülés összefüggését. Carol Fowler professzor például már az 1980-as években kimutatta, hogy ha a beszédünkben egy szó többször ismétlődik, akkor az egymás utáni előfordulásaiban egyre rövidebben ejtjük. Vagyis a rövidülés nemcsak a nyelvi változásokban figyelhető meg, hanem egészen kicsi időskálán is, és ennek a rövid távú rövidülésnek valószínűleg egészen alapvető neuronális alapjai vannak.
A cikk utolsó bekezdését mellékvágánynak érzem. Rövid távon a szavak egészen máshogyan rövidülnek, mint hosszú távon. Egyrészt a szavak első említésekor lehet, hogy még direkt lassan is ejtjük őket, hogy jól értse a hallgató. Másrészt ez olyan csak, mint a szerződések szövege: "a Microsoft Magyarország Korlátozottan Felelősségre-vonható Társaság (a továbbiakban: Társaság)". Arra épül, hogy az adott beszélgetésben egyszer már egyértelműen elhangzott a jelölt. A jelölő tehát az adott felek számára kényelmesebb módon is meghatározható. A szavak abszolút hossza egészen más tészta, ott nem azonosítjuk őket mindig, sőt egy szó értékét rontja, ha mindig el kell magyarázni, mire gondoltunk.
@ocs: "link"
Szerintem nem betűket kellene vizsgálni, a betű csak a beszéd hevenyészett kifejezője. Például a franciák 8 betűvel írják, hogy Rousseau, de kiejtve ez csak két szótag. Ha fonetikailag vizsgálódnának, akkor talán egészen szép összefüggések is kijöhetnének.
"But I'm still waiting for an explanation of Geschwindigkeitsbegrenzung."
Ez megint logikai hiba. A Geschwindigkeitsbegrenzung két képzett szóból alkotott összetett szó, tehát legalább négy elemre bontható, amelyek viszonylag rövidnek számítanak (geschwindig, keit, begrenzen, ung). Ezen kívül vannak olyan nyelvek, amik szimplán így épülnek fel, hosszú szóösszetételekkel dolgoznak, ott a szó definíciója sem feltétlenül használható. Tehát a szavak hosszúságára vonatkozó összefüggés sem. - Annak viszont lehet némi kommunikációs háttere, hogy nem ezek a nyelvek a dominánsak.
"the most efficient use of language, taking into account frequency, informative value, and word length."
Képzett szavakra elsősorban a gondolkodásunk, a memóriánk miatt van szükség. Egy olyan nyelvet, amiben csak rövid szavak vannak, nehéz lenne megtanulni, hiszen két rövid szóból nem képezhetnénk egy hosszabbat, hanem arra meg kellene tanulni a saját rövid nevét. Tehát a nyelvhasználat hatékonyságánál nem elég az adott kommunikációs helyzetet nézni, a kommunikáló belső működése is beleszámít a rendszerbe.
@ocs: danke, ilyesmire gondoltam.
@ocs: által ajánlott cikk vége:
..."the most efficient use of language, taking into account frequency, informative value, and word length. The use of language will become less efficient as you use words that are less frequent. So for maximal communication? Small words.
But I'm still waiting for an explanation of "Geschwindigkeitsbegrenzung".
Najó, lefordiccsuk: a legsikeresebb nyelvhasználat figyelembe veszi a gyakoriságot, a közlés-értéket és a szavak hosszát. A nyelvhasználal kevésbé effektív (átütő, klassz) lesz akkor, ha nem gyakori szavakat használunk. Tehát a legoptimáliabb kommunikáció? A rövid szavak (-kal valósul meg).
DE ÉN MÉG MINDIG várok a (most rémhosszú német szó jön) a sebességkorlátozókra.
***
Az ősnyelv (protonyelv - nevezd, aminek akarod) azonban még
NEM kihegyezett fogalmakból alkotta a ma is meglevő rövid (magyar, héber, arab, szanszkrit, dravida, sőt a finn) GYÖKszavakat, hanem a természeti (film)jelentek hangmellékleteit utánozta - az általában egyetlen SZÓTAGÚ szavakkal.
S ezek a gyökszavak egész (film)jeletetekre utaltak. :
MAR-morog (vadállat, támad is, morog is, meg is eszi),
drrr-dörög az é (villog is, esik is az eső, stb.),
HAL (halott, halál), lefekszik, kihűl, de megenni hasznos, stb.
PE-FEJ, felfelé, a fa is, a szopós gyerek is fej-i az anyját, stb.
rá-rossz,
vitte-water-Wasser- viszi-víz,
asz-osz (csinál)-esz(ik),
passzol-fesz-fasz-feszültság
nyél-nyál-nyel-nyolc (kinyúlik), s persze a mansi: n'ololov ugyaninnen származik.
az át-ét(el)-út-üt, ugyancsak legősibb szavaink, s MINDEN gyöknyelvben megvannak ma is.
Nagyon RÖVIDEK.
Ezek a szavak tehát akár több tízezer évesek is lehetnek - máig léteznek s a ma is élő gyöknyelvekben (magyar-héber-arab-szanszkrit-dravida-finn) hasonló alakban használjuk őket MINDEN NAP ma is.
150 évvel maradtál le, magyar (=indoeurópai, =finnugor) nyelvtudomány.
@gligeti: scientopia.org/blogs/scicurious/2011/03/14/how-long-is-that-word-as-
plusz a benne idézett cikk, és társai pl.
Ja, meg persze a szanszkrit, dravida, héber, arab (finn:-))))))))))gyökszavak is mind nagyon rövidek,
ráadásul az értelmük is meg mind hasonló a magyar... (jajjaj, a magyarra nézve nem szabad itt kiírnom)...szavakkal.
Ez az, amit még nem vizsgáltál meg a logaitmus mínusz egyszeresével.
A sumer írás ugye egyszótagúakból áll... :-)))))))))))).
illetve első körben nyilván az érdekel, vizsgált-e már valaki ilyesmit, mert kézenfekszik...
Érdemes lenne megvizsgálni, hogy számszerűen mennyivel is rövidebb egy gyakori szó -- az információelmélet szerint egy adott "token" ideális hossza a valószínűségének (azaz a gyakoriságának) logaritmusával (pontosabban annak mínusz egyszeresével) arányos. Kíváncsi lennék, ez a nyelvben is igaz-e, mint tendencia.