A magyar a legfurcsább nyelv?

Azt gondolnánk, tudományos szempontból nem lehet furcsa nyelvről beszélni. Pedig lehet, csak megfelelő módszert kell választani a furcsaság mérésére.

nyest.hu | 2013. június 26.

Számunkra furcsa nyelv a kínai, melyben csak egy szótagú szavak vannak, és attól is függ a jelentésük, hogy milyen dallammal ejtjük őket. Az inuit nyelvet szintén tarthatjuk különlegesnek, mert egy szóban képes kifejezni olyan dolgokat, amilyeneket mi csak több szóval: bonyolult mondatokat lehet egy szóba tömöríteni. De az angol anyanyelvűek számára nyilván az is furcsa, ahogy mi toldalékoljuk a szavakat. Mindenki számára elsősorban az a furcsa, ami másként van, mint a saját anyanyelvében. De attól még, hogy egy nyelv sok mindenben különbözik a másiktól, sokban hasonlíthat is. Hogyan döntjük el, hogy melyik a „legfurcsább”? Lehet-e erre a kérdésre tudományosan megalapozott választ adni?

Úgy tűnik, lehet. Az Idibon nevezetű San Francisco-i nyelvtechnológia cég munkatársai ezt kísérelték meg. Alapul a The World Atlas of Language Structures (WALS, A nyelvi szerkezetek világatlasza) adatbázisát vették. Az atlasz 192 térképlapon ábrázolja a nyelvek különböző tulajdonságait: összesen 2676 nyelvet vizsgálnak, de nincs adat minden nyelv minden tulajdonságáról – sőt, bizonyos nyelvekről ighgen kevés információ áll rendelkezésre. A kutatást tehát 165 olyan kérdésre korlátozták, melyre legalább száz nyelvből van adat, és kizárták azokat a nyelveket, amelyekre nincs tíznél több adat: így végül 1693 nyelvet vizsgáltak.

Vigyázni kellett azonban, hogy egymástól független tulajdonságokat vizsgáljanak, márpedig a WALS bizonyos kérdései hasonló példákat vizsgálnak. Van például olyan oldal, mely az alany, a tárgy és az állítmány sorrendjével foglalkozik, de van külön oldal az alany és az állítmány, illetve a tárgy és az állítmány sorrendjéről is. Ha egy nyelvnek nagyon szokatlan a szórendje (például az állítmánnyal kezdi a mondatot), akkor ez a tulajdonsága háromszor is furcsaságként jelentkezne. Éppen ezért az ilyen hasonló vonásokat vizsgáló kérdésekből csak egyet vettek figyelembe: azt, amelyben a legtöbb nyelvről szerepelt adat (ebben az esetben tehát az állítmány és a tárgy sorrendjét). Így összesen 21 tulajdonságot vizsgáltak.

A furcsaságot a következőképpen számolták: egy nyelv egy tulajdonságánál azt az értéket vették, ahány százaléka a nyelveknek az adott tulajdonsággal rendelkezik. Ha tehát egy nyelvnek volt egy olyan tulajdonsága, amellyel az összes nyelv 35,5%-a rendelkezik, a kapott érték 0,355 volt. Kiszámolták az értékeket a nyelv összes tulajdonságára, és kiszámolták ezek harmonikus közepét – így egy 0 és 1 közötti számot kaptak. Mivel azonban az így kapott szám annál kisebb, minél „furcsább” a nyelv, és azt szerették volna, hogy a furcsaságot a nagyobb értékek jelöljék, a végső értéket úgy kapták meg, hogy ezt a számot kivonták az egyből.

Az eredmények

A legfurcsább nyelvnek a Mexikóban beszélt chalcatongói misték bizonyult 0,972 ponttal. Az eldöntendő kérdést három dologgal szokás jelölni: külön szócskával, a szórenddel és az intonációval – ez a nyelv azonban nem jelöli egyikkel sem, nincs különbség az eldöntendő kérdés és a kijelentő mondat között. Másik igen ritka tulajdonsága, hogy bár az alany számát és személyét jelöli az igén, kötelező kitenni a mondatban a személyes névmást is. A második a magyarral rokon szamojéd nyelv, a nyenyec lett (0,935), a harmadik pedig a főként Oklahamában beszélt csoktó (0,924) lett. A legfurcsább indoeurópai nyelvnek az örmény bizonyult (9. hely, 0,861), ezt követi a legfurcsább európai nyelv (már ha az Európa perifériáján beszélt nyenyecet és örményt nem számoljuk ide), a német (0,858). Bár nem került be az első tízbe, de a legfurcsábbak között vannak olyan európai nyelvek is, mint a holland, a norvég, a cseh, a spanyol – az angol a 33. legfurcsább nyelv.

A 239. nyelvet felsoroló listán legkevésbé furcsa nyelv a hindi 0,087 ponttal: a nyelvek többségétől eltérő egyetlen tulajdonsága, hogy a birtoklást nem ige fejezi ki – ebben megegyezik a magyarral, bár a hindi nem olyan szerkezeteket használ, mint a magyar. A második legkevésbé furcsa a Mexikóban beszél purépecsa (0,1), a harmadik és negyedik helyen holtversenyben áll a Japánban beszél ainu és a főként Guamon beszélt csamorró (0,128).

Hát nem furcsa?
(Forrás: Wikimedia Commons / Cserlajos / GNU-FDL 1.2)

Na és mi a helyzet a magyarral? Nos, éppen most kerülne sorra: a listán a magyar az ötödik legkevésbé furcsa nyelv 0,132 ponttal! De a kevéssé furcsa nyelvek közé kerültek az olyanok is, mint a litván, az indonéz, a török vagy a baszk. És mi a helyzet a cikk elején emlegetett kínaival? Nos, a mandarin változata bekerült a legfurcsább huszonötbe, míg a kantoni a magyar után a hatodik a legkevésbé furcsák között. Ez lényegében a mandarin két tulajdonságának köszönhető: az egyik az, hogy van benne nyelvcsappal képzett réshang, de nincs hasonló zárhang (több mint 500 nyelv közül csak 12 ilyet találtak); a másik az, hogy – az angolhoz hasonlóan – a szájüreg hátsó részén alkotott zárral képzett orrhang (amilyen az angol song szó végén található) csak szó végén állhat, szó elején nem (közel 500 nyelv közül 88-ban ez a helyzet).

Kérdések

Az eredmények azt mutatják, hogy azok a nyelvek, amelyeket általában kiindulópontnak szoktunk tekinteni, furcsák – nem csoda, ha mellettük olyan nyelvek tűnnek furcsának, melyek több száz nyelvet vizsgálva átlagosak. Az Idibon kutatói azonban rámutatnak arra is, hogy az ő eredményeik sem adnak végső választ. Először is, a vizsgálandó tulajdonságokat meghatározó nyelvészek többnyire európai nyelvet beszélnek – mi lenne, ha a szempontokat más nyelvek beszélői határoznák meg? Arról sem szabad megfeledkeznünk, hogy a WALS adatbázisában csak a Földön beszélt nyelvek töredéke szerepel, a listát még több ezer nyelvvel lehetne bővíteni. Az adatbázisban szereplő nyelvek pedig nem alkotnak igazán véletlen mintát: az indoeurópai nyelvek például biztosan felülreprezentáltak.

Kapcsolódó tartalmak:

Hasonló tartalmak:

Hozzászólások (25):

Követem a cikkhozzászólásokat (RSS)
Az összes hozzászólás megjelenítése

12 éve 2013. június 28. 20:54

25 Byk

@Fejes László (nyest.hu): A cikk utolsó mondatában az szerepel, hogy az indoeurópai nyelvek felülreprezentáltak a felmérésben. Ezek után azt mondani, hogy a valamennyi nyelvre kiterjedő felmérést (amely mellesleg arról szól, hogy egy-egy nyelv mennyire tér el a többitől, tehát nyilvánvalóan kevésbé tér el a többitől egy olyan, amelyiknek sok rokona van) torzítana ez, hogy sok rokon nyelv kerülne be, erős csúsztatásnak tűnik.

12 éve 2013. június 28. 15:30

24 Cseresnyési László

Attól tartok, hogy nem értem, miről van szó itt (a linkelt cikkben): "Mandarin, unlike Cantonese has uvular continuants and has some limits on “velar nasals” (like English, Mandarin can have a sound like at the end of song but it can’t have that sound at the beginning of words—worldwide it’s rare to have that particular restriction). " Nem kellene esetleg jobban megszűrni (lektoráltatni), hogy mit engedtek be a nyestbe?

12 éve 2013. június 27. 21:15

23 Krizsa

@El Vaquero: A gyöknyelveket a nem (gyök)nyelvész legkönnyebben úgy különíti el, hogy átlapozza a szótárt.

Amelyik nyelvben igen nagy szóbokrok vannak és ezek a szótári állománynak jelentős (40-50) százalékát képezik, azok gyöknyelvek.

SZÓBOKOR: egy vagy két mássalhangzót tartalmazó VÁZ szavainak az első magánhangzó állandósága melletti - összessége.

Példák: KR váz. Az első magánhangzó legyen az A.

Kar, karvaly, karabély, karaván, karc, karcol, karcsú, kard, kárpit, Kárpátok, kár-hozat, karaj, karéj, karika, krákog, karakán, karalábé, karol, karám, karima, karom, karmol, stb.... az abc sor legvégén a körző szó van.

Ezeknek a szavaknak mind bele kell illenie egy KÖZÖS ELVONT JELENTÉSBE, s ez most, ebben az esetben:

olyan kinyúló bármi, ami íves, vagy körös tulajdonságú / ívre, vagy körre terjedhet / ívet, vagy kört járhat be.

***

Nem kifejezetten gyöknyelvek, de még nem távolodtak el a gyöknyelvi állapottól azok, amelyekben még mindig jelentős a szóbokrok mennyisége a szótári állományban. Ilyenek pl. a szláv nyelvek.

12 éve 2013. június 27. 16:15

22 El Vaquero

Itt most kínain értem a mandarint, kantonit és egyebet is.

12 éve 2013. június 27. 16:15

21 El Vaquero

@Krizsa: miért az angol nem gyöknyelv? Vagy az orosz? Mi van a kínaival?

12 éve 2013. június 27. 13:42

20 Krizsa

Idézek egy korábbi hozzászólót:

"Hát, ennek nem sok értelme lenne, mivel hangalak és jelentés kapcsolata teljesen önkényes."

Ez a 19. századi germán öreg-gyerekek ("tudósok") zagyvája, de azóta már szándékos félrevezetés.

A ma is élő gyöknyelvek (finn / magyar / héber /arab / dravida / szanszkrit SOKEZER,

SOKEZER szópárhuzamának ismeretében (s ezeknek ma már hisztérikus tagadása mellett) az "önkényes kapcsolat" szándékos félrevezetés.

A hangalak és a jelentés kapcsolata VELÜNK SZÜLETETT mentális reprezentációkon (a természeti környezetről való tudásbázisunkon) alapul. NEM önkényes és egyáltalán nem véletlenszerű.

12 éve 2013. június 27. 12:14

19 Fejes László (nyest.hu)

@El Vaquero: Teljes listát én sem találtam sajnos.

12 éve 2013. június 27. 12:08

18 Sultanus Constantinus

@El Vaquero: Hát ez az, mert nincs. Ezt írtam én is a 6-os hsz.-omban.

12 éve 2013. június 27. 11:33

17 El Vaquero

Az eredeti oldalon nem találom a furcsasági listát. Link?

12 éve 2013. június 27. 11:29

16 sbalint

@Fejes László (nyest.hu): Köszönöm a választ. Én azért ha nem lenne egyéb dolgom, biztos leellenőrizném.

12 éve 2013. június 27. 11:14

15 Fejes László (nyest.hu)

@sbalint: A minta különböző földrajzi területekről, különböző nyelvcsaládokból stb. származik. Joggal feltételezhető, hogy ezek a nyelvek jól leképezik a világ összes nyelvét. Ez természetesen nem jelenti, hogy más mintával ne kaphatnánk más eredményt, de gyökeresen más eredményt aligha.

Egyébként ez elég jól ellenőrizhető: ha ezt a mintát véletlenszerűen kettéválasztjuk, és mind a kettőn elvégezzük a számításokat külön-külön (mintha csak azokról a nyelvekről lennének adataink), akkor láthatjuk, hogy az adott mintákon belüli sorrend mennyire tér el az eredetitől. Ha komoly eltérést tapasztalnánk, akkor felmerülhetne, hogy kicsi a minta... De a minta mérete így is kb. 5% (ha a 239 nyelvet vetjük össze a létező 4-5000-rel), ami szokatlanul nagy. Másrészt a 4-5000 is úgy jönne ki, hogy lenne közöttük egy halom közeli rokon, ami torzítaná a mintát.

12 éve 2013. június 27. 11:00

14 sbalint

@Fejes László (nyest.hu): Igen, de az szerintem nem vág ide, mert a fent említett amerikai "tudósok" olyan módszert választottak, ahol úgy állapítják meg egyik nyelvről, hogy mennyire furcsa a többihez képest, hogy megnézik hogy a többi mennyire furcsa ehhez képest. Ez így tudománytalan. És akárhogy is vesszük a kimaradt nyelvekről nem tudunk semit.

12 éve 2013. június 27. 10:15

13 Fejes László (nyest.hu)

@sbalint: Elolvastad a linkelt cikket?

@Antiszociális Nyelvészkedő: Mindegyik laphoz van magyarázat. Azokat megnézted?

„In some languages, both orders of adjective and noun occur. In some of these, an argument can be given that one of the two orders is dominant (see “Determining Dominant Word Order”).” wals.info/chapter/87 --> wals.info/supplement/6

Hasonlóképpen: wals.info/chapter/81

12 éve 2013. június 27. 10:02

12 sbalint

@Fejes László (nyest.hu): Meg lehet próbálni 5 nyelv közül is kikeresni, hogy melyik a legfurcsább, de semmi értelme. Tudjuk jól hogy a statisztika a legjobb eszköz a tények elferdítésére.

Ha sorrendet akarunk felállítani bizony minden tag számít.

Egy osztályban nem elég a tanulóknak csupán egy részét ABC szerint listázni. A többiről honnan tudjuk, hogy hányadik?

12 éve 2013. június 27. 10:02

11 Sultanus Constantinus

@Fejes László (nyest.hu): @sbalint: Megnézegettem néhány térképet és szomorúan állapítom meg, hogy még az sem igaz, amit jelölnek időnként. A spanyolnál néztem meg szúropróbaszerűen néhány dolgot, mert azt ismerem a legjonbban. Vegyük pl. az egyik legegyszerűbb esetet, a főnév és melléknév sorrendje. A három lehetőség: főnév-melléknév, melléknév-főnév, nincs jellemző sorrend. A spanyolnál a főnév-melléknév van jelölve, amikor a "nincs jellemző sorrend" áll közelebb a valósághoz. Ugyanez az általános szórendnél: SVO-nak van jelölve, pedig az SVO és a VSO is jellemző. Ennyit az adatok megbízhatóságáról. (Mondanom sem kell, hogy az a tulajdonság, ami alapján furcsa lehetne, az "állítmánnyal is kezdhet mondatot", éppen rajta sincs a nyelvatlaszon.)

Az összes hozzászólás megjelenítése

legutóbbi hozzászólások listája...

Nyelv és politika; Természettudomány; Nyelvtudomány; Oktatás; LEITERJAKAB

Váltás normál nézetre...