Listázzunk nyelveket!?
A népszámlálás elektronikus kérdőíve egyvalamit biztosan lehetetlenné tett: azt, hogy valós képet kapjunk a jedi-lovagok anyagi helyzetéről. Miért torzíthat, ha egyes válaszadók bármit mondhatnak, másoknak viszont egy előre megadott listából kell választaniuk?
Kutatásmódszertani sorozatunkban már sok szó esett a kérdőíves vizsgálatokról, most a népszámlálás kapcsán pedig egészen friss példákkal szolgálhatunk. Több kérdést kaptunk a népszámlálás nyelvi részével kapcsolatban, és a kommentekben is élénk társalgás kezdődött. Most kitérünk néhány felmerült gondra, és pár különösen bizarr hibát is mutatunk!
(Forrás: Wikimedia Commons / Happenstance / GNU-FDL)
Nyelvészek hátrányban
Az idei népszámlálás egyik kérdése a nyelvekre vonatkozott:
Milyen nyelven beszél? Milyen nyelven képes másokat megérteni, és magát megértetni? (Kiemelés az eredetiben.)
A magyar mellett három további választ lehetett megadni. Az még nem feltétlenül tragédia, hogy ennyiben maximálták a válaszlehetőségeket, mert sajnos Magyarországon a válaszadók töredéke ismer csak háromnál több idegen nyelvet, habár a Nyest-olvasók között valószínűleg viszonylag többen vannak ilyenek. Azt már korábban megpróbáltuk megtudni az illetékes hivataltól, hogy az előző népszámláláson hányan állították magukról, hogy legalább három idegen nyelvet beszélnek, de nem jártunk sikerrel.
Valószínűleg jobb lett volna, ha az ennél több nyelvet ismerő emberek számára valamilyen útmutatást adnak, melyik három nyelvüket válasszák ki. Azokat, amelyeken saját megítélésük szerint a legjobban beszélnek? Azokat, amelyeken valamilyen nyelvvizsgát is letettek? Azokat, amelyeket a hétköznapokban a legtöbbet használnak? A kérdőív maga nem tartalmaz több információt, habár a kitöltési útmutatóban azt az elég általános megfogalmazást találjuk, hogy „azt a három nyelvet kell beírni, amit az adatszolgáltató a legfontosabbnak tart.” Ugyanitt viszont az is szerepel, hogy „A kérdéshez a mesterséges (pl. magyar jelnyelv, eszperantó), illetve a holt nyelvek (pl. latin, ógörög) is beírhatók.” A magyar jelnyelv pedig egyáltalán nem mesterséges nyelv! Így bízzunk az útmutatóban?
Sokkal nagyobb probléma, hogy az internetes kitöltéskor nem lehetett tetszőleges választ beírni, mint a személyes kitöltés során. A rendszer egy előre megadott listát kínált fel, amiből ki lehetett választani a nyelveket. Miért olyan súlyos ez a hiba?
Ha mi lennénk az állam
Hasonló felmérések készítésekor nagyon fontos, hogy ha a válaszadók más-más csoportjaival különböző módokon töltetjük ki a kérdőívet, mindent meg kell tennünk azért, hogy ezek az eltérő módok minél jobban hasonlítsanak egymásra. Ha nem így teszünk, lehet, hogy olyan eltéréseket fogunk találni a csoportok között, amelyek valójában nem léteznek, csak a mi félresikerült mérésünk miatt álltak elő. A mérés sajátosságai következtében létrejött eltéréseket általánosságban műterméknek vagy latinos szóval artefaktumnak szokás nevezni.
Hogyan állhat elő esetünkben hasonló műtermék? Vegyük most a népszámlálás vallási részét, mert itt könnyebb szemléletes példát találni! A vallásra vonatkozó kérdés esetében szintén csak az előre megadott egyházakat és vallásokat lehetett választani az internetes válaszadás során, és szintén voltak meglehetősen furcsa lehetőségek, mint például a „tárgyak vallásos tiszteletét követő”.
Akik az interneten töltenek ki egy kérdőívet és nem várnak a kérdezőbiztosra, azok általában gazdagabbak és képzettebbek, erre sok korábbi adat van. Akik magukat – a külföldi népszámlálások kapcsán szerveződött mozgalmak mintájára – a Csillagok háborúja filmsorozatból ismert jedi szerzetesrend tagjának vallják, valószínűleg szintén az átlagnál gazdagabbak és képzettebbek, mert ezekről a mozgalmakról Magyarországon leginkább az interneten olvashattak. (Habár a jedi lovagok anyagi helyzetét tudtunkkal nem vizsgálták korábban a demográfusok.) Eddig tiszta sor, de most jön a csavar!
Mint sorozatunkban korábban már bemutattuk, a közvéleménykutatások történetének legnagyobb bukásai is hasonló torzítások miatt következtek be.
Az internetes kitöltéskor nem lehetett tetszőleges választ adni, így a jedik csak papíron számláltathatták meg magukat. A neten próbálkozók többsége valószínűleg csak legyintett és beikszelte az Egyéb választ – ahhoz már igen ortodox jedinek kell lenni, hogy valaki csak ezért rabolja a számlálóbiztos idejét. Így viszont akár az a hamis kép is kialakulhatott, hogy a jedik alacsonyabban képzettek az átlagnál, amikor pedig épp a fordítottja lenne igaz, csak a magasabban képzetteket nagyobb arányban akadályozta a válaszadásban a félresikerült online kérdőív.
Csak csendben jegyezzük meg, hogy a sátánizmus viszont bekerült az adatbázisba:
Lehet-e nyelvlistát készíteni?
Ha magunk szerkesztünk hasonló kérdőívet, a legjobb, ha ilyen esetben egyáltalán nem korlátozzuk a résztvevőket – adjanak meg mindent, amit csak szeretnének! Minden nyelvet úgyse tudunk felsorolni, a hasonló válaszokat pedig egyszerűbb feladat utólag összevonni.
Papíralapú kérdőív esetében még jobban látszik a feladat abszurditása: hány oldalra lenne szükségünk, hogy egy nyelv se maradjon ki? A népszámlálás nyomtatott kérdőívei – nagyon helyesen – tetszés szerinti szöveggel kitölthető rubrikát tartalmaztak. De valaki valahol úgy gondolta, a modern számítástechnika vívmányainak segítségével már ez a bonyolult probléma is megoldható.
Egy okból lehet hasznos a nyelvlista: ha fontos az, hogy a feldolgozás gyorsan és hatékonyan menjen végbe, és ennek az érdekében még a kisebb torzítások is elnézhetőek. Egy teljesen nyílt kérdésre adott válaszokat még akkor is sok időbe telik összesíteni, ha minden válasz csak néhány szóból áll. Ilyenkor általában azt szokták a kutatók tenni, hogy a néhány leggyakoribb választ beikszelhető formában előre megadják, és emellé tesznek még egy szabadon kitölthető szöveges mezőt is. Ez a fajta megoldás a népszámlálás kérdőívében is megtalálható volt, de a nyelvtudásnál a készítők csak a magyar nyelvet adták meg előre. (Vajon hányan felejtették el beikszelni?) Az egyéb nyelvhasználattal kapcsolatos, nem kötelezően kitöltendő kérdéseknél a hivatalosan elismert kisebbségek nyelvei voltak külön felsorolva, illetve azok a nyelvek, amelyeken a KSH becslése szerint sok bevándorló beszél. De például a 37. „Családi, baráti közösségben milyen nyelvet használ általában?” kérdésnél nem szerepelt ikszelhetőként az angol, holott bizonyára sokan beszélnek baráti társaságban vagy vegyes házasságban angolul.
Mit érdemes hasonló esetben előre megadni? Általában a leggyakoribb lehetőségeket, így takarítjuk meg a legtöbb időt. Ha például a Magyarországon oktatott nyelvekről készítünk felmérést, megnézhetjük, hogy korábbi vizsgálatokban melyek voltak a legtöbb helyen oktatott nyelvek, és felsorolhatjuk az első néhányat. Arra teljesen fölösleges törekedni, hogy mindet felsoroljuk.
Természetesen ha az összes lehetőséget kimerítően fel lehet sorolni röviden, akkor nyugodtan lehet listát készíteni róluk. Ilyen eset például, ha arra kíváncsi a kérdező, az egyetemen milyen nyelvet tanult a hallgató. Ebben az esetben elég venni a kurzuskínálatot és felsorolni a benne található nyelvi kurzusokat.
Ha olyan válaszokat szeretnénk kapni, amelyek a válaszadók maguktól lehet, hogy nem adnak meg, a kérdés megfogalmazásával orientálhatjuk őket. Például ha arra vagyunk kíváncsiak, hogy az angol melyik dialektusát beszélik, akkor nem lesz elég megkérdezni, hogy milyen nyelveket beszélnek. Maguktól valószínűleg csak az angolt adnák meg, és nem mennének bele a további részletekbe. Ilyen esetben érdemes konkrétan a válaszadók által beszélt dialektusra rákérdezni és esetleg néhány gyakori példát megadni.
A népszámlálás esetében a szöveg összeállítói szemlátomást nem tudták eldönteni, mennyire részletes adatokat szeretnének. Ha ugyanis valakit a kérdezőbiztos megkérdez, magától nem fogja nyelvváltozat szintre lebontva megadni a nyelvtudását, csak azt mondja, angol, német... Az internetes verzióban található lista viszont ennél gyakran részletesebb: mint azt korábban már láttuk, több nyelv esetében számos változatot is külön felsorol, másokat pedig meglehetősen furcsa módon összevon.
Azt nem tudjuk, a lista maga honnan származik. Talán a népszámlálásra készülhetett, vagy valamilyen jól elrejtett állami adatbázis részét képezi. A Google mindenesetre a szokatlan elemekre rákeresve nem ad értékelhető találatot, így valószínűleg a felsorolás nem közkincs – vagy ha igen, akkor eredetije nem magyar nyelvű. Mint lejjebb látni fogjuk, találtunk néhány arra utaló jelet, hogy a szöveg fordítás eredménye... ez azonban nem mentség számos hibájára. Lássunk néhány kiragadott példát!
Kit izgatnak a kisebbségek?
Már előző cikkünkben is említettük, hogy a Magyarországon beszélt két nagyobb cigány nyelvet összevonták a készítők. A romani és a beás egymástól teljesen eltérő, kölcsönösen egyáltalán nem érthető nyelvek, és csak igen távoli rokonai egymásnak. Közben találtunk még más cigány témájú furcsaságot is. Vajon a gipsy melyik cigány nyelvet takarhatja? Feltételezzük, hogy bármelyiket. De akkor miben tér el a cigány válaszlehetőségtől?
Kommenteljen!
A cikkben található illusztrációkon további hibák is szerepelnek. Ön megtalálja-e őket?
Azt tudjuk, kicsodák a szefárdok: az Ibériai-félszigetről a spanyol inkvizíció által elűzött, jellegzetes kultúrával rendelkező zsidók. (Ma a legtöbb szefárd zsidó Izraelben és Franciaországban él.) Nekik azonban nincsen külön „szefárd nyelv”-ük. A legelterjedtebb szefárd zsidó nyelv a ladino vagy más néven judeo-spanyol, de más szefárd nyelvek is ismeretesek, például ilyen a mára kihalt judeo-portugál. A hébernek is vannak szefárd dialektusai – ki tudja, mire gondolhatott a lista ismeretlen összeállítója...
Közröhej
Ha valaki megfejtette a krétai lineáris A írást, akkor akár a népszámlálási kérdőívet is felhasználhatta arra, hogy felfedezését közölje a világgal:
A „feliratok nyelve” is szerepelt a felsorolásban. Hogy milyen feliratoké? Az ábra tanúsága szerint a bübloszi pszeudo-hieroglifikus feliratoké – mi biztos nem ezekre tippeltünk volna elsőnek. Hogy a bübloszi jelek szintén megfejtetlenek (habár időről időre felröppen a sikeres megoldás híre), az szemlátomást nem zavarta a készítőket.
A következő momentum arra utalhat, hogy a szöveget angolból fordították. A varjú indián törzs neve magyarul varjú, ezt teljesen fölösleges idézőjelbe tenni. A varjú indiánok magukat eredetileg apsáalooke-nek nevezték, ami annyit tesz, hogy ’a nagycsőrű madár gyermekei’. Ebből keletkezett kisebb félrefordítással a crow, angolul ’varjú’ elnevezés, de a törzs angolul ma már az apsáalooke mellett ezt is használja, mint az látható például a varjú nemzet hivatalos honlapján. Így magyarul nyugodtan hívhatjuk őket varjú indiánoknak.
További olvasnivaló
@Szalakóta: amit keresel: www.nyest.hu/hirek/jelelo-szerzetek; az itt említett indián nyelv valóban máig létezik, de arra vonatkozóan semmilyen infót nem találtam, hogy az indiánok között jellemzően magas lenne a siketség aránya. Ha tudsz ilyen forrást, én is kíváncsian olvasnám.
Ahol a siketség aránya kiugróan magas volt, és az a jelelést természetessé tette, az Martha's Vineyard, talán egyszer majd erről is lesz egy jó kis összefoglaló...
És hát igen, ahol csupán tabu okán váltanak hangról jelre, ott a jelelés kényelmi okokból kifejezetten a hangzó nyelvet követi, túl sok energiát nem szokás ilyenkor egy új nyelvi rendszer kiépítésére fordítani. :-)
Ami pedig az eredetileg itt kommentelt cikket illeti: a KSH teljességgel elképesztő nyelv-listával dolgozott: ahol írásrendszerek keverednek beszélt nyelvekkel, meg kihalt nyelvekkel, meg nyelvjárásokkal, ráadásul némelyik több néven is - az teljesen abszurd!
Jaj, és egy másik cikkre reagálva, amit nem találok: a síkvidéki indián jelnyelv önálló jelnyelv, amit még mindig jelelnek, főleg siket indiánok.
Ahol tabuk szabályozzák, hogy mikor nem szabad beszélni, a legtöbb helyen a népesség nyelvének jelelt változatát használják beszédtilalom idején.
A KSH kicsinek becsüli a korlátozások miatt keletkező hibát, bár a kisebb nyelvekre a hiba tetszőlegesen nagy lehet. Kedves kollégák, itt mindenre számítani kell.
Mi interneten töltöttük ki, és megtaláltam mind a jelnyelvet (jelbeszédnek csúfolva), mind a jedi vallást (a fény és az erő lovagjainak egyháza). Úgyhogy a jelnyelv az összemosás kategóriájába került, mert egy kalap alá vették a Nézd a kezemmel.
De a települést sem hagyták szabadon beírni, hanem egy listából kellett választani.Gondolkodnunk kellett, hogy mely kerületben volt a kórház, ahol születtünk, mert nem volt elég, hogy Budapest a születési hely. Néhány település lemaradt a kérdőív térképéről, így az ottaniak kénytelenek voltak félrevezetni a hatóságokat.
A nyelvek mellett a fogyatékosságnál is csak hármat lehetett megadni. Az idős Helen Keller nagy gondban lett volna, hogy mely három fogyatékosságát jelöltesse be a titkárával.
Közben többször is megjegyeztem, hogy utálom, hogy egy kérdőív okoskodik. Megpróbáltak neki mesterséges intelligenciát adni, de nem sikerült valami jól.
@prezzey: Hát akkor lehet, hogy én tudom rosszul, de eddig a ladinón kívül más "szefárd nyelv"-ről nem hallottam. Eleve, mivel a szefárdok Spanyolországból kiűzött zsidók, túl sok nyelvet nem beszélhetnek szerintem, mint az archaikus spanyolt, ill. a juedo-portugált, amely, mint írod is, kihalt. :) A hébernek a szefárd nyelvjárása meg gondolom spanyol szavakkal kevert héber, nem? Egyébként úgy tudom, hogy eleve a Szefarád 'Spanyolország'-ot vagy 'Ibériai-félsziget'-et jelent héberül, de javíts ki, ha nem így van.
@Yogi: értsd: egy konkrét egyetemen... :] Ha jól emlékszem, eredetileg az ELTE-t írtam a példába, csak aztán kihúztam, hogy ne legyen benne termékmegjelenítés, ha nem muszáj.
@El Mexicano: azt hiszem, most visszaértünk ahhoz a problémához, ami körül már volt a Nyesten pár kör korábban, hogy ti. mind a beás, mind az oláh cigányok mondják időnként a saját nyelvükre, hogy "cigányul" beszélnek. Akkor most mi "a" cigány nyelv és mi "egy" cigány nyelv? Kb. ugyanez a szefárd nyelvekkel.
@siposdr: Magyarul faliszknak is mondják. A nyelvük pedig olyannyira közeli rokonságban állt a latinnal, hogy egyesek szerint csak a latinnak egy archaikus nyelvjárása volt. :)
Ehhez (sem) értek: mi a különbség a faliscus és a faliszkusz nyelvek között? ;-))
Mint tudjuk: A faliszkuszok (latinul falisci, azaz faliscusok) ókori itáliai nép volt. A faliszkuszi nyelv közeli rokonságban állt a latinnal. Eredetileg önálló államot alkottak.
Ja, még valami (szokás szerint mindig csak azt felejtem el, amit először akartam leírni):
"Azt tudjuk, kicsodák a szefárdok: az Ibériai-félszigetről a spanyol inkvizíció által elűzött, jellegzetes kultúrával rendelkező zsidók. [...] Nekik azonban nincsen külön „szefárd nyelv”-ük" – Na ez így azért nem teljesen igaz. A ladinót ugyanis saját maguk "lingua sefardí"-nak nevezik, és spanyolul is lehet így nevezni (az RNE ladino nyelvű műsoránál is sefardí van feltüntetve nyelvként).
„Ilyen eset például, ha arra kíváncsi a kérdező, az egyetemen milyen nyelvet tanult a hallgató. Ebben az esetben elég venni a kurzuskínálatot és felsorolni a benne található nyelvi kurzusokat.”
Nyolcvan évre visszamenőleg, a világ összes egyetemére vonatkoztatva (a megszűntekre is).
Hát elég érdekes, az biztos.
– türkmen, türkmén...
– óüzbég, üzbég (óüzbég)...
– a franko-provanszál (arpitán) és a provanszál (okcitán nyelvjárás) két különböző nyelv, ez akkora hülyeség, mintha az lenne a listán, hogy "spanyol (katalán)".
– "huaxtek": ilyen nincs. Gondolom a spanyolul huasteco néven ismert nyelvre gondoltak, amit magyarul vaztéknak (vagy vazték-majának) hívnak, a maja nyelvcsaládba tartozik.
– a "mixteco"-t meg érdekes módon spanyolul írták le, amikor ez magyarul misték.
Szóval tényleg nagyon komolytalan ez a lista.