Itt a bizonyíték?

Mi is az az Uralonet?

Hamar munka sosem jó. Az Uralonet, az uráli nyelvek alapnyelvi eredetű szókincsének adatbázisa több mint két évtizeden át készült, habár úgy tűnik, akár három év alatt is megszülethetett volna. Cikkünkben nem csupán a történetét meséljük el, annak is utánajártunk, mire használható mai állapotában.

Fejes László | 2012. november 29.

A tudomány egyik legnagyobb problémája az, hogy azok az adatok, amelyeket felhasználna a kutatáshoz, nem érhetőek el az interneten. Miközben a világban természetessé vált, hogy a minket érdeklő információkat pillanatok alatt megtaláljuk a világhálón, a tudományos munkához szükséges adatoknak, forrásoknak csak kis töredéke férhető hozzá szabadon az interneten keresztül. Pillanatnyilag a legfontosabb feladatok egyike az, hogy a korábban papíron olvasható adatokat, szótárakat, monográfiákat, tanulmányokat elektronikusan is hozzáférhetővé tegyük. Ebben a munkában a magyarországi finnugrisztika most hatalmas lépés megtételével büszkélkedhet.

2012. november 23-án pénteken mutatták be a Magyar Tudományos Akadémia székházában az Uralonetet, az Uralisches Etymologisches Wörterbuch (Uráli etimológiai szótár, rövidítve UEW vagy UEWb) elektronikus változatát. A szótár a hetvenes-nyolcvanas években készült az MTA Nyelvtudományi Intézetének Finnugor osztályán Rédei Károly vezetésével, 1986 és 1989 között jelent meg.

A német nyelvű szótárban címszóként a kikövetkeztetett alapalak szerepel, megadva mellette a kikövetkeztetett alapnyelvi jelentést (szintén németül), azt, hogy melyik (uráli, finnugor, ugor, finn-permi, finn-volgai) alapnyelvre rekonstruálható a szó, illetve biztos vagy csupán lehetséges-e a rekonstrukció. Ezután felsorolják az etimológiához tartozó leánynyelvi megfeleléseket, majd ezt követi a magyarázat. A magyarázatban kitérnek a jelentésváltozásokra és a szabálytalan hangváltozásokra, a leánynyelvi adatokban felbukkanó képzőkre, az esetleges bizonytalanságok okaira stb. A szócikket válogatott bibliográfia zárja, melyben a szó etimológiájára vonatkozó, a szerkesztők által legfontosabb munkák vannak felsorolva.

Luca szájtja

A szótár elektronikus változatának ötlete a nyolcvanas évek végén merült fel Csúcs Sándorban, aki az UEW egyik munkatársa volt. Ő úgy vélte, hogy az UEW bizonyos rekonstrukciói talán nem eléggé következetesek, de ennek ellenőrzéséhez rengeteg adatot kell előkeresni, amely a szótárral vagy cédulákat használva szinte megoldhatatlan (de legalábbis rengeteg időt követelő) feladat. A számítógép segítségével viszont másodpercek alatt megtalálhatjuk a minket érdeklő adatokat.

Ma már persze érezhetjük úgy, hogy az ötlet kézenfekvő volt, de annak idején forradalminak volt mondható. Ebben az időben csupán néhány számítógép volt a Nyelvtudományi Intézetben, a kutatók még kézzel írták cikkeiket, amelyeket gépírónők gépeltek le, és az így készült kéziratok mentek a nyomdákba. Akkoriban úgy képzelték, hogy majd lesz a sarokban egy számítógép, amelyre telepítve lesz az UEW elektronikus változata, és azok a kutatók, akik a szótár anyagával szeretnének dolgozni, majd e gép mellé fognak ülni, elvégzik a kereséseket, majd átadják helyüket másoknak. Később, a CD-technológia elterjedésével már úgy képzelték, hogy a szótár anyaga forgalmazható lesz, és akár a külföldi kutatóhelyeken, vagy otthon is használhatják az érdeklődők. Az internet elterjedésével (illetve a CD-technológia elavulásával) persze már egy online hozzáférhető, folyamatosan frissíthető, javítható, bővíthető változatot tartottak már szem előtt.

A szótár elektronikus változatának munkálatait 1991-től 2009-ig, nyugdíjba vonulásáig Csúcs Sándor vezette. A szótár anyagát már a kilencvenes években első felében rögzítették a Finnugor osztály munkatársai, méghozzá egyszerűen úgy, hogy az anyagot Microsoft Wordbe írták, RTF-formátumban mentették. A kellő számítógépes tudás azonban ekkor nem volt meg az intézetben, éppen ezért a munkálatokba bevonták Bátori Istvánt, aki ekkor a Koblenz Egyetemen a számítógépes nyelvészeti intézetet vezette, korábban pedig maga is finnugrisztikával foglalkozott. Ettől kezdve a technikai fejlesztést Bátori vezette, a szoftver fejlesztésébe több tanítványát, szakdolgozóját is bevonta. A szoftver jelentős része el is készült, a funkciói többé-kevésbé működtek, ám meglehetősen megbízhatatlanul: valódi munkaeszközként nem volt használható.

Eközben Csúcs Sándor szorgalmasan bővítgette az adatbázist: a szócikkeket kiegészíttette más rekonstrukciókkal (például Collinderéivel, Janhunenéivel), a leánynyelvi adatokat az időközben megjelent szótárakéival (például az udmurt adatokat Wichmann udmurt szótárának adataival), megadta a rekonstruált jelentéseket angolul és magyarul is, illetve beledolgozta az anyagba saját permi rekonstrukcióit.

A projekt eredetileg Uráli Etimológiai Adatbázis (UEA), majd UEDb (Uralische Etymologische Datenbasis, Uráli Etimológiai Adatbázis) néven futott. Később a Bátori-féle változat az Uralothek nevet kapta, a Nyelvtudományi Intézetben fejlesztett változatot pedig az Uralonetnek nevezték el. Az UEDb név előnye volt, hogy erősen emlékeztetett az alapjául vett szótár címének rövidítésére (UEWb). Az új elnevezéseket semmiképpen nem tarthatjuk szerencsésnek, hiszen nem utalnak arra, hogy etimológiai szótárról van szó: éppúgy lehetne uráli nyelvészeti tanulmányokat, uráli nyelvű szövegek internetes gyűjteményét (korpuszát) stb. így nevezni. Az Uralonet logója már sokkal szerencsésebb, szellemes választás.

2009-ben Csúcs Sándor nyugdíjba vonult, a szoftver viszont továbbra sem volt publikálható állapotban. A Finnugor és nyelvtörténeti osztály munkatársai úgy döntöttek, hogy a szótár kiadása nem halogatható tovább. Az intézet nyelvtechnológiai osztályát kérték fel arra, hogy segítsenek rendbe hozni a Bátori-féle verziót, ám az ottani munkatársak úgy látták, célszerűbb az adatbázisban való kereséshez egy újabb programot fejleszteni, mint Bátori verzióját javítgatni. Ebben az időben Bátori István is publikálta a maga adatbázis-kezelőjének tesztváltozatát: ez ma is elérhető az interneten. (Ezt a változatot linkeli az Uralonet is, ámde rosszul: az ott megadott címen ma már nem érhető el a szolgáltatás.)

Az Uralonet logója az egyik legismertebb rekonstrukcióra, a *kala ’hal’ szóra utal

A szoftver fejlesztésével párhuzamosan elindult az adatbázis ellenőrzése, és ennek során kiderült, hogy ebben is rengeteg hiba van. Végül a nyolcvanmillió karaktert tartalmazó adatbázist olyan mélységig kellett ellenőrizni, hogy az gyakorlatilag felért az újrarögzítéssel. Ráadásul a legtöbb Csúcs-féle bővítés nem volt meg benne: az anyag kizárólag a jelentések angol és magyar megadását, illetve Csúcs permi rekonstrukcióit tartalmazta. Az előbbieket alapos ellenőrzés és javítás után meghagyták, az utóbbiakat viszont – legalábbis ideiglenesen – jobbnak látták eltávolítani az adatbázisból.

Érdekes módon az Uralonetet már többször bemutatták, legelőször szinte napra pontosan két évvel a mostani bemutató előtt, 2010. november 22-én *kala a hálón címmel a Nyelvtudományi Intézetben. A következő két év folyamán több ilyen bemutató is volt, ám az oldalon ott virított a „Még nem végleges változat” felirat, mely idén november végén végre eltűnt. Az első igazi változatnak tehát a mostani tekinthető.

Az új szoftver és adatbázis már megfelel rengeteg olyan követelménynek, amelynek a Bátori-féle változat nem felelt meg. Bátori saját karakterkészletet használt, és az adatokat is sajátosan kódolta (például a diftongusokat egy számmal kódolta, azaz pl. az uo betűkapcsolatot egyetlen kód, és nem kettő – az u-é és az o-é) jelölte. Ennek hatalmas hátránya, hogy az interneten az adatbázis adatai csakis az erre készült adatbázis-kezelővel kereshetőek, a Google vagy a hasonló netes keresők nem fogják megtalálni az adatokat. (Ne felejtsük el, hogy a Bátori-féle változat kidolgozásának kezdetekor az internetes megjelenés még fel sem merülhetett!) Az Uralonet ezzel szemben a Unicode-kiosztást használja és a jelenlegi szabványok szerint kódolja az adatokat, így a netes keresőkkel is elérhető. További előnye, hogy a megjelenített adatok így könnyen másolhatóak, beilleszthetőek szövegszerkesztőkbe, mailbe stb., azaz sokkal könnyebb dolgozni velük.

A fejlesztők néhány új, hasznos funkciót is bevezettek. Így például a magyar adatok mellett megjelentek a MNSz, illetve a HHC feliratok, melyekre kattintva a Magyar Nemzeti Szövegtárban, illetve a Magyar Történeti Korpuszban kereshetjük ki az adott szót. (Arra persze ügyelni kell, hogy nem minden találat tartalmazza ugyanazt a szót!)

Összességében tehát elmondhatjuk, hogy hatalmas jelentőségű munkáról van szó: a világon először érhető el egy teljes nyelvcsalád etimológiai szótára internetes adatbázisként. Ha hozzátesszük, hogy az adatbázis-kezelőt újonnan kellett kifejleszteni, az adatbázis ellenőrzése pedig szinte felért annak újbóli rögzítésével, akkor könnyen beláthatjuk, hogy hatalmas munkáról volt szó. A magyar tudományosság ismét jelentős eredménnyel büszkélkedhet.

Lássuk a medvét halat!

Az Uralonet nyitóoldaláról a többfelé juthatunk, így például megnyithatjuk az oldalra vonatkozó információkat, a súgót, illetve az oktatáshoz nyújtott segédanyagokat. Az Uralonet érdemi része azonban a Keresőfelület menüpont alatt található, tulajdonképpen ezt nevezhetjük az Uralonetnek. A magunk részéről célszerűbbnek tartanánk, ha a keresőfelület lenne a nyitóoldal, hiszen a súgó megnyitására itt is lehetőség van, a többi részhez mindössze két linket kellene itt elhelyezni.

Négy fiók

A keresőfelület négy fiókra oszlik, és különböző adattípusokra kereshetünk rá. A felső fiókban a rekonstruált szavakra kereshetünk, a másodikban a leánynyelvek adataira, a harmadikban a magyarázó részekre, a negyedikben pedig a bibliográfiai adatokra.

Az alapalakokra való keresés fiókjában legfölül azt állíthatjuk be, hogy hol kereshetjük az adatokat: meghatározhatjuk, hogy melyik rekonstruált alapnyelvben szeretnénk kutatni, illetve hogy a biztos vagy a bizonytalan rekonstrukciók érdekelnek-e minket (vagy mindkettő). Sajnos vagy csak az egyik alapnyelvet választhatjuk, vagy az összeset, holott lehet, hogy az alapnyelvek egy csoportja érdekel minket. Például ha az olyan etimonok között keresgélnénk, melyek a magyar számára relevánsak (tehát az uráli, a finnugor, vagy az ugor nyelvre rekonstruálták őket – a finn-volgai és a finn-permi adatok ekkor nem érdekesek), de a magyarban nem feltétlenül van megfelelőjük, akkor a három alapnyelvre külön kell rákeresnünk. De az is lehet, hogy olyan etimonokat keresünk, melyeket a finn-permi és az ugor nyelvekre rekonstruáltak, de a finnugorra vagy az urálira nem, és éppen az érdekel minket, hogy ezeket nem lehetne-e mégis összekapcsolni valahogy, a program akkor sem segít nekünk, egy csomó munkát kézzel kell elvégeznünk – pedig programozásilag nem lenne nagy ügy megoldani, hogy tetszőleges alapnyelvi kombinációkban kereshessünk.

A fiók következő két mezőjében megadhatjuk, hogy mit keressünk. A felsőben azt, hogy milyen fonémasorokra (betűsorokra) kereshetünk rá: megadhatjuk, hogy ezeket a program a szavak elején, közepén vagy végén keresse-e, vagy teljes szavakra keressen rá. Az alsóban pedig fogalomkörök alapján szűkíthetjük a jelentést, illetve adott jelentésű rekonstrukciókat kereshetünk!

A tesztek a 2012. november 27-ei állapotokat tükrözik.

Elvégeztünk egy egyszerű próbát! Rákerestünk az š kezdetű szavakra: a megfelelő karakter a magyar billentyűzetről könnyen elérhető az AltGr+2 s billentyűkombinációval, de a képernyőn látható megfelelő gombra kattintva is beírható – a szoftver tehát itt előzékenyen segíti a felhasználót. Azt az eredményt kaptuk, hogy ilyen szó nincs – ez meglepheti azokat, akik valaha tanultak uráli hangtörténetet! Tettünk egy próbát a ś-sel (ez az AltGr+9 s billentyűkombinációval is elérhető): az eredmény hasonló. Az egyszerűség kedvéért rákerestünk rá az s kezdetű szavakra: a dolog működött, sőt, túlontúl jól is működik: ezúttal ugyanis kilistázásra kerülnek az ś és š kezdetű szavak is! Ha jobban megfigyeljük, kiderül a hiba forrása is: ezek a szavak nem az ś, illetve š karakterekkel, hanem az s + ́, illetve s + ̌ karakterekkel van kódolva. (Megfigyelésünk szerint a probléma minden mellékjeles betűnél fennáll.) Később más számítógépen is elvégeztük a teszteket, és ott az ékezetes keresés működött: elképzelhető, hogy a fejlesztők is ilyen gépen dolgoztak, ezért nem fedezték fel ezt a hibát. Ugyanakkor az mellékjel nélküli karakterekkel keresve minden esetben megkapjuk a mellékjeles karakteres találatokat is – ráadásul a lista elején, így ezt a hibát viszonylag könnyű kiszűrni.

Azok a fránya ékezetek!
(Forrás: Wikimedia Commons / INVERTED)

Szintén kellemetlen, hogy például a δ̕ begépelését semmi nem segíti, mivel önálló gombja nincs. Így először a δ-t kell a gmb segítségével beírni, majd az AltGr+9 szóköz billentyűkombinációval kell begépelni a mellékjelet.

Ennek oka bizonyára az, hogy bizonyos hasonló karaktereknek nincs Unicode-kódjuk, így például a δ̕ másképp nem is kódolható. Az egységesség tehát indokolja ezt a megoldást. Az azonban aligha érthető, hogy ha az adatok így vannak kódolva, akkor az adatbázis-kezelő miért nem így keresi őket. További probléma, hogy a netes keresőket használva bizonyára senki nem fogja a s + ́, illetve s + ̌ kombinációkat használni, így Unicode ide, Unicode oda, az adatok nem érhetőek el az adatbázis-kezelőn kívül. (A jelenlegi állapotban – legalábbis egyes számítógépeken – a saját adatbázis-kezelővel sem.) A javítás során mindenképpen inkább a kódolást kellene megváltoztatni, hiszen ellenkező esetben ügyelni kell, hogy a mellékjel nélküli betűkre keresve a kereső ne dobja ki a mellékjeles betűket is – ez pedig ha nem is megoldhatatlan, de bonyolultabbá teszi a keresést.

Ha sikerül adatokat elővarázsolnunk az adatbázisból, akkor az az első ötven találatot listázza, jelezve a találatok számát. Elvben a további adatok listázására is mód lenne, de a megfelelő linkekre kattintva új keresés indul. Ugyanez a helyzet, ha megpróbálunk egyszerre tíz vagy száz adatot listázni – a funkciók nem működnek. Ennek köszönhetően az összes releváns adat nem is érhető el.

A rekonstruált alakok szótagszerkezetére is kereshetünk, ha a mássalhangzók helyére C-t, a magánhangzók helyére V-t írunk. Ezeket valódi hangokkal is pótolhatjuk, például ha a CaCCa keresőkifejezést használjuk, akkor megkapjuk azokat a rekonstruált alakokat, melyek két szótagúak, mindkét magánhangzójuk a, mássalhangzóval kezdődnek és a szótaghatáron két mássalhangzó áll.

A második fiókban a leánynyelvi adatokra kereshetnénk rá. Valójában sajnos nem tehetjük, csupán azt adhatjuk meg, hogy milyen nyelvben előforduló adatok érdekelnek minket. Rákereshetünk tehát például olyan etimonokra, amelyeknek magyar megfelelőjük van. Sajnos azonban nem kereshetünk olyan etimonokat, amelyeknek adott nyelvekben nincs megfelelőjük – például olyanokra, amelyeknek van finn, de nincs észt folytatójuk, vagy van obi-ugor, de nincs magyar folytatójuk. Az előbbi megoldható lenne azzal, ha amellett, hogy milyen leánynyelvben van megfelelő, azt is beállíthatnánk, hogy melyben ne legyen. Az utóbbi már bonyolultabb lenne, hiszen logikai viszonyokat kellene felállítani: legyen manysi VAGY hanti megfelelő (de nem szükséges mindkettő), de ne legyen magyar. Ez valóban komolyabb fejlesztést igényelne, de hosszabb távon ez is elengedhetetlennek látszik, ha valóban jól használható eszközt szeretnénk.

Keresés a leánynyelvi adatok között

A másik lehetőség, hogy a leánynyelvek között kölcsönzött, de alapnyelvi eredetű szavak között keresünk. Például ha átadó nyelvként beállítjuk az észtet, átvevőként pedig a finnt, akkor megtudjuk, hogy három olyan ősi szó van, melyet a finn ugyan nem őrzött meg, mégis megtalálható benne észt jövevényszóként. (Ellenkező irányban 21 kölcsönzés történt: ebből azonban nem érdemes messzemenő következtetéseket levonni, hiszen itt nem az összes, az észt és a finn között végbement kölcsönzésről van szó, csak az alapnyelvi eredetű szavakról.) Az átadó és átvevő nyelvek között csak az uráli nyelvek egy része jelenik meg, más részük (így a magyar) nem: feltehetően azért, mert ezek sem átadó, sem átvevő nyelvként nem szerepelnek. Ez a funkció jól látszik működni, bár a vaktesztelés itt is érdekes eredményt hozott. Amikor rákerestünk, hogy hány lív szó került át más nyelvbe, kiderült, hogy csak egy: a *kewe ’állat nősténye’, méghozzá melyik nyelvbe? Olvasóink nem fogják kitalálni: a lívbe. Feltehetően adatrögzítési hibáról van szó, melyet nehéz észrevenni, de ha nekünk ilyen gyorsan sikerült egy ilyen hibába belerohannunk, joggal tehetjük fel a kérdést, hogy hány hasonló hiba lehet még. (Az önkölcsönzés ilyen esetei az adatbázisból könnyen kiszűrhetőek, ámde felmerül a kérdés, mi van, ha a kölcsönző nyelv rosszul van jelölve, ám nem azonos a kölcsönzővel...)

A különböző fiókok közötti kereséseket lehet kombinálni,tehát rákereshetünk olyan szavakra, tehát például rákereshetünk olyan szavakra, melyek az alapnyelvben p-vel kezdődtek, van finn és magyar megfelelőjük, és a komiból valamely más uráli nyelv átvette őket. Két ilyen szót találunk, a magyar facsar és a fúr megfelelőit.

A legnagyobb hiányosság, hogy leánynyelvi adatokra közvetlenül nem lehet keresni. Ez különösen azért furcsa, mert a korábbi változatban ez még lehetséges volt. Feltehető, hogy nem csupán az egyszerű felhasználók, de a szakemberek is leggyakrabban egy-egy mai szó etimológiájára lesznek kíváncsiak. Tegyük fel, hogy a magyar nyelv szó eredetére vagyunk kíváncsiak. A legegyszerűbb lenne, ha beírnánk a keresőbe, hogy „nyelv”, és az megtalálná a megfelelő szócikket – ahogy erre korábban lehetőség volt.A jelenlegi változatban azonban ezt nem tehetjük meg, hiszen közvetlenül csak az alapnyelvi alakokra kereshetünk, azt pedig a szakértők is csak ritkán tudják biztosan fejből, az érdeklődő laikusnak pedig fogalma sem lehet róla. Maradna tehát az a fapados megoldás, hogy kilistázzuk az összes magyar szót (ezt a nyelv elnevezésére

Elveszett paradicsom
(Forrás: anyanyelv-pedagogia.hu)

kattintva tehetjük meg): az első oldalon meg is jelennek a magyar szavak az ad-tól az ëgyházig, és a program jelzi, hogy az adatok még hat további oldalon folytatódnak. Tippünk szerint a nyelvnek valahol a 3. vagy a 4. oldalon kell lennie – a számokra kattintva azonban nem a magyar, hanem az alapnyelvi adatok listázása folytatódik!

Próbálkozhatunk azzal a trükkel, hogy az alapnyelvi jelentéshez írjuk be a nyelvet: ebben az esetben kapunk is két találatot, melyek közül az egyikben valóban ott lesz a magyar nyelv. Ez a módszer azonban nem működik minden esetben. Ha például az ’ajtó’ jelentésre keresünk rá, megint két találatot kapunk, de ezek közül egyik sem lesz magyar adat. Ebből azonban elhamarkodott lenne azt a következtetést levonni, hogy a magyar ajtó nem alapnyelvi eredetű! Az ajtó az ábécé elején áll, így szerepel a magyar adatok első oldalán: kideríthető, hogy egy ugor ’eloldódik, kiszabadul’ jelentésű ige származéka.

Hasonló keresésekre nem csupán a kutatónak lehet szüksége. Például az is elképzelhető, hogy egy középiskolai tanár szeretné kigyűjteni az olyan magyar szavakat, amelyek f-fel kezdődnek, de van finn megfelelőjük is. Jelenleg erre nincs módja, de ha a magyar adatok listázása működne, akkor is csak azt tehetné, hogy az összes szócikket, amelyben f-kezdetű magyar adat szerepel, megnyitja, és megnézi, melyikben van finn adat. Az igazi megoldás persze az lenne, ha lehetne egyenesen olyan listát készíteni, amelyekben csak a finn és csak a magyar adatok szerepelnek (ha egyszer csak ezekre van szükségünk), és nem kellene kézzel kopipésztelni a szükséges adatokat. Ettől azonban még fényévekre van a rendszer.

A valódi kutatási feladatokhoz azonban ez sem volna elég. A Csúcs-féle eredeti ötlet ennél összetettebb kereséseket igényelne. Például tudjuk, hogy a hal szó finn megfelelője kala, és az alapnyelvi alakot is így rekonstruáljuk: *kala. De vajon következetesen a-t rekonstruálunk az első szótagban, ha a magyarban és a finnben is a áll ott? Ezt úgy tudnánk ellenőrizni, ha tudnánk olyan alakokra keresni, melyeknek van finn és magyar folytatójuk is, és mindkettő első szótagjában a áll. Az adatbázis birtokában ez könnyű feladat lenne, ámde a kereső ilyenre lehetőséget sem kínál – holott valójában éppen ez az, amire érdemes lenne használni. A rekonstruált alakok sokkal kevésbé érdekesek, hiszen ezek feltételezéseken alapulnak, nem tények. Egy eljövendő kutatás sokkal inkább arra irányulhat, hogy ezeket felülbírálja, módosítsa: ehhez azonban a leánynyelvi adatok, és nem a rekonstrukciók között kellene keresgélni!

A harmadik fiókban a magyarázó részekben lehet keresni – mivel ezek német nyelvűek, természetesen németül. Először a „tschuw.” betűsorra próbáltunk rákeresni, feltételezve, hogy ez a csuvas nyelv rövidítése, és mivel a csuvas több finnugor nyelvvel is érintkezett, feltehetően valahol említik. Sajnos feltételezésünk megalapozatlannak bizonyult, mert találatot nem kaptunk. Ezutána a „tat.” rövidítéssel próbálkoztunk, hátha a tatár nyelvet említik. Ekkor két találatot kaptunk: az egyik esetben nem a tatárról volt szó:

s. noch unter *meke 'Sache, Tat...; tun, machen, arbeiten'

Ebben az esetben a német Tat ’tett, cselekedet’ szó bukkant fel, de a keresés természetesen sikeresnek tekinthető. A másik esetben valóban a tatárra történt utalás:

Die Herleitung von ung. szösz aus einer Turksprache: kas.-tat. süs 'Werg, Hede', tschuw. süs 'zum Spinnen bereiteter Hanf od. Flachs' (Munkácsi: NyK 21: 127; Gombocz: MNy. 3: 358), ist nicht akzeptabel. Kas.-tat. süs ist möglicherweise ein syrj. Lehnwort, das tschuw. Wort stammt aus dem Kas.-Tat.

Ebben az esetben valóban tatár adatokat találunk – ami igazán megdöbbentő, az az, hogy csuvasokat is, méghozzá éppen a várt „tschuw.” rövidítéssel! A hibát sem nehéz megtalálni: a rövidítést záró pont ugyanis már nem félkövéren van szedve, a félkövér szedést záró html-tag pedig a karaktersorba ékelődik. Az már eleve hiba, hogy a pont hol félkövéren van szedve, hol nem, így a rögzítés eleve következetlen. Az azonban egyenesen érthetetlen, hogy a keresés miért nem ignorálja a beékelődő html-tageket. Persze az elegáns, adatbázishoz méltó megoldás az lenne, ha eleve lehetne nyelvek alapján keresni a megjegyzésekben, de erre feltehetően még néhány évtizedet várnunk kell.

A harmadik és negyedik fiók

Biztató viszont, hogy a negyedik fiókban a bibliográfiai adatok között már hasonló módon kereshetünk. Itt ugyanis azt adhatjuk meg, hogy mely szerzőkre, vagy mely művekre (monográfiákra, folyóiratokra stb.) való hivatkozásokat szeretnénk megtalálni. Sajnálatos (és némiképpen érthetetlen) módon a kettőt nem tudjuk kombinálni, tehát nem tudunk rákeresni például Munkácsi Bernátnak a Nyelvtudományi Közleményekben megjelent írásaira való hivatkozásokat. Bizonyára nem gyakoriak az olyan tudománytörténeti kutatások, ahol pont ilyesmire lenne szükség, de ha egyszer a lehetőség meglenne rá, nem világos, miért kell tiltani.

Az már kevésbé érthető, hogy miért kell külön szerzőként feltüntetni Radanovicsot, Radanovics (Rédei)-t, pláne Rédei (Radanovics)-ot, illetve Lytkint és Lytkint! Az előbbire (vagy az utóbbira?) például csak egyszer történik hivatkozás, a másikra viszont 424 szócikkben! Megint azzal az esettel állunk szemben, amikor a hiba kiszűrése minimális erőfeszítést igényelt volna: ha valaki csak megnyitja a szerzők listáját, azonnal feltűnik, hogy Lytkin és Rédei (Radanovics) neve a névsoron kívül, annak elején áll – még csak nem is a végére van elrejtve!

Patyomkin-szindróma

Összességében meg kell állapítanunk, hogy az Uralonet jelenlegi állapotában nem több egy Patyomkin-falunál: látszólag egy csodálatos adatbázis, mely valójában használhatatlan: az első „működő”, „kész” verzió a legalapvetőbb funkciók ellátására is alkalmatlan. Ami azért is különösen szomorú, mert nem egyszerű kamuról van szó, hanem hatalmas munka áll mögötte. Szerencsére elmondhatjuk, hogy ez a falu könnyen lakhatóvá tehető, ha kijavítják a legalapvetőbb hibákat. Mi több, némi fejlesztéssel az is elérhető, hogy jól élhető, nyüzsgő várossá fejlődjön.

Az egyetlen ok, ami pesszimistává tehet minket, az adatbázis története. Úgy tűnik, hogy az utóbbi két-három évben sem változott a projekt történetét jellemző két évtizedes tendencia, mely szerint a fejlesztés során csupán egyetlen szempont nem érvényesül: hogy a program valóban működjön, használható legyen. Nem látjuk, mi arra a garancia, hogy a következő két hétben, két hónapban vagy akár két évben ez megváltozzon. Nem értjük, hogy az ország egyik vezető nyelvtechnológiai műhelyében hogy feledkezhetnek meg arról, hogy a szoftverfejlesztés egyik legfontosabb része az alapos tesztelés. Nem értjük, hogy a fejlesztésben részt vevő finnugrista szakemberek hogy tudnak kiállni a nyilvánosság elé azzal, hogy a mű elkészült, anélkül, hogy a legalapvetőbb tevékenységeket, amelyeket a várható felhasználók elvégeznének, nem végzik el, és nem ellenőrzik, hogy a program valóban működik-e.

A magunk részéről természetesen annak örülnénk a legjobban, ha nemsokára valóban használható lenne a program, hiszen etimológiai cikkeink megírásához eddig is használtuk, amikor lehetett. A fentiek ismeretében azonban bizonyára érthető a szkepticizmusunk.

Kapcsolódó tartalmak:

Hasonló tartalmak:

Hozzászólások (660):

Követem a cikkhozzászólásokat (RSS)
Az összes hozzászólás megjelenítése

4 éve 2020. augusztus 5. 09:18

660 Libertate

@mondoga:

Az anyai ágon, "ugor" apai ágon "árja" magyarok vízióját, egyébként az itt publikáló egyik szerző (nem szerkesztő) a cikkeiben is felvázolja! Ez is lehet a "kapcsolat" egy módja.

Sőt azt is kifejti, hogy ez a "finnugor rokonság nekünk gyanús”…

„Minket viszont… leginkább a „nemzeti atyafiság" azon tényezője érdekel, hogy a Kárpát-medencébe érkezett elődeink kultúrájában mennyire volt jelen a finnugor rokonság. És éppen az a mi kételkedésünk alapja, hogy saját tudományunk eredményeivel nem tudjuk alátámasztani azt, amiben hinni szeretnénk - a finnugor rokonságot. A honfoglaló magyarság anyagi kultúrájában ugyanis nem találjuk a finnugor eredetű elemeket.”

4 éve 2020. augusztus 5. 09:03

659 Libertate

@tol:

Én a magam részéről minden egyezést egy közös hatásként értékelek. Ez a közös „hatás” pedig az eurázsiai sztyeppét évezredekig uraló árja, indoiráni, szkíta, szarmata beolvadásból vezetek le.

Ehhez persze még hiányoznak az archeogenetikai ásatag adatok, de a jelenlegi populációk adataiból számomra az tűnik ki, mint a leginkább ellentmondásmentes variáció. Minél közelebb él egy népcsoport a valamikori „szkíta” területekhez, annál magasabb az R1a aránya. A számszerűségben ugyan lehet kivételeket találni, de az arányok szerintem szembeötlőek.

„a magyar férfiak 4,6%”

Nem a magyar férfiak, hanem a székely férfiak - ami azért nem elhanyagolható - és ez nem azt jelenti, hogy a székelyek ma nem magyarok, csak azt, hogy a hagyomány szerint mindig is tartottak valamilyen megkülönböztetést a két csoport között, aminek úgy néz, ki genetikailag is van némi alapja.

Pamjavék egyébként kijelentették, hogy:

„A rendelkezésre álló genetikai adatok alapján számos fontos kérdés eldönthetetlen. így nem tudjuk, hogy a magyarok és az obi-ugorok elődei valós kulturális közösséget alkottak-e, vagy csak egymás közelében éltek.”

A „csapatból egyedül Csájii volt az, aki különvéleményként „megerősítést” olvasott ki az adatokból:

„A genetika megcáfolhat néhány tévhitet, vagy megerősíthet, néhány állítást. Az egyik ilyen megerősített állítás, hogy az ugor közösség, amelyből az obi-ugor és a magyar nyelvű közösségeket is származtatják, társadalmi kapcsolatban is kellett, hogy álljanak egymással.”

Ez a különvélemény azonban nem önmagában meglepő, hanem azért mert előtte, egy egész fejezetben fejtette ki ellenvéleményét a populációgenetikai adatok etnikai és társadalomtörténeti értelmezésével kapcsolatban. Hogy ne mondjam azok „tagadásával” kapcsolatban.

@mondoga:

De semmi bizonyíték nincs arra, hogy ez a kapcsolat az volt hogy egy csoportban éltek, egy nyelvet beszéltek, amely csoport és nyelv ráadásul egy előző "nagyobb" csoportból vállt ki!

Ezt eddig még csak a nyelvészek állítják, egyetlen más tudomány sem tudta ezt megerősíteni - sőt!

4 éve 2020. augusztus 5. 07:38

658 mondoga

@Libertate: Azért ennél korrektebb módon is hivatkozhatnál...

Ahogy elnézem, a google-fordítás csak két bekezdésnyi, a harmadik bekezdés a saját véleményed. Ezt illő volna jelezni, mert könnyen félreérthetik az olvasók.

"... there is nothing in the present-day gene pool of the sampled Hungarians that we could tie specifically to other Uralic speakers. It is important to note here that our sample comes from the capital region."

A gugli helyett egy korrektebb megközelítés. az első mondatban a jelenlegi (élő) magyarok mintáiról van szó, amelyek nem egyeznek specifikusan más uráli beszélők mintáihoz. De fontos megjegyezni, hogy ezek a minták a fővárosi környezetből származnak és nem feltétlen mutatják a teljes magyarságra vonatkozó képet. (A most általam bevágott angol idézet kicsit meg van vágva, a cikkben ez bővebben van kifejtve.)

@Libertate: "A magyaroknak semmi közük az uráli nyelvű népekhez, sem a nyelvükhöz! Volt időszak amikor nyilvánvalóan egymás mellet éltek, így a nyelveik is hatottak egymásra, de ennél semmi több."

Ez az állítás így hamis, nyilvánvalóan volt közük egymáshoz, mind a nyelvnek, mind a népcsoportoknak. Aki ezt nem látja, az vak, vagy szándékosan ködösít.

4 éve 2020. augusztus 4. 23:50

657 tol

@Libertate: Pamjav Horolma genetikus ősszehasonlitotta a manysi és a magyar apai ágakat ennek alapján számszerüen elmondható , hogy van két finugor népekre jellemző haplocsoport az N L 1034 és az R1a Z 280 és ezen két haplocsoporton keresztül a déli manysi férfiak 44% százaléka rokon a mai magyar férfiak 4,6% százalékával ez háromezer év és több ezer km távolság után nem rosz.

Tehát nem csak nyelvi hanem igen komoly genetikai kapcsolat van a mai magyarok és a manysik közöt.

Az R1a Z 280 úgy tünik közös apai ága volt a finugor népeknek finnek , manysik,komik,magyarok közös apai ága még ásatag mintából nem került elő ezért tudományosan nem lehet rá azt mondani hogy finugor még akor sem ha ha az.NL 1034 a következő populációkban megtalálható magyar, déli manysi , üzbég ,kazah, tatár , baskir, görög a R1a z280 pedig finn, magyar, székely , csángó, manysi, komi, üzbég és burját populációk közös apai ága.

Az üzbég NL1034 és R1a Z 280 a fergánai medencéből származik ,.

4 éve 2020. augusztus 4. 21:00

656 Libertate

@Cypriánus:

"A magyarokra rendkívül specifikus R1b : 18 %"

Akkor az I= 24 - miért nem "rendkívül specifikus, vagy az R1a =30% az miért nem?

Vagy az R+I +J = 84% az miért nem rendkívülspecifikus?

Pedig ez pl. egyértelműen európai - mi köze ennek a manysik N=90% - ához?

4 éve 2020. augusztus 4. 20:17

655 Libertate

@Cypriánus:

Már írtam, árja-indoeurópai-szkíta-szarmata hatás - mindkettőnél.

4 éve 2020. augusztus 4. 20:02

654 Cypriánus

@Libertate:

A komikban közel annyi az R1b, és több az R1a mint a magyar népességben. Akkor most mi van?

4 éve 2020. augusztus 4. 20:00

653 Libertate

@Cypriánus:

Minél közelebba szkíta területekhez!

R1a Manysi 5%

R1b Manysi 7%

Velük pedig állítólag ie. 500 - ig éltünk együtt!

N - Manysi 90%

N - Magyar 1%

4 éve 2020. augusztus 4. 19:55

652 Libertate

@Cypriánus:

Bocs véletlenül az R1b - t másoltam be.

Finn= 5%

Észt=32%

Komi=29

Manysi=5%

A véleményem az nem változott!

4 éve 2020. augusztus 4. 19:55

651 Cypriánus

@Libertate:

A magyarokra rendkívül specifikus R1b : 18 %

Mordvin: 15 %.

Azért ez nem tűnik a világok harcának.

4 éve 2020. augusztus 4. 19:55

650 Cypriánus

@Libertate:

A magyarokra rendkívül specifikus R1b : 18 %

Mordvin: 15 %.

Azért ez nem tűnik a világok harcának.

4 éve 2020. augusztus 4. 19:49

649 Libertate

@Cypriánus:

@mondoga:

Gyorsfordítóval:

Az egyik figyelemre méltó megfigyelés, amely a finomszerkezeti elemzés során kiemelkedik, hogy sem a magyarok, sem az észtek vagy a mordoviak nem alkotnak genetikai klasztereket más uráli beszélõkkel, hanem a földrajzilag szomszédos minták széles spektrumával.

A magyarok vándorlásának dokumentált története ellenére [ 63], valamint az Ural-hegységtől keletre élő Khanty és Mansi nyelvi rokonságukkal kapcsolatban, a mintában szereplő magyarok jelenlegi génkészletében nincs semmi olyan, amelyet kifejezetten más uráli beszélőkhöz köthetnénk.

A magyaroknak semmi közük az uráli nyelvű népekhez, sem a nyelvükhöz! Volt időszak amikor nyilvánvalóan egymás mellet éltek, így a nyelveik is hatottak egymásra, de ennél semmi több.

4 éve 2020. augusztus 4. 19:45

648 Cypriánus

@Libertate:

Nem tudom, honnan veszed a haplocsoportok megoszlását, de az adatait tévesek.

Pl az észtek esetén az R1a nem 3 %, hanem 37 %, a komi meg 33 %.

Akár Wikipédia szintjén át lehet futni, ha már az általam belinkelt cikket nem olvasod el.

en.m.wikipedia.org/wiki/Y-DNA_haplogroup...opulations_of_Europe

4 éve 2020. augusztus 4. 19:28

647 Libertate

@mondoga:

Nem tudom miről beszélsz:

Finn= 3%

Észt=8%

Komi=11%

Manysi=7%

Teljesen egyértelműen megfigyelhető, hogy annál több az R1a, minél közelebb van az adott populáció a valamikori "szkíta" területekhez.

Minden uráli nyelvű és szláv nyelvű közösség a "árja, indoiráni, szkíta" vonaltól kapta az R1a-t.

R1b - pedig egyáltalán nincs, csak a magyaroknál, ez is bizonyíték arra, hogy a magyarok elődei soha nem éltek együtt a mai uráli nyelvet beszélők elődeivel, tehát soha nem beszéltek egy közös "alapnyelvet".

4 éve 2020. augusztus 4. 16:09

646 Cypriánus

genomebiology.biomedcentral.com/articles...86/s13059-018-1522-1

Külön fölhívnám a figyelmet a 6. ábrája. A nagy kék oszlopok a Zsinegdíszes komponens.

Az összes hozzászólás megjelenítése

Váltás normál nézetre...