0:05
Főoldal | Rénhírek
Itt a bizonyíték?

Mi is az az Uralonet?

Hamar munka sosem jó. Az Uralonet, az uráli nyelvek alapnyelvi eredetű szókincsének adatbázisa több mint két évtizeden át készült, habár úgy tűnik, akár három év alatt is megszülethetett volna. Cikkünkben nem csupán a történetét meséljük el, annak is utánajártunk, mire használható mai állapotában.

Fejes László | 2012. november 29.

A tudomány egyik legnagyobb problémája az, hogy azok az adatok, amelyeket felhasználna a kutatáshoz, nem érhetőek el az interneten. Miközben a világban természetessé vált, hogy a minket érdeklő információkat pillanatok alatt megtaláljuk a világhálón, a tudományos munkához szükséges adatoknak, forrásoknak csak kis töredéke férhető hozzá szabadon az interneten keresztül. Pillanatnyilag a legfontosabb feladatok egyike az, hogy a korábban papíron olvasható adatokat, szótárakat, monográfiákat, tanulmányokat elektronikusan is hozzáférhetővé tegyük. Ebben a munkában a magyarországi finnugrisztika most hatalmas lépés megtételével büszkélkedhet.

2012. november 23-án pénteken mutatták be a Magyar Tudományos Akadémia székházában az Uralonetet, az Uralisches Etymologisches Wörterbuch (Uráli etimológiai szótár, rövidítve UEW vagy UEWb) elektronikus változatát. A szótár a hetvenes-nyolcvanas években készült az MTA Nyelvtudományi Intézetének Finnugor osztályán Rédei Károly vezetésével, 1986 és 1989 között jelent meg.

A német nyelvű szótárban címszóként a kikövetkeztetett alapalak szerepel, megadva mellette a kikövetkeztetett alapnyelvi jelentést (szintén németül), azt, hogy melyik (uráli, finnugor, ugor, finn-permi, finn-volgai) alapnyelvre rekonstruálható a szó, illetve biztos vagy csupán lehetséges-e a rekonstrukció. Ezután felsorolják az etimológiához tartozó leánynyelvi megfeleléseket, majd ezt követi a magyarázat. A magyarázatban kitérnek a jelentésváltozásokra és a szabálytalan hangváltozásokra,  a leánynyelvi adatokban felbukkanó képzőkre, az esetleges bizonytalanságok okaira stb. A szócikket válogatott bibliográfia zárja, melyben a szó etimológiájára vonatkozó, a szerkesztők által legfontosabb munkák vannak felsorolva.

Luca szájtja

A szótár elektronikus változatának ötlete a nyolcvanas évek végén merült fel Csúcs Sándorban, aki az UEW egyik munkatársa volt. Ő úgy vélte, hogy az UEW bizonyos rekonstrukciói talán nem eléggé következetesek, de ennek ellenőrzéséhez rengeteg adatot kell előkeresni, amely a szótárral vagy cédulákat használva szinte megoldhatatlan (de legalábbis rengeteg időt követelő) feladat. A számítógép segítségével viszont másodpercek alatt megtalálhatjuk a minket érdeklő adatokat.

Ma már persze érezhetjük úgy, hogy az ötlet kézenfekvő volt, de annak idején forradalminak volt mondható. Ebben az időben csupán néhány számítógép volt a Nyelvtudományi Intézetben, a kutatók még kézzel írták cikkeiket, amelyeket gépírónők gépeltek le, és az így készült kéziratok mentek a nyomdákba. Akkoriban úgy képzelték, hogy majd lesz a sarokban egy számítógép, amelyre telepítve lesz az UEW elektronikus változata, és azok a kutatók, akik a szótár anyagával szeretnének dolgozni, majd e gép mellé fognak ülni, elvégzik a kereséseket, majd átadják helyüket másoknak. Később, a CD-technológia elterjedésével már úgy képzelték, hogy a szótár anyaga forgalmazható lesz, és akár a külföldi kutatóhelyeken, vagy otthon is használhatják az érdeklődők. Az internet elterjedésével (illetve a CD-technológia elavulásával) persze már egy online hozzáférhető, folyamatosan frissíthető, javítható, bővíthető változatot tartottak már szem előtt.

A szótár elektronikus változatának munkálatait 1991-től 2009-ig, nyugdíjba vonulásáig Csúcs Sándor vezette. A szótár anyagát már a kilencvenes években első felében rögzítették a Finnugor osztály munkatársai, méghozzá egyszerűen úgy, hogy az anyagot Microsoft Wordbe írták, RTF-formátumban mentették. A kellő számítógépes tudás azonban ekkor nem volt meg az intézetben, éppen ezért a munkálatokba bevonták Bátori Istvánt, aki ekkor a Koblenz Egyetemen a számítógépes nyelvészeti intézetet vezette, korábban pedig maga is finnugrisztikával foglalkozott. Ettől kezdve a technikai fejlesztést Bátori vezette, a szoftver fejlesztésébe több tanítványát, szakdolgozóját is bevonta. A szoftver jelentős része el is készült, a funkciói többé-kevésbé működtek, ám meglehetősen megbízhatatlanul: valódi munkaeszközként nem volt használható.

Eközben Csúcs Sándor szorgalmasan bővítgette az adatbázist: a szócikkeket kiegészíttette más rekonstrukciókkal (például Collinderéivel, Janhunenéivel), a leánynyelvi adatokat az időközben megjelent szótárakéival (például az udmurt adatokat Wichmann udmurt szótárának adataival), megadta a rekonstruált jelentéseket angolul és magyarul is, illetve beledolgozta az anyagba saját permi rekonstrukcióit.

A projekt eredetileg Uráli Etimológiai Adatbázis (UEA), majd UEDb (Uralische Etymologische Datenbasis, Uráli Etimológiai Adatbázis) néven futott. Később a Bátori-féle változat az Uralothek nevet kapta, a Nyelvtudományi Intézetben fejlesztett változatot pedig az Uralonetnek nevezték el. Az UEDb név előnye volt, hogy erősen emlékeztetett az alapjául vett szótár címének rövidítésére (UEWb). Az új elnevezéseket semmiképpen nem tarthatjuk szerencsésnek, hiszen nem utalnak arra, hogy etimológiai szótárról van szó: éppúgy lehetne uráli nyelvészeti tanulmányokat, uráli nyelvű szövegek internetes gyűjteményét (korpuszát) stb. így nevezni. Az Uralonet logója már sokkal szerencsésebb, szellemes választás.

2009-ben Csúcs Sándor nyugdíjba vonult, a szoftver viszont továbbra sem volt publikálható állapotban. A Finnugor és nyelvtörténeti osztály munkatársai úgy döntöttek, hogy a szótár kiadása nem halogatható tovább. Az intézet nyelvtechnológiai osztályát kérték fel arra, hogy segítsenek rendbe hozni a Bátori-féle verziót, ám az ottani munkatársak úgy látták, célszerűbb az adatbázisban való kereséshez egy újabb programot fejleszteni, mint Bátori verzióját javítgatni. Ebben az időben Bátori István is publikálta a maga adatbázis-kezelőjének tesztváltozatát: ez ma is elérhető az interneten. (Ezt a változatot linkeli az Uralonet is, ámde rosszul: az ott megadott címen ma már nem érhető el a szolgáltatás.)

Az Uralonet logója az egyik legismertebb rekonstrukcióra, a *kala ’hal’ szóra utal
Az Uralonet logója az egyik legismertebb rekonstrukcióra, a *kala ’hal’ szóra utal

A szoftver fejlesztésével párhuzamosan elindult az adatbázis ellenőrzése, és ennek során kiderült, hogy ebben is rengeteg hiba van. Végül a nyolcvanmillió karaktert tartalmazó adatbázist olyan mélységig kellett ellenőrizni, hogy az gyakorlatilag felért az újrarögzítéssel. Ráadásul a legtöbb Csúcs-féle bővítés nem volt meg benne: az anyag kizárólag a jelentések angol és magyar megadását, illetve Csúcs permi rekonstrukcióit tartalmazta. Az előbbieket alapos ellenőrzés és javítás után meghagyták, az utóbbiakat viszont – legalábbis ideiglenesen – jobbnak látták eltávolítani az adatbázisból.

Érdekes módon az Uralonetet már többször bemutatták, legelőször szinte napra pontosan két évvel a mostani bemutató előtt, 2010. november 22-én *kala a hálón címmel a Nyelvtudományi Intézetben. A következő két év folyamán több ilyen bemutató is volt, ám az oldalon ott virított a „Még nem végleges változat” felirat, mely idén november végén végre eltűnt. Az első igazi változatnak tehát a mostani tekinthető.

Az új szoftver és adatbázis már megfelel rengeteg olyan követelménynek, amelynek a Bátori-féle változat nem felelt meg. Bátori saját karakterkészletet használt, és az adatokat is sajátosan kódolta (például a diftongusokat egy számmal kódolta, azaz pl. az uo betűkapcsolatot egyetlen kód, és nem kettő – az u-é és az o-é) jelölte. Ennek hatalmas hátránya, hogy az interneten az adatbázis adatai csakis az erre készült adatbázis-kezelővel kereshetőek, a Google vagy a hasonló netes keresők nem fogják megtalálni az adatokat. (Ne felejtsük el, hogy a Bátori-féle változat kidolgozásának kezdetekor az internetes megjelenés még fel sem merülhetett!) Az Uralonet ezzel szemben a Unicode-kiosztást használja és a jelenlegi szabványok szerint kódolja az adatokat, így a netes keresőkkel is elérhető. További előnye, hogy a megjelenített adatok így könnyen másolhatóak, beilleszthetőek szövegszerkesztőkbe, mailbe stb., azaz sokkal könnyebb dolgozni velük.

A fejlesztők néhány új, hasznos funkciót is bevezettek. Így például a magyar adatok mellett megjelentek a MNSz, illetve a HHC feliratok, melyekre kattintva a Magyar Nemzeti Szövegtárban, illetve a Magyar Történeti Korpuszban kereshetjük ki az adott szót. (Arra persze ügyelni kell, hogy nem minden találat tartalmazza ugyanazt a szót!)

Összességében tehát elmondhatjuk, hogy hatalmas jelentőségű munkáról van szó: a világon először érhető el egy teljes nyelvcsalád etimológiai szótára internetes adatbázisként. Ha hozzátesszük, hogy az adatbázis-kezelőt újonnan kellett kifejleszteni, az adatbázis ellenőrzése pedig szinte felért annak újbóli rögzítésével, akkor könnyen beláthatjuk, hogy hatalmas munkáról volt szó. A magyar tudományosság ismét jelentős eredménnyel büszkélkedhet.

Lássuk a medvét halat!

Az Uralonet nyitóoldaláról a többfelé juthatunk, így például megnyithatjuk az oldalra vonatkozó információkat, a súgót, illetve az oktatáshoz nyújtott segédanyagokat. Az Uralonet érdemi része azonban a Keresőfelület menüpont alatt található, tulajdonképpen ezt nevezhetjük az Uralonetnek. A magunk részéről célszerűbbnek tartanánk, ha a keresőfelület lenne a nyitóoldal, hiszen a súgó megnyitására itt is lehetőség van, a többi részhez mindössze két linket kellene itt elhelyezni.

Négy fiók
Négy fiók

A keresőfelület négy fiókra oszlik, és különböző adattípusokra kereshetünk rá. A felső fiókban a rekonstruált szavakra kereshetünk, a másodikban a leánynyelvek adataira, a harmadikban a magyarázó részekre, a negyedikben pedig a bibliográfiai adatokra.

Az alapalakokra való keresés fiókjában legfölül azt állíthatjuk be, hogy hol kereshetjük az adatokat: meghatározhatjuk, hogy melyik rekonstruált alapnyelvben szeretnénk kutatni, illetve hogy a biztos vagy a bizonytalan rekonstrukciók érdekelnek-e minket (vagy mindkettő). Sajnos vagy csak az egyik alapnyelvet választhatjuk, vagy az összeset, holott lehet, hogy az alapnyelvek egy csoportja érdekel minket. Például ha az olyan etimonok között keresgélnénk, melyek a magyar számára relevánsak (tehát az uráli, a finnugor, vagy az ugor nyelvre rekonstruálták őket – a finn-volgai és a finn-permi adatok ekkor nem érdekesek), de a magyarban nem feltétlenül van megfelelőjük, akkor a három alapnyelvre külön kell rákeresnünk. De az is lehet, hogy olyan etimonokat keresünk, melyeket a finn-permi és az ugor nyelvekre rekonstruáltak, de a finnugorra vagy az urálira nem, és éppen az érdekel minket, hogy ezeket nem lehetne-e mégis összekapcsolni valahogy, a program akkor sem segít nekünk, egy csomó munkát kézzel kell elvégeznünk – pedig programozásilag nem lenne nagy ügy megoldani, hogy tetszőleges alapnyelvi kombinációkban kereshessünk.

A fiók következő két mezőjében megadhatjuk, hogy mit keressünk. A felsőben azt, hogy milyen fonémasorokra (betűsorokra) kereshetünk rá: megadhatjuk, hogy ezeket a program a szavak elején, közepén vagy végén keresse-e, vagy teljes szavakra keressen rá. Az alsóban pedig fogalomkörök alapján szűkíthetjük a jelentést, illetve adott jelentésű rekonstrukciókat kereshetünk!

A tesztek a 2012. november 27-ei állapotokat tükrözik.

Elvégeztünk egy egyszerű próbát! Rákerestünk az š kezdetű szavakra: a megfelelő karakter a magyar billentyűzetről könnyen elérhető az AltGr+2 s billentyűkombinációval, de a képernyőn látható megfelelő gombra kattintva is beírható – a szoftver tehát itt előzékenyen segíti a felhasználót. Azt az eredményt kaptuk, hogy ilyen szó nincs – ez meglepheti azokat, akik valaha tanultak uráli hangtörténetet! Tettünk egy próbát a ś-sel (ez az AltGr+9 s billentyűkombinációval is elérhető): az eredmény hasonló. Az egyszerűség kedvéért rákerestünk rá az s kezdetű szavakra: a dolog működött, sőt, túlontúl jól is működik: ezúttal ugyanis kilistázásra kerülnek az ś és š kezdetű szavak is! Ha jobban megfigyeljük, kiderül a hiba forrása is: ezek a szavak nem az ś, illetve š karakterekkel, hanem az s +  ́, illetve s +   ̌ karakterekkel van kódolva. (Megfigyelésünk szerint a probléma minden mellékjeles betűnél fennáll.) Később más számítógépen is elvégeztük a teszteket, és ott az ékezetes keresés működött: elképzelhető, hogy a fejlesztők is ilyen gépen dolgoztak, ezért nem fedezték fel ezt a hibát. Ugyanakkor az mellékjel nélküli karakterekkel keresve minden esetben megkapjuk a mellékjeles karakteres találatokat is – ráadásul a lista elején, így ezt a hibát viszonylag könnyű kiszűrni.

Azok a fránya ékezetek!
Azok a fránya ékezetek!
(Forrás: Wikimedia Commons / INVERTED)

Szintén kellemetlen, hogy például a δ̕ begépelését semmi nem segíti, mivel önálló gombja nincs. Így először a δ-t kell a gmb segítségével beírni, majd az AltGr+9 szóköz billentyűkombinációval kell begépelni a mellékjelet.

Ennek oka bizonyára az, hogy bizonyos hasonló karaktereknek nincs Unicode-kódjuk, így például a δ̕ másképp nem is kódolható. Az egységesség tehát indokolja ezt a megoldást. Az azonban aligha érthető, hogy ha az adatok így vannak kódolva, akkor  az adatbázis-kezelő miért nem így keresi őket. További probléma, hogy a netes keresőket használva bizonyára senki nem fogja a s +  ́, illetve s +   ̌ kombinációkat használni, így Unicode ide, Unicode oda, az adatok nem érhetőek el az adatbázis-kezelőn kívül. (A jelenlegi állapotban – legalábbis egyes számítógépeken – a saját adatbázis-kezelővel sem.)  A javítás során mindenképpen inkább a kódolást kellene megváltoztatni, hiszen ellenkező esetben ügyelni kell, hogy a mellékjel nélküli betűkre keresve a kereső ne dobja ki a mellékjeles betűket is – ez pedig ha nem is megoldhatatlan, de bonyolultabbá teszi a keresést.

Ha sikerül adatokat elővarázsolnunk az adatbázisból, akkor az az első ötven találatot listázza, jelezve a találatok számát.  Elvben a további adatok listázására is mód lenne, de a megfelelő linkekre kattintva új keresés indul. Ugyanez a helyzet, ha megpróbálunk egyszerre tíz vagy száz adatot listázni – a funkciók nem működnek. Ennek köszönhetően az összes releváns adat nem is érhető el.

A rekonstruált alakok szótagszerkezetére is kereshetünk, ha a mássalhangzók helyére C-t, a magánhangzók helyére V-t írunk. Ezeket valódi hangokkal is pótolhatjuk, például ha a CaCCa keresőkifejezést használjuk, akkor megkapjuk azokat a rekonstruált alakokat, melyek két szótagúak, mindkét magánhangzójuk a, mássalhangzóval kezdődnek és a szótaghatáron két mássalhangzó áll.

A második fiókban a leánynyelvi adatokra kereshetnénk rá. Valójában sajnos nem tehetjük, csupán azt adhatjuk meg, hogy milyen nyelvben előforduló adatok érdekelnek minket. Rákereshetünk tehát például olyan etimonokra, amelyeknek magyar megfelelőjük van. Sajnos azonban nem kereshetünk olyan etimonokat, amelyeknek adott nyelvekben nincs megfelelőjük – például olyanokra, amelyeknek van finn, de nincs észt folytatójuk, vagy van obi-ugor, de nincs magyar folytatójuk. Az előbbi megoldható lenne azzal, ha amellett, hogy milyen leánynyelvben van megfelelő, azt is beállíthatnánk, hogy melyben ne legyen. Az utóbbi már bonyolultabb lenne, hiszen logikai viszonyokat kellene felállítani: legyen manysi VAGY hanti megfelelő (de nem szükséges mindkettő), de ne legyen magyar. Ez valóban komolyabb fejlesztést igényelne, de hosszabb távon ez is elengedhetetlennek látszik, ha valóban jól használható eszközt szeretnénk.

Keresés a leánynyelvi adatok között
Keresés a leánynyelvi adatok között

A másik lehetőség, hogy a leánynyelvek között kölcsönzött, de alapnyelvi eredetű szavak között keresünk. Például ha átadó nyelvként beállítjuk az észtet, átvevőként pedig a finnt, akkor megtudjuk, hogy három olyan ősi szó van, melyet a finn ugyan nem őrzött meg, mégis megtalálható benne észt jövevényszóként. (Ellenkező irányban 21 kölcsönzés történt: ebből azonban nem érdemes messzemenő következtetéseket levonni, hiszen itt nem az összes, az észt és a finn között végbement kölcsönzésről van szó, csak az alapnyelvi eredetű szavakról.) Az átadó és átvevő nyelvek között csak az uráli nyelvek egy része jelenik meg, más részük (így a magyar) nem: feltehetően azért, mert ezek sem átadó, sem átvevő nyelvként nem szerepelnek. Ez a funkció jól látszik működni, bár a vaktesztelés itt is érdekes eredményt hozott. Amikor rákerestünk, hogy hány lív szó került át más nyelvbe, kiderült, hogy csak egy: a *kewe ’állat nősténye’, méghozzá melyik nyelvbe? Olvasóink nem fogják kitalálni: a lívbe. Feltehetően adatrögzítési hibáról van szó, melyet nehéz észrevenni, de ha nekünk ilyen gyorsan sikerült egy ilyen hibába belerohannunk, joggal tehetjük fel a kérdést, hogy hány hasonló hiba lehet még. (Az önkölcsönzés ilyen esetei az adatbázisból könnyen kiszűrhetőek, ámde felmerül a kérdés, mi van, ha a kölcsönző nyelv rosszul van jelölve, ám nem azonos a kölcsönzővel...)

A különböző fiókok közötti kereséseket lehet kombinálni,tehát rákereshetünk olyan szavakra, tehát például rákereshetünk olyan szavakra, melyek az alapnyelvben p-vel kezdődtek, van finn és magyar megfelelőjük, és a komiból valamely más uráli nyelv átvette őket. Két ilyen szót találunk, a magyar facsar és a fúr megfelelőit.

A legnagyobb hiányosság, hogy leánynyelvi adatokra közvetlenül nem lehet keresni. Ez különösen azért furcsa, mert a korábbi változatban ez még lehetséges volt. Feltehető, hogy nem csupán az egyszerű felhasználók, de a szakemberek is leggyakrabban egy-egy mai szó etimológiájára lesznek kíváncsiak. Tegyük fel, hogy a magyar nyelv szó eredetére vagyunk kíváncsiak. A legegyszerűbb lenne, ha beírnánk a keresőbe, hogy „nyelv”, és az megtalálná a megfelelő szócikket – ahogy erre korábban lehetőség volt.A jelenlegi változatban azonban ezt nem tehetjük meg, hiszen közvetlenül csak az alapnyelvi alakokra kereshetünk, azt pedig a szakértők is csak ritkán tudják biztosan fejből, az érdeklődő laikusnak pedig fogalma sem lehet róla. Maradna tehát az a fapados megoldás, hogy kilistázzuk az összes magyar szót (ezt a nyelv elnevezésére

Elveszett paradicsom
Elveszett paradicsom
(Forrás: anyanyelv-pedagogia.hu)

kattintva tehetjük meg): az első oldalon meg is jelennek a magyar szavak az ad-tól az ëgyházig, és a program jelzi, hogy az adatok még hat további oldalon folytatódnak. Tippünk szerint a nyelvnek valahol a 3. vagy a 4. oldalon kell lennie – a számokra kattintva azonban nem a magyar, hanem az alapnyelvi adatok listázása folytatódik!

Próbálkozhatunk azzal a trükkel, hogy az alapnyelvi jelentéshez írjuk be a nyelvet: ebben az esetben kapunk is két találatot, melyek közül az egyikben valóban ott lesz a magyar nyelv. Ez a módszer azonban nem működik minden esetben. Ha például az ’ajtó’ jelentésre keresünk rá, megint két találatot kapunk, de ezek közül egyik sem lesz magyar adat. Ebből azonban elhamarkodott lenne azt a következtetést levonni, hogy a magyar ajtó nem alapnyelvi eredetű! Az ajtó az ábécé elején áll, így szerepel a magyar adatok első oldalán: kideríthető, hogy egy ugor ’eloldódik, kiszabadul’ jelentésű ige származéka.

Hasonló keresésekre nem csupán a kutatónak lehet szüksége. Például az is elképzelhető, hogy egy középiskolai tanár szeretné kigyűjteni az olyan magyar szavakat, amelyek f-fel kezdődnek, de van finn megfelelőjük is. Jelenleg erre nincs módja, de ha a magyar adatok listázása működne, akkor is csak azt tehetné, hogy az összes szócikket, amelyben f-kezdetű magyar adat szerepel, megnyitja, és megnézi, melyikben van finn adat. Az igazi megoldás persze az lenne, ha lehetne egyenesen olyan listát készíteni, amelyekben csak a finn és csak a magyar adatok szerepelnek (ha egyszer csak ezekre van szükségünk), és nem kellene kézzel kopipésztelni a szükséges adatokat. Ettől azonban még fényévekre van a rendszer.

A valódi kutatási feladatokhoz azonban ez sem volna elég. A Csúcs-féle eredeti ötlet ennél összetettebb kereséseket igényelne. Például tudjuk, hogy a hal szó finn megfelelője kala, és az alapnyelvi alakot is így rekonstruáljuk: *kala. De vajon következetesen a-t rekonstruálunk az első szótagban, ha a magyarban és a finnben is a áll ott? Ezt úgy tudnánk ellenőrizni, ha tudnánk olyan alakokra keresni, melyeknek van finn és magyar folytatójuk is, és mindkettő első szótagjában a áll. Az adatbázis birtokában ez könnyű feladat lenne, ámde a kereső ilyenre lehetőséget sem kínál – holott valójában éppen ez az, amire érdemes lenne használni. A rekonstruált alakok sokkal kevésbé érdekesek, hiszen ezek feltételezéseken alapulnak, nem tények. Egy eljövendő kutatás sokkal inkább arra irányulhat, hogy ezeket felülbírálja, módosítsa: ehhez azonban a leánynyelvi adatok, és nem a rekonstrukciók között kellene keresgélni!

A harmadik fiókban a magyarázó részekben lehet keresni – mivel ezek német nyelvűek, természetesen németül. Először a „tschuw.” betűsorra próbáltunk rákeresni, feltételezve, hogy ez a csuvas nyelv rövidítése, és mivel a csuvas több finnugor nyelvvel is érintkezett, feltehetően valahol említik. Sajnos feltételezésünk megalapozatlannak bizonyult, mert találatot nem kaptunk. Ezutána  a „tat.”  rövidítéssel próbálkoztunk, hátha a tatár nyelvet említik. Ekkor két találatot kaptunk: az egyik esetben nem a tatárról volt szó:

s. noch unter *meke 'Sache, Tat...; tun, machen, arbeiten'

Ebben az esetben a német Tat ’tett, cselekedet’ szó bukkant fel, de a keresés természetesen sikeresnek tekinthető. A másik esetben valóban a tatárra történt utalás:

Die Herleitung von ung. szösz aus einer Turksprache: kas.-tat. süs 'Werg, Hede', tschuw. süs 'zum Spinnen bereiteter Hanf od. Flachs' (Munkácsi: NyK 21: 127; Gombocz: MNy. 3: 358), ist nicht akzeptabel. Kas.-tat. süs ist möglicherweise ein syrj. Lehnwort, das tschuw. Wort stammt aus dem Kas.-Tat.

Ebben az esetben valóban tatár adatokat találunk – ami igazán megdöbbentő, az az, hogy csuvasokat is, méghozzá éppen a várt „tschuw.” rövidítéssel! A hibát sem nehéz megtalálni: a rövidítést záró pont ugyanis már nem félkövéren van szedve, a félkövér szedést záró html-tag pedig a karaktersorba ékelődik. Az már eleve hiba, hogy a pont hol félkövéren van szedve, hol nem, így a rögzítés eleve következetlen. Az azonban egyenesen érthetetlen, hogy a keresés miért nem ignorálja a beékelődő html-tageket. Persze az elegáns, adatbázishoz méltó megoldás az lenne, ha eleve lehetne nyelvek alapján keresni a megjegyzésekben, de erre feltehetően még néhány évtizedet várnunk kell.

A harmadik és negyedik fiók
A harmadik és negyedik fiók

Biztató viszont, hogy a negyedik fiókban a bibliográfiai adatok között már hasonló módon kereshetünk. Itt ugyanis azt adhatjuk meg, hogy mely szerzőkre, vagy mely művekre (monográfiákra, folyóiratokra stb.) való hivatkozásokat szeretnénk megtalálni. Sajnálatos (és némiképpen érthetetlen) módon a kettőt nem tudjuk kombinálni, tehát nem tudunk rákeresni például Munkácsi Bernátnak a Nyelvtudományi Közleményekben megjelent írásaira való hivatkozásokat. Bizonyára nem gyakoriak az olyan tudománytörténeti kutatások, ahol pont ilyesmire lenne szükség, de ha egyszer a lehetőség meglenne rá, nem világos, miért kell tiltani.

Az már kevésbé érthető, hogy miért kell külön szerzőként feltüntetni Radanovicsot, Radanovics (Rédei)-t, pláne Rédei (Radanovics)-ot, illetve Lytkint és Lytkint! Az előbbire (vagy az utóbbira?) például csak egyszer történik hivatkozás, a másikra viszont 424 szócikkben! Megint azzal az esettel állunk szemben, amikor a hiba kiszűrése minimális erőfeszítést igényelt volna: ha valaki csak megnyitja a szerzők listáját, azonnal feltűnik, hogy Lytkin és Rédei (Radanovics) neve a névsoron kívül, annak elején áll – még csak nem is a végére van elrejtve!

Patyomkin-szindróma

Összességében meg kell állapítanunk, hogy az Uralonet jelenlegi állapotában nem több egy Patyomkin-falunál: látszólag egy csodálatos adatbázis, mely valójában használhatatlan: az első „működő”, „kész” verzió a legalapvetőbb funkciók ellátására is alkalmatlan. Ami azért is különösen szomorú, mert nem egyszerű kamuról van szó, hanem hatalmas munka áll mögötte. Szerencsére elmondhatjuk, hogy ez a falu könnyen lakhatóvá tehető, ha kijavítják a legalapvetőbb hibákat. Mi több, némi fejlesztéssel az is elérhető, hogy jól élhető, nyüzsgő várossá fejlődjön.

Az egyetlen ok, ami pesszimistává tehet minket, az adatbázis története. Úgy tűnik, hogy az utóbbi két-három évben sem változott a projekt történetét jellemző két évtizedes tendencia, mely szerint a fejlesztés során csupán egyetlen szempont nem érvényesül: hogy a program valóban működjön, használható legyen. Nem látjuk, mi arra a garancia, hogy a következő két hétben, két hónapban vagy akár két évben ez megváltozzon. Nem értjük, hogy az ország egyik vezető nyelvtechnológiai műhelyében hogy feledkezhetnek meg arról, hogy a szoftverfejlesztés egyik legfontosabb része az alapos tesztelés. Nem értjük, hogy a fejlesztésben részt vevő finnugrista szakemberek hogy tudnak kiállni a nyilvánosság elé azzal, hogy a mű elkészült, anélkül, hogy a legalapvetőbb tevékenységeket, amelyeket a várható felhasználók elvégeznének, nem végzik el, és nem ellenőrzik, hogy a program valóban működik-e.

A magunk részéről természetesen annak örülnénk a legjobban, ha nemsokára valóban használható lenne a program, hiszen etimológiai cikkeink megírásához eddig is használtuk, amikor lehetett. A fentiek ismeretében azonban bizonyára érthető a szkepticizmusunk.

Kapcsolódó tartalmak:

Hasonló tartalmak:

Hozzászólások (395):

Követem a cikkhozzászólásokat (RSS)
Az összes hozzászólás megjelenítése
16:54 2020. július 13. 16:54
395 Mackósajt

@Cypriánus:

"Sokan a Baktria- Margiana Komplex ( BMAC) indoeurópai voltát is kétségbe vonják."

Azt én is. Valószerűtlen, hogy az lett volna. Az más kérdés, hogy a népessége összeolvadt az Andronovo népességgel, és az egyik gyökere lett jópár ma indo-iráni nyelvet beszélő népnek. Feltehetően némi kulturális örökséggel.

16:50 2020. július 13. 16:50
394 Mackósajt

@Libertate: Genetikáról, vér szerinti rokonságról beszéltünk. Hogy a nyavalyába keverted ide a nyelvrokonságot? Hihetetlen, hogy neked mekkora katyvasz van a fejedben. De közben leesett, hogy ki vagy. Én vagyok a hülye, hogy erre pocsékolom az időmet.

16:37 2020. július 13. 16:37
393 durek

@aphelion: Remélem, eljut a kérdés egy szakértőhöz is. Azért köszönömöm.

Bár értem a szabályos hangváltozások elvét, nekem úgy tűnik, hogy a nyelvhasználók éppenséggel nem "nyelvészeti szabályok" szerint alakítják a nyelvet, azaz a szavak hangzását, hanem játékos kreativitással alkotnak új szavakat, és amelyik újítás népszerű lesz, pláne, ha ehhez esetleg új, konkrét jelentés is párosul, akkor az változat a nyelv részévé válik.

Az alábbi mély-magas hangrendű párok a Zaicz etimológiai szótárból valók:

billeg - ballag

boci - bece (bec)

borzad - berzenkedik

bukik - bökken

bütyök - butykó

cefet - cafat

cefre - cafra

csal - csel

cselleng - csalinkázik

cseléd - család

csemege - csámcsog (csemcseg)

csettint - csattan

csörög - csorog - csurog

csücsök - csúcs (csűcs)

csücsörít - csucsorít

csücsül - csucsul (alszik)

döbben - dobog

döng - dong

dunnyog - dünnyög

dübörög - dobog

förgeteg - forgatag

förmed - fordít

gágog - gég, gőg, gőgicsél

gagyog - gügyög

galagonya - geleginye

gomb - gömb

gombolyag - gömbölyű

gombóc - gömböc

görbe - gurba

görög - gurul

gumó - gümő

habog - hebeg

hebrencs - habar

hederít - hadar

kolompol - kelepel

kotyog - ketyeg

kova - köv- (kő)

köp - pök - pukk(an)

lebeg, libeg - lobog

lecseg - locsog

lotyog - lötyög

makog - mekeg

mál - mell

mer (merül) - márt

nyaggat - nyekeg

okádik - öklődik (öklend)

pép - papi

pemete - pamat

peng - bong

percen - porcog

pezsdül - pozsog

pille - pilla

réce - ruc

reped - ropog, roppan

rezeg, reszel, reszket - ráz

reng - ring

sanyarú - senyved

sarjú -sarok, sor (perdül), sorol, sürög, sűrű, serdül, serken, serény

sarkantyű - serkent

sejdít - sajog

settenkedig - csatangol

sistereg, siseg - susog

sodor - seder

suttog - setteg

süpped - sepped, suppad, sippad

szörtyög - szortyog, szürcsöl, szörpöl

tipeg - topog

tülekedik - dulakodik

zümmög - zumog, zunnog, zsummog

zsibbad - zsebbed

15:40 2020. július 13. 15:40
392 aphelion

@durek: Én sem vagyok szakértő a témában, ha komolyan érdekelnek az ilyesfajta kérdések, érdemesebb lenne a profiknál érdeklődnöd. De a kör- és a ker- családba tartozó szavak ha jól tudom ugyanannak az ősfinnugor tőnek a leszármazottai ilyen vagy olyan úton.

Természetesen előfordulhat, a magánhangzók körében különösen, hogy ugyanannak az ősnyelvi hangnak több különböző hang felel meg a mai nyelvben. De ez is szabályszerű módon történik, pl a hangkörnyezettől függően, vagy hangrendi hasonulás útján, nem lesz csak úgy random egyik hangból egy másik hang. Vagy legalábbis nem feleltethetjük meg őket egymásnak, hacsak nem állnak rendelkezésre oyan nyelvemlékek amik folyamatában dokumentálják a váltást.

14:06 2020. július 13. 14:06
391 durek

@aphelion: Segítenél nekem megérteni, hogy vajon milyen okból kifolyólag mondja a TESz. a körül, környez, körbe szavaink fiktív "kör" tövéről, hogy nem a kerül, kerek, karika stb. szavak "ker" fiktív tövének alakváltozata, hanem eltérő szótő, külön származással? Nem igazán értem, miután az e/ö a leggyakoribb tőváltozat (fel-föl, pereg-pörög, veder-vödör), a jelentéstani kapcsolat pedig nyilvánvaló.

Korábban már írtad, hogy az

"ö ≠ ú, á ≠ é, b ≠ p"

Az igazat megvallva, ezt sem igazán értettem, hiszen éppen a tőgy szóval kapcsolatban kérdeztelek, mely esetén az uralonet szerint az alapnyelvi forma:

tuδ̕ka, tuδ̕ka-mɜ FP FU 'vmilyen kiálló dolog, vminek a hegye, csúcsa'

azaz, u>ő hangváltozás történt a magyarban, ugyanakkor a csúcs-csöcs szerinted mégsem lehetséges a hangtani okok miatt.

Apropó, a kerék és a karika esetén is igaznak véled, hogy az a ≠ e? Vagy ez más, mint az á ≠ é?

A Tótfalusi szótár szerint:

"A kerék kerek- tövének feltehető mély hangrendű párjából (karak) alakult kicsinyítő képzővel."

13:19 2020. július 13. 13:19
390 aphelion

@Gelmik: Herrje Bruder, was man da sich alles nicht zusammenträumt! 😂

Amúgy ha már így szóba kerültek a germán nyelvek, érdemes az angolt megnézni, azt a magyarnál is jóval számottevőbben érték külső hatások, ha valaki pl csak a szókincsét ismerné és az alapján próbálná visszafejteni az eredetét, leginkább valami latin-germán hibridnek gondolhatná, de önmagában a nyelvtana alapján is leginkább csak kapiskálni lehetne a germán eredetet. Ennek ellenére a nyelvészet egyértelműen germán nyelvnek tekinti, hisz az óangol nyelv folytatója, ami vitathatatlanul germán volt.

12:33 2020. július 13. 12:33
389 Gelmik

@aphelion:

Ebben a folyóban a legerősebb a magyar az biztos, de a magyar egy germán nyelv.

viszont a magyar nyelv nem vett sok szót át, mert a szókincs 70 százelékben germán, de valszeg a magyar, kevert nyelv, ezért is germagyar. a honfoglalás után alig érte hatás valójában.

A magyar a gót-germán leszármazottja, egy archaikus szinten, a finnugor bizonyítatlan.

A mondatban mire gondoltál: meg kell mondjam?

A kell mondjam germán, a fordítottja kelljen mondanom is germán, vagy kelljem mondani.

a gótban fel lehet cserélni, hogy melyiket akarja az emer ragozni: skullkjau, kelljem swogjan:zúgni, vagyis skulljau swógjan, vagy skull swógjau.

Az m a végén ősgermán, bim habem még a németben is jelen van.

Feltételezem ebből lett: házam, hús+am, vagy hús maina mintájára.

Hasonló mint az újkurd vagy az újperzsa, de a magyarban a germánból lakult ki.

11:46 2020. július 13. 11:46
388 aphelion

@Libertate: "A finnugrisztika rokonsági paradigmája az, hogy minden nyelv csak egyetlen alapnyelvből eredhet"

Lehet egy nyelvnek két, vagy akár több őse is, a Tok Pisinnek pl egy egész rakat van: en.wikipedia.org/wiki/Tok_Pisin#Classification

Ez kb annak a megfelelője, mint amikor két nagyjából egyenrangú folyó összefolyik és a torkolattól lefelé mindkettő nevét viseli a vízfolyás, pl mintha a Tiszát a Maros torkolatától lefelé Maros-Tiszának hívnák. Vagy mint "az M1-M7 közös szakasza".

A magyar nyelv a története során sok nyelvből átvett szavakat, esetleg akár pár fonológiai vagy szintaktikai elemet is (pl a "meg kell mondjam" típusú struktúra használatába belejátszhat a balkáni sprachbund szomszédsága), de egyik ilyen esetben sem egyenrangú nyelvek összeolvadásáról volt szó, mindig a magyar volt a főáram, amihez itt-ott pár patakocska vagy csermely hozzáadott némi máshonnan érkező vizet. Ezért mondjuk, hogy a magyar közvetlenül az ősugor leszármazottja, nem pedig kreol nyelv. (Amúgy fogadni mernék, hogy ha úgy adódna, hogy a nyelvészet kreolnak tartaná a magyart, akkor meg az lenne a baj.)

08:47 2020. július 13. 08:47
387 Libertate

@szigetva:

Megértem, ha "visszavonulsz" a vitától, mert nem vagy szakember.

Csak az a kérdés, hogy akkor miért kommentelsz, a finnugrisztikát érintő témákban?

Én sem vagyok szakember - de érdekel a téma! - ezért vagyok itt.

@Mackósajt:

A finnugrisztika rokonsági paradigmája az, hogy minden nyelv csak egyetlen alapnyelvből eredhet. Az összes többi nyelvből átvett eleme ( akár szókészlet, akár bármi más) - az jövevény.

Egy mai férfi "eredetét" az Y-DNS -hordozza mert ez az amelyik akár évezredeken keresztül sem változik, tehát analóg az "alapszókíncsel"... - nevezhetnénk "alapgénkincsnek" is de ez a kifejezés nem használatos - még!

Látom, hogy rosszul esik neked, hogy az "eredet" meghatározásakor az összes többi gén "nemjátszik" - de ez a tudomány már csak ilyen.

A magyar nyelv rokonságának megállapításakor sem játszik a több ezer egyéb szótő - csak az uráli örökség - ez van!

Lehet ezt vitatni - csak azt nem igen szokták tudományosan elfogadható érveknek tekinteni!

„A nyelvrokonság azt mutatja meg, hogy az adott nyelv mely nyelvből ered – egyes elemei azonban idővel kicserélődhetnek, sőt, az elemek túlnyomó többsége ki is cserélődik. Van azonban a szókészletnek egy olyan rétege, mely a legkevésbé hajlamos a változásra, amelyet a leggyakrabban használunk, és amely a legkevésbé kultúrafüggő, ezt hívják alapszókincsnek. Az alapszókincsnek azonban nincs éles határa. Ha csak néhány tucat bizonyíthatóan finnugor (uráli) eredetű szavunk lenne, de azok ebbe a rétegbe tartoznának, a magyar nyelv akkor is egyértelműen finnugor (uráli) eredetű lenne. A számok tehát ebből a szempontból nem igazán számítanak.” ( Fejes László )

00:11 2020. július 13. 00:11
386 Cypriánus

@Mackósajt:

Pontosan ugyanazt kifogásoltam. Sokan a Baktria- Margiana Komplex ( BMAC) indoeurópai voltát is kétségbe vonják.

tegnap 2020. július 12. 20:52
385 Gelmik

Miért épp a lényeget törölték?

Csoda,hogyha nem értik amit mondok,ha még a magyarázatot se tehetem hozzá?

tegnap 2020. július 12. 20:20
384 Gelmik

@Gelmik:

Annyit tudok mondani a tanulni sohase késő: agyat tisztára mosni mindig késő. akinek az agyát már elkúrták a padban, az már többé nem lesz normális..

Amúgy egy zsenivel állasz szemben, na jó inkább primitívval, de mi más lenne a zseni, ha nem a törzsi, a primitív. :D :D :D

Persze minden ember zseni, amikor megszületik, mert érzi a valóságot, de aztán jönnek az értelmiségiek.

Az én biológiámra mondhatsz bármit, de ha egyszer egy zombi a seggedbe harap, akkor az valóság lesz.

Persze az a rohadt MTA elveszi Kiss Pistától azt ami az övé, a tudományos eszközöket, mert a tudományos eszközök a sippéjé, a népé. Az MTA ezzel a szakismeret dologgal is a lopot dolgait akarja megvédeni.

[moderálva]

tegnap 2020. július 12. 20:06
383 Gelmik

@mederi:

Nagyon jól tudom, hogy mi a mutáció, ere van amúgy a magyar, germagyar szó a másulás, vagy a módosulás.

Tanulni? Mit a művit? Ez nagy. Van a valóság, és van a művi világ, a művi azért művi, mert nem valóság, hanem hülye gyerknek, hülye játék.

Természetesen én még a tanulni szót is máshogy használom, germagyarosan. A valóság a gyom, nem a művi, az ideológia.

Ez a művi hullik le a 21. században a posztmodernben.

Hidd el, én még jogsit se teszek, le mert az művi.

Törzsi lét? Ez a germagyar nyelv, ahogy én megértem a germagyar nyelvet, ebbe még beletartozik a törzsi jog is, és a korábbiak(Lex Salica, langobard szokásjog, stb...).

miért akarnám én az objektumot és szubjektumot kettéválasztani?

Mert a művi ismeret oda vezet. A törzsi igen sok mindent jelnet.

Már elnézést, de ki nem szarja le a modern termékeket, törzsi vagyok, Germán, Germagyar, ahogy Tacitus monbdja: a Germán nem munkálkodik, mert szégyennek tartja izzadsággal megszerezni azt, amit vérrel is meg lehet.

Én nem vagyok hajlandó tanulni a te értelmedben, mert én törzsi vagyok, és ma visszafelé fejldünk, a posztmdoernnel eljön a törzsi világ, a premodern, ami a törzsi, mert Szentelen Pityutól , már modern van.

De természetesen nevetséges ez az értelmiségi zagyvaság, az úgymond tanulásról, egy egyszerű elnyomó ideológia része, a törzsiellenesség.

tegnap 2020. július 12. 19:57
382 Mackósajt

@Cypriánus: De nem a 4500 év maga amit valószínűtlennek tartok, hanem a 4500 év és Afganisztán kombinációja. A 4500 év maga szakirodalmi adat (becslés). Afganisztán szintén nem vizsgálati eredmény, hanem spekuláció, az R-Z2125 (és alváltozatai) mai elterjedése alapján. Ezért nem értettem mire mondod, hogy érdemes lenne más csapattal is vizsgáltatni. Igazából nincs mit.

Az eddig talált legrégebbi R-Z2125 (ami egyben az eddig talált legrégebbi bármilyen R1a Ázsiából tudtommal) az I3770 minta Kelet-Kazahsztánból, amit 2132-1940 calBCE-re datáltak a szerzők, és a korai Andronovo-hoz sorolták régészetileg. (Narasimhan et al., The formation of human populations in South and Central Asia.) Akkortájt vagy nem sokkal később már Afganisztánban is megjelenhetett. De ez itt nüansz.

tegnap 2020. július 12. 19:51
381 mederi

@Gelmik: 372

Tanulni sosem késő.. Érdemes az alábbi cikket elolvasni, mert akkor megtudhatod, hogy a mutáció mit jelent, és hogy örökölhető-e.

hu.wikipedia.org/wiki/Mut%C3%A1ci%C3%B3

@Gelmik: 376

A törzsi lét szerintem tiszteletre méltó, de nem jelenti azt, hogy a modern világban élő emberek, akik valaha szintén törzsi társadalmakban éltek, visszafelé szeretnének fejlődni.

Azonban ha a mai világ elért eredményeit (mint pl. a számítástechnika, a repülés a közlekedésben, a gyárak tömegtermelése -hogy minden ember lehetőleg hozzá jusson a számára is szükséges alapvető termékekhez- és így tovább) a mai törzsi népei is szeretnék élvezni, sajnos, fel kell zárkózzanak tanulással, és korszerű munkával, hogy maguk is részt tudjanak venni a számukra is hasznos modern termékek előállításában.

Ha lemondanak a modern világ elért eredményeiről, úgy gondolom marad a sokkal nehezebb, sok, nehéz fizikai munkával fenntartható törzsi élet.. Persze akkor nem értem, miért törekednek annyira nagyon sokan Európába a jobb élet reményében, ha a törzsi életmód felel meg nekik.. A két dolog nem fér meg "egy kalapban".