Milyen eredetű a román szókincs?
A laikusok úgy képzelik, hogy a nyelvészek könnyen meg tudják állapítani, hogy egy nyelv szavai milyen arányban származnak más nyelvekből. Bár készíthetőek ilyen statisztikák, az eredmény nagyban függ attól, hogy milyen anyagon végezzük el a vizsgálatot. Egészen más eredményt kapunk, ha az irodalmi nyelvre korlátozzuk a kutatást, mint ha bevesszük a nyelvjárási anyagot is. Ha pedig a szaknyelvek szókincsét is bevonjuk, akkor várhatóan nagyobb lesz az idegen szavak aránya, de változik a forrásnyelvek aránya is. A magyar szaknyelvekben például minden bizonnyal sokkal több a görög és latin eredetű szó, mint a román, míg az erdélyi nyelvjárások bevonása az utóbbiak arányát növeli. Éppen ezért a nyelvészek nem is veszik komolyan az efféle statisztikákat.
A laikusok annál inkább szeretik az ilyeneket. Ádám nevű olvasónk hívta fel figyelmünket, a Főtér egyik cikkére, mely egy román cikkből veszi adatait. Sajnos az nem szerepel, az ő adataiknak mi a forrásuk, de az angol Wikipédiában egészen más számok szerepelnek (Dimitrie Macrea egy cikkére való hivatkozással):
Eredet | Főtér | angol Wikipédia |
Örökölt latin | 30,33%* | 20% |
Újlatin kölcsönzés |
41,33%** |
43% |
ebből francia |
22,12% | 38,42% |
Szláv | 14,17% |
11,5% |
Német | 2,47% |
2% |
Újgörög | 1,7% | 2,4% |
Török | 0,73% |
4% |
Magyar | 1,43% | 2,17% |
* Ha hozzáadjuk a 15,26%-nyi „képzett latin” elnevezésű réteget, akkor már 45,59%-nál járunk.
**A 71,66% „újlatin” elemből kivonva a 30,33% örökölt latint.
Tráko-dák, angol, hangutánzó és bizonytalan eredetű szavak csak a Főtéren közölt statisztikában szerepelnek, itt megtaláljuk az olasz (3,56%), illetve az egyes szláv nyelvekből származó szavak arányát (9,18% ószláv, 2,6% bolgár, 1,12% orosz, 0,85% szerb-horvát, 0,23% ukrán, 0,19% lengyel). Gondolhatjuk, hogy a magyar tekintetében nincs nagy különbség a két számítás között, hiszen mindkét statisztika 1-2%-nyi magyar jövevényszót mutat ki. Ha viszont azt vesszük figyelembe, hogy a Wikipédia adatai szerint a magyar szókincs aránya másfélszer akkora, mint a Főtér adatai szerint, a különbség már jóval jelentősebbnek tűnik.
Az angol Wikipédia arra is figyelmeztet, hogy ha a vizsgálatot 2500 gyakori, sokjelentésű és produktív (sok képzett szó alapjául szolgáló) szóra korlátozzuk, akkor a legtöbb a latin eredetű szó lesz, ezt követik az újlatin nyelvekből és a klasszikus latinból átvett jövevényszavak, majd a szláv jövevények. Az itt megadott táblázat egyes számai egybevágnak a Főtér által megadottakkal, mások eltérnek tőlük.
Melyik statisztika a helyes? Feltehetően mindhárom. A hiba nem a statisztikákban van, hanem azzal a megközelítéssel, hogy ilyen módszerrel tudunk valamit mondani a nyelvről. Persze valamit tudunk, nyilvánvaló például, hogy akárhogy mérjük, a románban nem lesz több magyar jövevényszó, mint szláv. Maguk a számok azonban már nem sokat mondanak: ezt számítgatások nélkül is tudtuk. (Meg kell jegyeznünk, hogy a magyar jövevényszóként felsorolt szavak közül nem egy a magyarban szláv eredetű.)