Rohamosan nő az angol szókincs?
Az elmúlt egy évszázad során nagyjából a kétszeresére növekedett az angol nyelv szavainak a száma – állapította meg egy új tanulmány.
A Harvard Egyetem és a Google internetes szolgáltató kutatói megállapították, hogy a millennium óta 8500 új kifejezéssel bővült évente az angol szókészlet, amely már összesen egymillió huszonkétezer szót tartalmaz. Az 1950-es évek óta a nyelv szókészlete több mint 70 százalékkal, míg az azt megelőző fél évszázadban csupán 10 százalékkal növekedett – írták a Science című szakfolyóiratban megjelent tanulmányban.
Az új szavaknak nagyjából fele nem szerepel a szótárakban, mivel többségük a szlengből, vagy valamilyen zsargonból származó kifejezés, ezért leginkább lexikális „fekete báránynak” számítanak.
A kutatás során a szakemberek több mint ötmillió olyan digitalizált könyvet vontak számítógépes elemzés alá, amelyeket 1800 és 2000 között adtak ki. Jean-Baptiste Michel és kollégái szerint eredményeiket a nyelvtani fejlődést, a kollektív emlékezetet, a technológiai újítások befogadását, a hírnév kialakulását, a cenzúra hatásait és a történelmi járványtant vizsgáló kutatási területeken is lehet majd hasznosítani.
„Azáltal, hogy a könyvek révén a szavaknak egy jelentős hányadát sikerült digitalizálni, lehetővé vált, hogy a számítógépes vizsgálatok segítségével felfedjük a történelemben, a kultúrában, a nyelvben és a gondolkodásban végbement, ez idáig ismeretlen változásokat” - idézte Jon Orwant, a Google Books műszaki vezetőjét a The Daily Telegraph című brit lap internetes kiadása (www.telegraph.co.uk).
A Nyelv és Tudomány megjegyzése
A nyelvek szókincsének méretét igen nehéz meghatározni, objektív módszer nem is létezik. Komoly kérdés például, hogy mekkora ismertségre kell szert tennie egy kifejezésnek, hogy a nyelv részének tekintsük. Szélsőséges esetben egyszer, egyvalaki által használt kifejezés is a nyelv elemének számíthat. Ebben az esetben sem az angol nyelv szókincséről van szó, hanem azokról az elemekről, amelyek a digitalizált könyvekben megjelennek. A kifejezések ilyen mérékű szaporodása elsősorban a tudomány és a technika fejlődésével függ össze: a legtöbb új szót csak egy szűk szakma használja. Korábban is gazdag volt az egyes szakmák szókincse, csakhogy ezek nem olyan gyorsan változtak, az adatok nem mindig jutottak el a szakemberekhez. A jelek szerint a tanulmány nem veszi figyelembe, hogy mely szavak haltak ki – pontosabban, hogy melyek használata nem igazolható a korpuszból.
Azt mindenesetre leszögezhetjük, hogy angolul nem lesz nehezebb „megtanulnunk”: a szaporodó kifejezések nagy része olyan, amelyet a mindennapi életben nem használunk, és az anyanyelvi beszélők sem ismernek – vagy éppen már bekerültek a magyar nyelvbe!
Kapcsolódó tartalmak:
Hasonló tartalmak:
Hozzászólások (3):
Követem a cikkhozzászólásokat (RSS)Az összes hozzászólás megjelenítése
Közben megtaláltam a kutatásom doksiját. A kiindulási alap egy spanyol nyelvű popalbum szókincse a gyakorisággal együtt (tehát pl. az egy igéhez tartozó eltérő alakokat is külön szónak vettem). 555 eltérő szó(alak) képezte a vizsgálat tárgyát, melyek eredet szerinti megoszlása a következő volt:
– latin (latin–görög): 523 szó, 94%
– germán: 8 szó, 1,4%
– újlatin: 6 szó, 1,1%
– arab: 5 szó, 0,9%
– kelta: 5 szó, 0,9%
– angol: 3 szó, 0,5%
– ismeretlen/bizonytalan eredetű: 2 szó, 0,4%
– hangutánzó, hangfestő: 2 szó, 0,4%
– görög (közvetlen): 1 szó, 0,2%
Akit érdekel a dokumentum (spanyol nyelvű), írjon a mexicano.2010@yahoo.com e-mail címre, szívesen elküldöm.
Amúgy a cikk témájához szólva, hogy ne legyen annyira off, én arra lennék kíváncsi, hogy a mai angol szókincs hány százaléka germán eredetű. Szerintem már csak a töredéke.
Én ehhez annyit fűznék hozzá (bár nem vagyok szakember), hogy szerintem egy nyelv szókincse összetételének megállapításánál elsősorban a mindennapi életben használt alapszókincset kellene vizsgálni, nagyobb területen beszélt nyelv esetén pedig azt a közös szókincset, amelyet mindenhol megértenek/használnak. Én a spanyol nyelvre végeztem egy kutatást ezzel kapcsolatban (különböző, egyszerű szövegeket vizsgálva, többek között egy popelőadó összes dalszövegét – azokban általában a mindennapi, egyszerű szókincs szerepel) . A vizsgálat eredménye röviden az lett, hogy hiába mondják, hogy a spanyol szókincs 10%-a arab jövevénysző, a minden nap használatos szókincs 95–97% latin/újlatin/görög eredetű.
Részletesen a Wikipédia Spanyol szókincs c. cikkében írtam erről: hu.wikipedia.org/wiki/Spanyol_szókincs