Népszerű vagy népszerűtlen a helyesírási szabályzat?
Népszerűtlen ember ön? Szerették önt az emberek az elmúlt időszakban? A technológia csodákra képes: napra pontosan megmutatja, hogyan éreznek az emberek egy közszereplőről, egy termékről vagy egy cégről. A helyesírási szabályzat példáján mutatjuk be, mi minden derül ki az internetről, a közösségi portálokról, ha tudjuk, hogyan vizsgálódjunk.
„Az emberek nem szeretik, ha…”, „A magyarok olyanok, hogy…” – nap, mint nap hallhatunk hasonló megállapításokat a lehető legkülönbözőbb közéleti szereplőktől. Gyakran csak legyintünk, hiszen ki tudná megmondani, mit hisznek a magyarok – úgy általában – a tojásárak alakulásáról, az új budapesti buszok típusáról, esetleg a nemzeti dohányboltok színeiről?
Nos, természetesen a nyelvész meg tudja mondani, hogy mit gondolunk erről vagy arról a témáról. Ahogy a kisragadozó már régóta sulykolja: a nyelvész nem mogorva vénember, aki folyton-folyvást nagy könyveket lapozgat és rámorog a labdázó gyerekekre. A nyelvész játékos figura, aki ha kell, olyan izgalmas dolgokkal foglalkozik, mint a szentimentelemzés. És ha most ez a szó roppantul unalmasnak és mogorvának hangzik, gyorsan olvasson tovább a nyájas olvasó.
Helyesírás! Szeretlek vagy gyűlöllek?
Az angol sentiment szó magyar megfelelője nagyjából a vélemény lenne. Ugyanakkor amikor szentimentelemzésről beszélünk, akkor nem csak azért nem magyarítjuk a kifejezést, hogy dühös kommentek írásával eltölthető perceket szerezzünk a szomszédos helyesírásnácinak, hanem azért is, mert a sentiment szónak van egy másik jelentése is: az érzelem. Tehát, amikor valamilyen kifejezéssel kapcsolatban (budapesti buszok, dohányboltok színei, egy politikus vagy egy termék neve, akármi) szentimentelemzést végzünk, akkor nem csak a véleményekre lehetünk kíváncsiak, de akár arra is, hogy hogyan éreznek az emberek ezzel a bizonyos fogalommal, személlyel vagy tárggyal kapcsolatban.
És ha már a helyesírásnáciknál tartunk, az elmúlt hónapok eseményei alapján adja magát a feladat: tekintsük meg, miként vélekedik a magyar ember a helyesírási szabályzattal kapcsolatban! A témának amúgy is reneszánsza van, izgatottan várjuk a helyesírási szabályzatról szóló újabb és újabb híreket, dörmöghetünk a közhivatalok helyesírási hibáktól hemzsegő elnevezésein, villoghatunk azzal, hogy mi mindig jól választjuk el a sajtóadatbank-kutatás szót – egyszóval a téma első ránézésre tökéletesnek tűnik.
No de hol vizsgálhatjuk a helyesírási szabályzattal kapcsolatos véleményeket és érzelmeket? Az utcára mégsem mehetünk ki kérdezősködni, hiszen az egy egészen más szakma lenne. Marad hát nekünk az internet – egyrészt ehhez amúgy sem kell felkelni a képernyő elől, másrészt pedig szinte minden megtalálható rajta, amire szükségünk lehet.
Mit gondol a net?
A Neticle Technologies véleményelemző szolgáltatása kérésünknek megfelelően a 2013. február 25-e és május 26-a közötti időszakot vizsgálta abból a szempontból, hogy mit gondol a magyar web a helyesírásról. A cég elemzéseit úgy állítja elő, hogy rendszeresen vizsgálja a vezető online médiatermékeket, blogokat és közösségi oldalakat. A véleményelemzést saját, innovatív algoritmusuk végzi, amelyet kimondottan a magyar nyelvre alakítottak ki.
Az alábbi grafikonon látható említésfolyamból jól kivehető, hogy a helyesírással kapcsolatban fokozatosan egyre negatívabb lett a web véleménye a vizsgált időszakban. A Neticle ugyanis tiszteletreméltó pontossággal és ráadásul automatikusan tudja megállapítani azt, hogy a vizsgálat tárgyául választott személyről, termékről vagy szolgáltatásról tett említések negatívak vagy pozitívak-e. Az említésszámot a grafikon vastagsága mutatja, ezen a területen viszonylag egyenletes a megoszlás. A negatív említések fő oka, hogy sok esetben emberek vagy éppen adott szövegek helyesírását kritizálják a találatok.
A vizsgált időszakban összesen 1541 említés született. Napi említésszám tekintetében jelentős emelkedés (csúcs) figyelhető meg a március 7-e utáni napokban. Ezzel együtt látható, hogy a legtöbb említés semleges, de a témával kapcsolatos negatív tartalmak száma is megnőtt.
A Neticle által kimutatott említési csúcs okait a nyest házon belül keresheti: március 7-én közöltük ugyanis cikkünket arról, hogy milyen változások várhatóak a helyesírási szabályzat rövidesen megjelenő 12. kiadásában. Ezt a cikket a legtöbb online médiatermék – jórészt még aznap – átvette vagy feldolgozta valamilyen formában. Az is megállapítható ugyanakkor, hogy minden csoda egy napig tart: kétrészes cikksorozatunk második, március 11-én közölt része már koránt sem indított el ekkora lavinát, mint az első.
A vizsgált időszak vége felé lecsengeni látszik a véleményalkotási kedv, majd áprilisban egy újabb esemény korbácsolja az érzelmeket. Rövid kutakodást követően megállapíthatjuk, hogy ez a Magyar Tudományos Akadémia Nyelvtudományi Intézete által elindított online helyesírási tanácsadó szolgáltatása lehet: a helyesiras.mta.hu portál április 30-án indult, a sajtóemlítéseknek pedig rövidesen meg is lett a kimutatható hatásuk.
Érdekes megvizsgálni, hogy alakul az említések összeadódó – kumulált – száma a vizsgált időszakban. A fenti grafikonon a fent említett két fontosabb eseményt A (a helyesiras.mta.hu portál indítása) és B (a helyesírási szabályzattal kapcsolatos információkat megszellőztető nyest.hu cikk megjelenése) betűkkel jelölték a vizsgálat készítői.
A helyesírásra vonatkozó említések főként blogokról, fórumokról és a bejegyzésekhez tartozó hozzászólásokból származnak. A két esemény meglehetősen szép számú cikket és blogbejegyzést generált, ezek pedig még több említést eredményeztek a fórumokon. A nyilvános Facebook-bejegyzések száma ugyanakkor meglepően alacsony maradt. Ezt láthatjuk az alábbi grafikonon:
Jól látható, hogy a vizsgált időszakban az index fórumozói kiemelkedően sokat foglalkoztak a helyesírás témával. A sorban meglepően sok említést söpört be a prohardver.hu, továbbá a Nők Lapja online kiadásának olvasói is kimondottan aktívak voltak – olyannyira, hogy lapunkat le is szorították a dobogós helyről:
Ha az előbbi grafikon adatait újravizsgáljuk és csak a cikk típusú tartalmakra szűrünk látható, hogy a vizsgált időszakban nyest.hu által közzétett cikkekben szerepel legtöbbet a helyesírás téma – írja nekünk a Neticle elemzője, Obláth Eszter. Nem meglepő, hogy ezen a listán a nyest áll a sor elején.
Elgondolkodtató, hogy a gazdasági témájú penzcentrum.hu is előkelő helyen szerepel a sorban. Megvizsgálva az időszak cikkeit megállapíthatók az okok is, mégpedig az, hogy a helyesírási szabályok változása fontos változásokat hozhat a bankok elnevezéseiben is.
Mit ír az újság?
A szentimentelemzéssel átfogó képet kaphatunk arról, mit gondolnak az internet használói egy adott dologról. Más kérdés, hogy ezt miképp fejezik ki, hogyan örülnek valaminek, vagy bosszankodnak éppen. Hogy ezt megtudjuk, rengeteg forráson kellene átrágnunk magunkat, ami rendkívül időigényes és unalmas elfoglaltság lenne. Szerencsére a számítógépek tűrik a monotóniát és gyorsan végeznek a tartalomelemzéssel, a probléma csak az, hogy először meg kell nekik mondani milyen nyelvi információra vagyunk kíváncsiak a vizsgált szövegekben: ez a tartalomelemzés. Elsősorban arra voltunk kíváncsiak, hogy a magyar sajtóban hogyan jelenik meg a helyesírás. Ezért gyorsan felkértük egy másik dinamikusan fejlődő magyar nyelvtechnológiai cég, a Precognox szakembereit, hogy segítsenek az alábbi lapok weboldalainak elemzésében:
- Blikk
- e-nyelv.hu
- Heti Válasz
- Híradó
- HVG
- Index
- Magyar Hírlap
- Magyar Nemzet Online
- Népszabadság Online
- Nyelv és Tudomány
- Origo
Miután megállapítottuk a vizsgált portálok listáját, érdemes egy pillanatra elgondolkodni a kifejezésről, amit elemezni fogunk. Ha a helyesírás szót használnánk, könnyen belátható, hogy túlvállalnánk magunkat: ezt a szót rendszeresen használjuk – egyebek mellett – hajtépés és a kollégánk munkájának pocskondiázása közben. Éppen ezért most a helyesírási szabályzat kifejezésre keresünk – így biztosan nem merítünk túl nagyot.
A következő feladatunk, hogy a fenti lista és a keresőkifejezésünk alapján letöltsük a cikkeket, ahol a kifejezéseink előfordulnak. Ehhez a boilerpipe nevű szoftvert használjuk – ennek segítségével érhetjük el, hogy a kigyűjtött szövegek nagyrészt relevánsak, azaz a mi szempontunkból megfelelőek legyenek: ne gyűjtsünk olyan anyagokat, amelyekben a keresőkifejezésünk a menüben, a reklámokban jelenik meg, esetleg úgy, hogy valaki a cikk alatti kommentbe „dobta be” azt, hogy „helyesírási szabályzat”.
Az eredményül kapott szövegeket elkezdhetjük azonnal elemezni, vagy – ha nagyon pontosak szeretnénk lenni – még egyszer átnézhetjük – most már „kézzel”. Mi nagyon szeretnénk pontosak lenni, ezért végigbogarásszuk a gép által felkínált találatokat. A cikkeket relevancia alapján soroltuk két csoportba – azaz eldöntöttük, hogy a kérdéses anyag a vizsgálatunk szempontjából lényeges-e, avagy sem. Így például az a cikk, amelyik a szingli nők férfiválasztási szokásairól szól, a releváns cikkek közé került, hiszen – legalábbis a cikk szerint – a szingliknél nem csak az fontos szempont, hogy a férfi ne legyen szűz, de az is, a kiválasztott tisztában legyen a helyesírási szabályzattal. Nem került viszont be egy sor olyan anyag, ami egyes kifejezések helyesírásával foglalkozik, és csupán ennek érdekében citálja a helyesírási szabályzat egy-egy pontját.
Ezután a szövegekben megvizsgáltuk, milyen „minősítések” szerepelnek a „helyesírási szabályzat” kifejezéssel egy bekezdésben. Az így kialakított szócsokorból a Wordle szolgáltatás segítségével elkészítettük vizsgálatunk első eredményét, egy színes szófelhőt. Íme:
A szófelhő – amellett, hogy szép, színes és jól mutat egy ilyen hosszúságú cikkben – arra jó, hogy beazonosítsuk, melyek azok a kifejezések, amelyek leggyakrabban előfordultak az általunk vizsgált cikkekben a keresőkifejezésünk – a helyesírási szabályzat – mellett.
Érdemes vetni egy pillantás arra, hogy a releváns és nem releváns tartalmak esetében hogyan alakul ezen jelzők használata. Az ún. commonality cloud, azaz a közös előfordulásokat mutató szófelhő szemlélteti ezt.
Az eltéréseket az összehasonlító felhő (comparison cloud) mutatja meg, melyen kék színnel jeleztük a releváns cikkekben előforduló jelzőket és pirossal a nem releváns tartalmakban találtakat.
(Forrás: Precognox)
Foglalkozzunk a továbbiakban a grafikon releváns (kék színnel jelzett) oldalával! Egyértelmű, hogy a bizonyos mindent visz – nem alaptalan ugyanakkor azt feltételezni, hogy ez sallang csupán, azaz a vizsgálatunk szempontjából nem kimondottan releváns eredmény. Nézzük csak, milyen példákat látunk a használatára – mondatban:
- Bizonyos esetekben a helyesírási szabályzattól okkal térnek el...
- Bizonyos hogy a magyar helyesírás szabályai szerint a helyes alak..
- Lehet ez megfelel nekik, hiszen bizonyos emberek számára a helyesírás szabályai nem mérvadoak…
- Az a bizonyos szó a helyesírás szabályai szerint abszint és nem absinthe…
…és így tovább. Megállapíthatjuk tehát, hogy – ahogy sejthettük – a cikkeinkben a bizonyos kifejezés jellemzően nem releváns a helyesírási szabályzatra.
Vizsgáljunk meg pár gyakori (a fenti ábrán nagyobb méretű betűvel szereplő) kifejezést, amit izgalmasabbnak gondolhatnánk a helyesírási szabályzat szempontjából. Nézzük csak meg a képünkön szereplő jelenlegi kifejezés említéseit!
- A jelenlegi helyzetben még korai megmondani mennyibe kerül az új helyesírás szabályzat által ránk nehezedő névváltoztatás.
- A jelenlegi szabályok szerint ez nem helyes... (négy alkalommal is találunk ilyet a szövegekben);
- A jelenlegi szabályzat alapján.... (15 alkalommal szerepel ez a fordulat).
Íme az első fontos megállapításunk: úgy tűnik, mintha mindenki a jelenlegi szabályokról, a jelenlegi szabályzatról értekezne. Egyértelmű, hogy a korábban említett nyestes cikksorozat a magyar helyesírás szabályainak új, 12. kiadásáról – ami bizony nagy dolog, hiszen a legutóbbi kiadás 1984-ben jelent meg – valamiféle várakozást keltett. A sajtó szóhasználata tehát elsősorban erre a várakozásra utalhat.
Ezt a vélekedésünket erősítheti a mai szó használata is a cikkekben (zárójelben az említések számát jelöljük):
- …a mai napon jelentették be, hogy az új helyesírási szabályzat miatt sok cég - elsősorban bankok - névváltoztatásra kényszerül (1);
- ..mai átírásban Mao Zedong, régiesen Mao Ce-tung, de a helyesírási szabályzat helyett ilyenkor érdemesebb a Keleti nevek magyar helyesírásához fordulni (1);
- … a mai helyesírási szabályzat szerint... (31)..
Az első eset pontosan azzal foglalkozik, amit már korábban is említettünk: ahogy az új helyesírási szabályzat előírásai esetleg sok százmilliós költségbe verik a bankokat. Ugyanakkor a vizsgálat szempontjából mégis csupán zaj az idézett mondat, hiszen a mai szó itt nem a szabályzatra utal.
A második mondatrész idegen nevek átírására utal – az átírás hagyományai, szabályai változtak, azaz nem feltétlenül vonatkoztatható teljes mértékben a helyesírási szabályzatra, amit ebből a mondatból megtudhatunk.
A harmadik találat – már csak a nagy számú előfordulása miatt is – az előző feltételezésünket erősíti: a tollforgatók körében kialakult egy várakozás a helyesírási szabályzattal kapcsolatban.
Az eredmények tükrében elmondható, hogy mind a felhasználók által generált webkettes tartalmakban, mind az online sajtóban egy kicsit megélénkült a helyesírással kapcsolatos beszéd. Az új szabályzat híre hangsúlyosan megjelent a szerkesztett tartalmakban és a felhasználók körében egyértelműen negatív irányba mozdult el a szentiment. Oksági kapcsolatot a rendelkezésre álló adatok alapján nem tudunk kimutatni, de talán nem állunk messze az igazságtól, ha ezt feltételezzük: azaz lehetséges, hogy nem csak a bankszektor előlegezi meg a bosszankodást a szabályzat miatt, de az átlagos internetező is.
Mire jó mindez?
Ilyen és ehhez hasonló vizsgálatokat nem csak a helyesírási szabályzattal kapcsolatban lehet elvégezni. Ha egy párt, vagy politikus, esetleg egy cég folyamatosan nyomon követi a közösségi portálokon megjelenő véleményeket, az fontos helyzeti előnyt jelenthet számára. Pontosan mérheti majd, hogy egyes kommunikációs fogások, hirdetési kampányok, esetleg egy-egy botrány, ütésváltás, hogy hatott a közvéleményre. Az online marketing módszerei annyira kifinomultak, hogy például segítségükkel sokan jó eséllyel jósolják meg akár fél napra előre is a tőzsdeindexek alakulását.
Cikksorozatunk következő részében egy hazai, sokak által ünnepelt, de sokak által megvetett celebet vizsgálunk hasonló módszerekkel. Mit számít egy-egy kommunikációs fiaskó? Hol van az a határ, ahonnan a kommunikációt inkább stratégia mentén, professzionálisan kell intézni, mintsem saját kezűleg? Rövidesen megmutatjuk!
Köszönjük a Neticle Technologies és a Precognox cikkünk elkészítéséhez nyújtott segítségét!
Sajnos az emberek nagy többségét mindössze öt dolog érdekli: politika, közélet, szex, sport, autók. Így azoknak az online oldalaknak, amelyek nem ezek közül valamelyikről szólnak, eleve meg van pecsételve a sorsuk. Ez pedig eléggé valótlan statisztikákat eredményez, ha az elemzések csak a legnépszerűbb oldalakat veszik figyelembe. Szerintem a "kisebbség" véleménye is fontos lenne, bár nem tudom, hogy az mennyire kivitelezhető. Sokszor éppen olyan online oldalakon vannak a leghasznosabb és legérdekesebb információk, amelyek a kutyát nem érdeklik - mert nem kapnak elég nyilvánosságot...
Az helyesírásnácinak számít, ha valaki ezt olvassa ki ebből a kék kis képversből, hogy: "a JELENLEGI MAGYAR HIVATALOS helyesírási szabályzat KIEMELTen FONTOS,
BIZONYOS, hogy TECHNIKAI BIRTOKOSa KOMOLYABB, tehát ADOTT, hogy NYELVTANIlag JOBB,
mint a MAI INTERNETES vele nem AZONOS, ONLINE SEMMILYEN helyesírás, amelyik NYELVIleg nem HELYES, amitől KISEBB leszel, te KIS te"?:-)
Amúgy jó kis, érdekes cikk volt ez a helyesíráskomcsiktól.:-)