A webes helyesírás-ellenőrzés csapdái
Cikkünk azt a „jó” szokást veszi célba, hogy sokan, ha nincs más kéznél, a keresőbe írják a szót, melynek helyesírásában bizonytalanok. Jó ötlet az alapján dönteni, hogy melyik változatra dob ki több találatot a kereső?
Korábbi cikkeinkben (Minek nekünk helyesírás; A nagy magyar helyesírás-háború) már tárgyaltuk azt a szomorú tényt, hogy nem egészen úgy működik a helyesírásunk, pontosabban a szabályzat, ahogy szeretnénk. Mindenképpen olyan helyesírás-ellenőrzési módszerről álmodunk, ami egyszerűbb és logikusabb, amivel nincs annyi gond, mint a manapság elérhető megoldásokkal. Hirtelen teljesen új szabályzatot bevezetni viszont meggondolatlanság lenne: az új írásbeli kódolás mellett a régi (a jövőből visszatekintve a jelenleg rendelkezésre álló) kódrendszert is ismernünk és ápolnunk kellene, mert például az eddig született szövegeink a korábbi szabályzat szerint íródtak. A dupla tanulást nem úsznánk meg, amit a kevesebb energia-ráfordítás elvével nehezen lehetne összeegyeztetni. A hasznosabb célkitűzés az, hogy a jelenlegivel kell valamit kezdeni, könnyebben kezelhetővé kell tenni, mivel eszerint kell írnunk, ez az elvárt. Bár a helyesírási szabályzat ajánlásként van népszerűsítve, az elvárások szintjén inkább kötelező, mint választható az alkalmazása.
Nem elég a szövegszerkesztő helyesírási tudása
Amikor szöveget szerkesztünk, a szószintű helyesírási bakik nagy részének (de az elírásoknak is) elkerülésében nagy segítségünkre lehet a szövegszerkesztőnk helyesírás-ellenőrző programja. Ez a „gyorssegély” program azonban nem vesz, nem vehet észre mindent, vagy egy sablon szerint kijavítaná az adott szövegkörnyezetnek megfelelően írt szót vagy szókapcsolatot.
Bizonyos esetekben a helytelenség felé vihet minket: vannak olyan értelmi tagolások, illetve egybeírások, amiket helytelennek jelöl a program, pedig valójában semmi gond nincs az írásukkal. Ha az internet kéznél van, mi pedig bizonytalanok vagyunk helyesírás ügyben, a rengeteg szöveges tartalom hívogat, hogy keressünk bennük, s a leggyorsabban meggyőződjünk arról, hogy a kérdéses szó vagy szókapcsolat melyik helyesírási változata a helyes; jó volt-e a tippünk.
Mennyire helyes az internetes szövegek helyesírása?
Ha az interneten található szövegek helyesírásáról kell véleményt alkotnunk, azt kell mondanunk, nem lehet feltétel nélkül etalonnak tekinteni. A hálón elérhető szövegek különböző csoportokba sorolhatók, attól függően, hogy helyesírásuk mennyire ellenőrzött. Az ellenőrzöttség jelentheti a helyesírási szabályzat szerint tanultak automatikus alkalmazását szövegalkotás közben, de jelentheti a kész szöveg a szabályzat és a helyesírási szótár segítségével történő utólagos ellenőrzését. A tudományos szövegek internetes változatát nem lehet teljes mértékben mérvadónak tekinteni (inkább a papíralapú változatot kell előnyben részesíteni), erre legtöbbször a szerzők is felhívják a figyelmünket. Azért persze a legtöbb esetben ezek a szövegek tartalmazzák a legkevesebb helyesírási hibát.
Ellenőrzöttnek tekinthető szövegek még például az internetes újságok, tudományos oldalak. A kevésbé ellenőrzött szövegek a személyes blogokból, fórumokból, egyéni honlapokról származnak többnyire. A keresők minden szövegben keresnek, nem tesznek különbséget köztük a helyesírás szempontjából.
Könnyebb helytelenül írni az interneten?
Azokban a szövegekben, amelyek nem követelnek meg formális nyelvhasználatot és kiváló helyesírást (azaz akkor, amikor nem önéletrajzról és motivációs levélről, hivatalos dokumentumokról és levelezésről, iskolai dolgozatokról, tudományos publikációkról, elektronikus könyvtárak anyagairól stb. van szó), hajlamosak vagyunk kevésbé igényesen írni. Valójában ezért nem is kövezhet meg minket senki, hiszen a helyesírási szabályzat „csak” egy ajánlás, szabadidőnkben „szabad szövegeinkkel” pedig azt csinálunk, amit akarunk, és úgy, ahogy akarjuk.
A gépelés, billentyűzeten pötyögés több időt és energiát vesz igénybe, mint a hangos beszéddel történő közvetlen kommunikálás. Időnkből azonban nem lesz több, ha az interneten kommunikálunk, ezért az idő megtakarítására a gyors gépelésen kívül kialakítottunk egy „rövidítési írásszokást”, amelynek kísérője egy másik jelenség, amely sokak szerint rombolja az átlagos helyesírásunkat. Gyors írásnál nem szempont a helyesség, az akadémiai tökéletesség. Sokszor még poénosra is vesszük a dolgot, és mindent úgy írunk le, ahogy mondunk – úgy esik, ahogy „huppanik”.
Mikor győz az igényesség?
Akkor nézünk utána pontosan egy-egy szó helyesírásának, ha olyan szöveget alkotunk, amelyben elengedhetetlen a precízség. Amikor szemináriumi és egyéb dolgozatokat, önéletrajzot és motivációs levelet írunk, hivatalos és munkahelyi levelezés bonyolítunk le, és minden más hivatalos irat (bár ezek sem mindig tökéletesek, még a hatóságok részéről sem), hirdetmény megszövegezésekor.
Amint átváltunk az informális nyelvhasználatra, a helyesírás már nem élvez ekkora figyelmet. (Természetesen akad kivétel: sokan vannak, akik mindig igényesen és helyesen írnak, bármilyen kommunikációs célról is legyen szó.)
A köztes megoldás
Amikor nincs a közelünkben helyesírási szótár vagy szabályzat, de az internet a másodperc töredéke alatt elérhető, köztes és gyors megoldásként pl. a keresőprogramokhoz nyúlunk: beírjuk a variációkat a keresőbe. Egyes keresők, ha nem értenek egyet a beírt szó helyesírásával, helyesírási szótáruk alapján javasolnak egy másik megoldást. A szótár azonban véges, nem szerepelhet benne minden magyar szó. Ha pl. az eldemszkyz szót írjuk a keresőbe, ami egy relatíve ritkán előforduló szleng szó, ajánlott kereső kifejezésként az „el demszky”-t kapjuk. Azért a hibásnak ítélt alakkal keresve is kapunk találatokat. És persze, nem kell elfogadnunk a böngésző javaslatát: az emberi értelem mindig felülírhatja a program eredményeit.
Ahogy a szövegszerkesztők, ez is inkább az elírás kontrollálására, illetve javítására használható inkább. Bár abban az esetben, ha az elírás egybeesik a szótár szerint önmagában helyes szóalakkal, akkor a hiba észrevétlen marad a program számára. Az értelmes, alapos átolvasást nem pótolják az ellenőrző programok.
Az interneten sok, nem eléggé ellenőrzött forma, azaz hibás írásmód és elírás között keressük a helyesen írt alakot. Vezet ez valahova? Aszerint döntünk, hogy a szó melyik írásmódjára kapunk több találatot. Komoly statisztikai vizsgálatok nélkül nem jelenthetjük ki, hogy a módszer rossz és káros. Az eredmények körültekintő kezelése azonban erősen javallott. (Reméljük, hogy az esetek nagy részében a helyes alak a leggyakrabban előforduló változat.)
Google Hejesírás (verzió 0.0)
Hogy helyesírás ellenőrzésére is használjuk, használhatjuk a netet, arra már mások is felfigyeltek, rájöttek. Például a Központi Bitfeldolgozó Kft., amelynek „gondozásában” működik az interneten a Hejesirás 0.0. (http://hejes.szerver.org/) A Google találatai alapján segít döntenünk a különféle írású alakok között. Ha elsőre a helyes alakot írjuk be, és az egybeesik a Google magyar szótárának tartalmával, akkor 100%-ot kapunk a helyesség minősítésére. Ha hibás alakot írunk be, akkor találatok száma alapján százalékos eredményeket kapunk a különféle variációkra. Egy egyszerű tesztért nem kell a szomszédba mennünk. Ha beírjuk a hejesírás hibás alakot, a következő eredményeket kapjuk (az eredmények 2010. június 21-i tesztünkből származnak): a helyes alak, a helyesírás a találatok 49%-át teszi ki (41100 találat), de 49%-os a helyesirás (40800) is. 1%-os a hejesírás (540), 1%-os a hejesirás (552), de néhányszor előfordul a heljesirás, a heljesírás és a hellyesírás hibás változat is. Ha nem tudnánk, hogy melyik a helyes alak, az eredmények alapján kétségtelenül nehéz lenne dönteni a két első helyezett között. Az a 300-as különbség sokat nyomna a latban?
De nem vagyunk könnyű helyzetben akkor sem, ha arra vagyunk kíváncsiak, külön, egybe vagy kötőjellel kell írni pl. a foglalkozásegészségügy szót. Természetesen, ha ezt az alakot írjuk be, 100%-os helyességű eredményt kapjuk. De ha azt gondoljuk, hogy a foglalkozás-egészségügy a korrekt írásmód, és ezt írjuk be ellenőrzésképpen, akkor azt tapasztaljuk, hogy a sokféle írott változat közel azonos arányban fordul elő. Látszik, nagy a bizonytalanság, hogyan is kellene írni a szót. Egyik-másik változatot kizárjuk, de az alapprobléma megmarad: nem tudunk dönteni a százalékos eredmények alapján a két-három írásváltozat között, amelyre eredetileg is gondoltunk. Ha nem ezt az oldalt használjuk, hanem beírjuk a kötőjeles változatot a böngészőbe, rögtön lelepleződik egy hiba. A böngésző dob ki bőven találatot a kötőjeles változatra is, ezek azonban nem szerepelnek a Hejesírás 0.0 eredményei között.
Mérleg
A helyesírás szabályai az interneten is megtalálhatók, továbbá különféle online szótárak állnak még rendelkezésünkre, amelyek segíthetnek a hibák javításában. Ezek talán hitelesebbnek is tűnnek, mint a többé-kevésbé ellenőrzött szövegek alapján kapott eredmények. Hátrányuk viszont, hogy a szavak száma ezekben is véges, ugyanúgy, mint a papíralapú kiadványokban.
Az online keresés gyors, de sok esetben az a biztos, ami a papíralapú szótárakban van. Viszont a papíralapú helyesírási (és más) szótárakban, mint feljebb is mondottuk, véges a szavak száma. A kényes szónak, amit nem találunk a helyesírási szótárban, szabályok alapján és hasonló példák alapján kikövetkeztethető az írásmódja – tanácsolják a helyesírási szabályzat 11. (1984) változatának támogatói.
Ami előnye az internetes keresésnek: egyszerűen és gyorsan kereshetünk nagy mennyiségű szövegben, így nagy esélyünk van megtalálni azt a szót is, amit nem láttunk leírva semmilyen szótárban, sem más hiteles (lektorált és korrektúrázott) kiadványban. A találatok száma és az emlékezetünkben derengő szabályok alapján mérlegeljük, melyik a helyesírási szabályoknak a legmegfelelőbb alak.
@Fejes László (nyest.hu):
1. A Microsoft Windows XP-ben a Microsoft a cég neve. A Google Hejesírásban viszont nem, mivel nem a Google fejlesztette. És lehet, hogy a név necces, de ezt döntse el a Google, attól még az oldalnak nem Hejesírás a neve, pláne nem Hejesírás 0.0. A Windows XP-nek viszont Windows XP a neve, ezért nem "rövidítés" így hívni. XP-nek hívni, az rövidítés, de az meg elég elterjedt. És ugye az a cikkre vonatkoztatva a 0.0 lenne, nem a Hejesírás 0.0. Szóval továbbra is fenntartom, hogy ez nem stimmel.
2. Nem is mondtam, hogy kritizálja. Csak azt, hogy nem értette meg, hogy működik. "Ha elsőre a helyes alakot írjuk be, és az egybeesik a Google magyar szótárának tartalmával, akkor 100%-ot kapunk a helyesség minősítésére." Ez egész egyszerűen nem igaz, mert ha helyes alakot írunk be, akkor is megpróbálja előállítani a helytelen alakokat, és ezeket írja ki %-osan. És akár helyes, akár helytelen alakot írunk be, ha valamiért nem tud legenerálni más alakokat, akkor mindenképp 100%-ot fog kidobni.
3. Rendben.
@Cucu:
1. Az alcímben a Google Hejesírás szerepel, külön kiemelve, hogy a 0.0 a verziószám. A szerző tehát pontosan tudta, miről van szó. A későbbi rövidebb megnevezést kifogásolni olyan, mint azt kifogásolni, hogy mondjuk valaki Windows XP-ről beszél Microsoft Windows XP helyett. (Ráadásul a Google Hejesírás kissé necces elnevezés, hiszen nem a Google szolgáltatásáról van szó.)
2.-3. A cikk egyáltalán nem a program működését kritizálja, hanem arról szól, hogy a program felhasználóinak mire kell vigyázniuk.
De semmi baj, szeretjük a kritikus olvasót! :)
A helyesírás mellett van egy másik újságírói erény is, ez pedig az alapos utánajárás.
1. A Google Hejesírás neve Google Hejesírás, nem pedig Hejesírás 0.0. Nem olyan bonyolult ez, és elég egyértelmű az oldalról. A 0.0 a verziószám, ahogy oda is van írva, és csak arra utal, hogy minimális fejlesztés van mögötte.
2. A %-os eredmény csak azt jelzi, hogy a felsorolt alakok közül melyik hány %-ban fordul elő. Vagyis ha beírsz egy szót, és csak egy változatot látsz, az mindenképp 100%-os kap. Ez azért van, mert a program nem tudja mindig az összes létező változatot előállítani. Ilyen esetben sajátkezűleg is beírhatjuk a számunkra érdekes változatokat, és akkor ezekről látunk összehasonlítást.
3. A kötőjeleket kinyilvánítottan nem kezeli a program. Ez a Google API működéséből fakad. Vagyis ilyet ne is várjunk tőle.
Próbáltam nem tudálékos és kötözködő lenni, remélem többé-kevésbé azért sikerült... :-)
@wviki: Bár nem tudom, hogy 30 éve milyen szabályok vonatkoztak erre (jó eséllyel akkortájt tanultam csak írni-olvasni), de az általad említett egybeírott forma ma biztosan nem lenne helyes. Én a mostani szabályok alapján így írnám:
gépjárműutánfutó-működtető berendezés (vö. tehetségkutató műsor).
@El Mexicano:
- -@El Mexicano:
az ilyen rettenetes szókígyókat ragos-jelzős több szavas szerkezetekké érdemes szétszedni, s akkor már könnyedén kezelhető
ha jól értem a kifejezést, akkor ennek egy lehetséges feloldása: a környezetet károsító gázok kibocsátását felügyelő (szervezet)
Ebben a témában a kedvencemmel kb. 30 éve találkoztam, s így nézett ki: gépjárműutánfutófutóműműködtetőberendezés
Vettem a bátorságot belejavítani a kéziratba: a gépjármű utánfutójának futóművét működtető berendezésre
@Fejes László (nyest.hu): Ezzel teljes mértékben egyetértek.
@El Mexicano: Köszönjük.
Mindazonáltal a dolognak inkább az a tanulsága, hogy kár a helyesírásba olyan szabályokat tenni, amelyeket senki nem tud betartani, és amit nem is praktikus betartani. (Pl. minek szótagokat számolgatni?)
Különben aki nagyon ragaszkodik az internethez, ezt az oldalt ajánlanám: www.magyarhelyesiras.hu. Sajnos nincs minden benne, de nagyon jól használható (én is ez alapján javítok).
A 4. sorban: "helyesírás-ellenőrzési" helyesen. ;)
Tapasztalataim szerint helyesírási szempontból sem az ellenőrzőprogramokban, sem a keresőkben nem szabad megbízni. Annál is inkább, mert a hosszabb, kötőjeles összetételeket (pl. környezetkárosítógáz-felügyeleti) nem sokan tudják, hogy kellene helyesen írni, így könnyen előfordul, hogy a helyes írásmódú alakból találjuk a legkevesebbet, ha egyáltalán találunk ilyet.
Külön kérdés, ami mindig is nagy vitákat váltott ki: mi van a helytelenül leírt címekkel? (Pl. "Jóban Rosszban": minden forrásban így szerepel, ezért aztán mindenki így veszi át, pedig hibás...)
@graphoman: Köszönjük a visszajelzést. Nem értem, hogy annak idején miért nem javították a kollégák...
@wviki: Azt hiszem, ha megnézi a nyest cikkeit, láthatja, hogy nagy igyekezettel követjük a tipográfiai konvenciókat. Sajnos ez nem jelenti, hogy nem csúszhatnak be hibák.
Szerintem a cikk szerzője nem azt állítja, hogy a foglalkozásegészségügy alak helyes, hanem azt, hogy ha ezt írjuk be a gugliba, akkor kapunk egy csomó találatot, amelyekből azt a téves következtetést vonhatjuk le, hogy helyes. Ellenben ha a helyes foglalkozás-egészségügy alakot írjuk be, akkor olyan találatokat is kapunk, amelyekben egybe, olyat is, amelyekben külön van írva – azaz csak még jobban megzavarodunk. Sajnos a megfogalmazás valóban elég szerencsétlen és félreérthető.
Kedves szerző!
Magyarázza már meg, hogy a "foglalkozásegészségügy" így egybe miért lenne helyes. Hármas összetétel, 8 szótag. Én még úgy tanultam, hogy a három vagy több összetételből álló és 7 szótagnál hosszabb szavakat kötőjellel írjuk, akkor pedig a "foglalkozás-egészségügy" alak lenne a helyes. Csendben megjegyzem, hogy az első alakot a helesírás-ellenőrző ki is jelölöi.
@graphoman:
Teljes mértékben igazad van. Nem vagy Te nyomdász véletlenül? :)
Ugyanis ők szokták tudni, hogy mikor használunk kis kötőjelet (-, más szóval divizt) mikor közepes kötőjelet ("félkvirt-minuszt", bocsánat, nem tudom beszúrni), gondolatjelet és "kvirt minuszt (a kivonás jelét).
Ezek különböző hosszúságúak, s a tipográfiában egyértelmű szabályai vannak, hogy mikor melyiket használjuk. A fenti példában mind a két helyre kiskötőjelet kell szedni.
(Csak egy kákán-is-csomót-kereső megjegyzés...
Itt: „el demszky”–t és itt: Egyik–másik nem (kis)kötőjel dukálna? :-) )