2-ő és 3-om?

Bármilyen jól értünk valamihez, nem árt, ha ismerjük annak korlátait is. Ha pedig nem tartjuk bajnak, ha hibázunk, el kell gondolkodnunk azon, hogy fontos-e egyáltalán, amit csinálunk.

Fejes László | 2018. január 18.

Ákos nevű olvasónknak az automatizált helyesírási tanácsadással gyűlt meg a baja:

Biztos ismeritek az mta helyesírás-ellenőrző honlapját. Én csak ma fedeztem fel, és egyből belefutottam egy olyanba, amióta azóta is csak a fejem vakarom.
Erről a portálról van szó: http://helyesírás.mta.hu/helyesiras/default/suggest#
Nos, ha itt kipróbálom a manapság fb-on gyakran felbukkanó „2-ő” és „3-om” alakokat, a program a hangjelölés szabályaira hivatkozva helyesnek ítéli. Szerintem, és az általam ismert szabályok szerint 2 és 3 lenne a helyes.
Mi a szakmai véleményetek erről? Nálam a hiba vagy az MTA-nál?

Egy hasonló esetben már leírtam, hogy az automatizált helyesírási tanácsadást eleve rossz ötletnek tartom. Kétféle érvet soroltam fel: az egyik érvcsoport szerint maga a megvalósítás ütközik áthidalhatatlan nehézségekbe, és vezet óhatatlanul hibás, megtévesztő tanácsokhoz; a másik szerint maguk a felhasználók nincsenek felkészülve arra, hogy a tanácsokat értelmezzék (illetve megoldhatatlan, hogy a tanácsadó szoftver mindent olyan világosan magyarázzon meg, hogy azt bármely felhasználó megértse). Konklúziónk szerint ezek a programok legfeljebb olyanoknak segíthetnének, akik maguk is ki tudják találni a magyarázatot.

Kételyeinket Váradi Tamás, az MTA Nyelvtudományi Intézete Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztályának osztályvezetője végeletesnek mondta véleményemet, és arra célzott, hogy kételyeim abból fakadnak, hogy nem ismerem a technológia részleteit. Ugyanakkor felvetéseimre lényegében csak annyival válaszolt, hogy a rendszerben természetesen lehetnek hibák, folyamatos fejlesztésre szorul. Teljesen ignorálta azt a tényt, hogy egy felhasználó számára ez esetben elfogadhatatlan, ha a rendszer hibázik, hiszen ő éppen azért fordul a rendszerhez, hogy rábízza magát – és fel sincs készülve arra, hogy a rendszer hibázhat. Végezetül azzal tromfolt, hogy az oldal népszerűsége egyre nő – ha a népszerűség a hatékonysággal függene össze, akkor a homeopátia hatékony lenne, és jövőnkkel kapcsolatban érdemes lenne a telejósoktól tájékozódni. Az oldal népszerűsége nincs azzal összefüggésben, hogy az oldal jó tanácsokat ad-e, hiszen a felhasználók túlnyomó többsége a választ így is, úgy is elfogadja, még akkor is, ha szöges ellentétben van a helyesírási szabályokkal, vagy ha nem is arra kapott választ, amit kérdezni szeretett volna – mint korábbi kérdezőnk, János, vagy éppen most Ákos. Váradi Tamás olyan szinten beszélt el mellettem, hogy a további vitát értelmetlennek láttam. Most azonban olvasónk kérdései kapcsán ismét csak magamat tudom ismételni.

Mivel sajnos valóban nem látunk bele a tanácsadó szoftver technikai részleteibe, csak tippelni tudunk, minek köszönhetőek ezek a válaszok. Azt ugyanis mi is természetesnek tartjuk, hogy a 2-ő [kettő] és a 3-om [három] helytelen formák.

Az utóbbi rejtély megoldása tűnik egyszerűbbnek. A 3-om valóban helyes alak, csakhogy nem a három, hanem a hármom írásmódjaként. A hármom meglehetősen ritka alak, a neten leginkább a három félregépeléseként bukkan fel (meglepően gyakran), de azért találunk ilyen adatokat is:

egyem – fenkő, kettőm – reszelő, hármom – nemezháztakaró-nemez...

van omega hármom...

A hármom a hármam alakváltozata, utóbbi gyakoribb és szabályosabb (vö. hármat, hármas, hármak), de mivel a számnevek ritkán kapnak egyes számú birtokos személyragot, a nyelvérzék bizonytalan velük kapcsolatban (és bezavar a hármon alak, ami más mint a hárman). Arra, hogy itt a helyesírás-ellenőrző tényleg a 3-am [hármam] helyett javasolja a 3-om [hármom] alakot, bizonyíték, hogy a 3-am alakot nem ismeri (helytelennek mondja). Hasonlóképpen a 3-ok alakot elfogadja, de a 3-ak [hármak] alakot nem.

A 2-ő már egy fokkal rejtélyesebb, mivel sem [kétő] sem [kettőő] alak nem fordul elő semmilyen jelentésben. Itt a hiba sokkal általánosabb lehet: kipróbálhatjuk, bármilyen betűt írunk az ő helyébe, a rendszer elfogadja.

A hiba hátterében talán az áll, hogy az önmagukban álló betűket a rendszer szavaknak fogadja el (jó okkal, hiszen önmaguk elnevezéseként előfordulhatnak), és azt is megengedi, hogy bármilyen két szó kötőjellel elválasztva szerepeljen, mint a hideg-meleg, jön-megy, ide-oda vagy a 2-3 esetében. Ezt látszik alátámasztani, hogy a rendszer a 2- után bármilyen létező szót elfogad.

Érdekes módon ha két betűvel ért szót adunk meg, akkor a rendszer az egybeírás-különírás helyességét vizsgáló modulhoz küld minket (akkor is, ha két betűt választunk el kötőjellel), sőt akkor is ezt teszi, ha egy betűkkel írt szó áll a kötőjel előtt, és számjegy a kötőjel után. Itt tehát valamilyen folyamatkezelési hibáról lehet szó.

Az olvasó ezen a ponton talán úgy gondolja, hogy a tanácsadóprogram szerzői hanyag munkát végeztek, vagy nem is értenek ahhoz, amit csinálnak. Erről azonban szó sincs. Maga a nyelv és az írás olyan összetett, hogy nagyon nehéz minden ilyen eshetőségre felkészülni, az ilyen hibák elkerülhetetlenek. A helyesírási tanácsadó fejlesztői tehát igenis nagyon jól értenek a nyelvtechnológiához, csupán arra nem képesek, hogy a technológia korlátait felismerjék – vagy nem is hajlandóak elgondolkodni róla. Esetleg azt nem tartják problémának, ha a rendszer időnként rossz választ ad a felhasználóknak, súlyosan megtévesztve őket.

Persze ha arra gondolnak, hogy nem baj, ha a rendszer hibázik, hiszen a helyesírás – legalábbis úgy, ahogy ma a magyar helyesírást kezeljük – végül is teljesen értelmetlen, akkor egyetértünk. A helyesírásnak ugyanis azt kellene szolgálnia, hogy az olvasó minél könnyebben értelmezze a szöveget, nem azt, hogy az író állandó frászban legyen attól, hogy elront-e valamit, az olvasó meg arra vadásszon, hol hibázott az író. Csakhogy ha ezt elfogadjuk, akkor helyesírási tanácsadásra sem lesz szükségünk. Különösen nem automatizáltra.

Kapcsolódó tartalmak:

Hasonló tartalmak:

Hozzászólások (4):

Követem a cikkhozzászólásokat (RSS)

6 éve 2018. január 24. 04:16

1 El Vaquero

100-áz 100-ázalékig egyetértek. Egyáltalán nem megbízható egyik helyesírási tanácsadós oldal sem. Ha tényleg ki lehetne vitelezni hibátlanra, már rég nem lenne szükség helyesírásra, mindenki beírna mindent a gépbe, az meg kijavítaná.

5 éve 2018. július 9. 11:54

2 Zubi

Úgy látom, ezt már javították a fejlesztők. (helyesiras.mta.hu/helyesiras/default/suggest)

5 éve 2018. július 9. 20:28

3 Irgun Baklav

@Zubi: Valóban, gondolom valaki felhívhatta rá a figyelmet, így kivették. Azt, hogy ezeket manuálisan vették ki, onnan gondolom, hogy a „3-om” helyére, amit immár ismeretlennek jelöl, már csak a „3” megoldást javasolja, míg a 3-am helyett a javaslatok: Javaslatok: 3-ám, 3-an, 3-a, 3-aim, 3-at ( helyesiras.mta.hu/helyesiras/default/suggest?q=3-am )

Mondjuk így a számmal írt három E/1 birtokos esetére (hármam > 3-am) nem maradt semmi; bezzeg a tárgyesetes 3-at („hármat”) vagy a többes számú 3-aim („hármaim”) az jó neki. Ez nyilván a berhelés mellékhatása.

Szóval a fejlett nyelvi algoritmusnak ez a sok finom szabály azért még így is sok, csak felületi kezelésként beletweakelhetnek a kódba, ha felszínre kerül egy ilyen huba.

4 éve 2019. április 24. 12:55

4 PI

nyelv, nyel, nyúl, nyíl, nyal.

legutóbbi hozzászólások listája...

Nyelv és politika; Természettudomány; Nyelvtudomány; Oktatás; LEITERJAKAB

Váltás normál nézetre...