Álhírek felsimerése nyelvi modellek segítségével

Az álhírek komoly társadalmi problémákat generálnak, a terjedésük által okozott kár pedig akár emberéletekbe is kerülhet – például az oltásellenes attitűdöt vagy az orvosilag bizonyított hatékonyságú gyógykezelések megtagadását eredményező álhírek révén. Mivel az álhírek terjedési sebessége sok esetben meghaladja a valódi hírekét, és képes lehet az emberek véleményének, döntéseinek (jellemzően káros irányban történő) befolyásolására, így fontos, hogy minél hatékonyabb módokon vegyük fel ellenük a küzdelmet. Minderre újabban a mesterséges intelligencia eszköztára is lehetőséget biztosít számunkra.

Berend Gábor, Csendes Tibor, Németh T. Enikő | 2024. március 4.

Az MTA Tudomány a Magyar Nyelvért Álhírek, áltudományos nézetek nyelvészeti alapú azonosítása című alprogram keretein belül az álhírek nyelvészeti szabályok alapján történő felismerése mellett az MTA-SZTE-DE Elméleti Nyelvészeti és Informatikai Kutatócsoportja komoly hangsúlyt fektet a mesterséges intelligencia (MI) nyújtotta lehetőségek kiaknázására is. Az Álhírdetektor oldalát meglátogatva kipróbálható a projekt keretein belül fejlesztett automatikus álhírfelismerő-alkalmazás. A projektben – az álhírek felismerését segítő nyelvészeti szabályok megfogalmazásán túl – olyan MI-t használó módszertan kifejlesztése zajlik, amely segítségünkre lehet az álhírek felismerésében.

A MI-modelleket azzal a céllal hozták létre a kutatók, hogy azok képesek legyenek emberi beavatkozás nélkül, autonóm módon azonosítani a befolyásolási vagy megtévesztési céllal létrehozott tartalmakat. Mindez azért is hasznos, mert a manipulatív tartalmak létrejöttének volumene napjainkban minden eddiginél nagyobb méreteket ölt, így fontos, hogy minél gyorsabban legyünk képesek felismerni a hamis információkat. Minderre az MI nyújtotta eszközkészlet kiválóan alkalmas, hiszen a dokumentumok kiértékelését az emberi feldolgozás sebességéhez képest nagyságrendekkel gyorsabban képes elvégezni.

Éppen ezért – a kritikus szemléletű és tudatos tartalomfogyasztás készségének kialakítását támogató programok mellett – hatékony módszert jelent az álhírek elleni küzdelemben az MI-alapú gépi tanulási modellek használata. Ezek a modellek képessé tehetők az álhíreknek a valós tartalmaktól való minél nagyobb pontossággal történő elkülönítésére, azáltal, hogy felismerik a szövegekben lévő mintákat, nyelvi jellemzőket, továbbá az álhírekben gyakran használt stiláris megkülönböztető jegyeket. Gépi tanulás alkalmazásával olyan modellek készíthetőek, amelyek képesek azonosítani az álhírek általános jellemzőit az emberi megítélést megközelítő pontosság elérése mellett, ugyanakkor az emberi feldolgozás sebességénél számottevően jobban skálázódó módon.

A projekt keretén belül egy ún. transzformer neurális hálót alkalmazó nyelvi modellre támaszkodnak, amely modell az utóbbi időben számos természetesnyelv-feldolgozási (natural language processing; NLP) probléma megoldása során bizonyította sikeres alkalmazhatóságát. A transzformer architektúrára épülő nagy paraméterszámú nyelvi modellek képesek a szövegekben rejlő összefüggések, kontextusok és nyelvi jelenségek feltárására, amelyek rendkívül hasznosak lehetnek változatos, a szövegek feldolgozásával kapcsolatos feladat elvégzésében, többek között az álhírek azonosításában is.

Valódi vagy ál?
(Forrás: Wikimedia Commons / mikemacmarketing / CC BY 2.0)

A transzformeralapú modellek felhasználása az álhírek azonosításában a következő módon zajlott. Először a modell nagy mennyiségű, változatos szövegeken történő ún. előtanítása történt meg. Ebben a fázisban a neurális háló tanításának célja még nem a manipulatív tartalmak felismerésére, hanem az általános nyelvi kompetenciák kialakítására irányul, amivel így a modell képessé tehető a természetes nyelven megfogalmazott szöveges összefüggések számítógépes reprezentálására.

Az előtanításon már átesett, így általános nyelvfeldolgozási képességekkel már rendelkező, ún. előtanított modellt egy második fázisban konkrét célfeladatra, jelen esetben az álhíreknek a megbízhatónak titulált hírektől való elkülönítésére specializálták. Ehhez emberi döntések sokaságát hívták segítségül, ahol az egyes hírekhez szakértők rendelték hozzá azt a címkét, hogy a vonatkozó hír melyik kategóriába esik. A modell finomhangolása, vagyis a viselkedésének a célfeladathoz történő adaptálása, ezen címkézett adatok használata mellett történt meg.

Fontos megjegyezni, hogy bár a transzformeralapú modellek kiemelkedő teljesítményt nyújtanak az álhírek elleni harcban, nincs egyetlen tökéletes megoldás. Az ilyen modellek csak részét képezhetik egy komplex stratégiának, amely magában foglalhatja az adatok változatos forrásból történő összegyűjtését, az emberi szakértők bevonását az értékelés folyamatába, valamint a tényellenőrzésre (fact checking) való támaszkodást is az automatizált módszerek alkalmazása mellett.

Összességében a transzformeralapú megközelítések jelentős előrelépést jelentenek az álhírek azonosításában és a dezinformáció elleni küzdelemben. Ezek a modellek lehetővé teszik a szövegek mélyebb megértését és az azonosított minták összefüggéseinek felismerését, ami a kutatók tapasztalatai szerint hatékony eszköze lehet a hamis információk felismerésének és káros hatásaik csökkentésének.

Kapcsolódó tartalmak:

Hasonló tartalmak:

Hozzászólások (1):

Követem a cikkhozzászólásokat (RSS)

1 éve 2024. március 12. 18:39

1 Sándorné Szatmári

Ezek a modellek tehát

(micsoda véletlen) fékezik a "féknyúz" terjedését ..? :)

legutóbbi hozzászólások listája...

Nyelv és politika; Természettudomány; Nyelvtudomány; Oktatás; LEITERJAKAB

Váltás normál nézetre...