Migránsok, menekülők, bevándorlók: mit sulykol a média?
Rövidesen itt az úgynevezett kényszer-betelepítésről szóló népszavazás. Hatalmas nyomás alatt tartja a média a társadalmat: de miről is szól ez az egész? A modern számítógépes nyelvészet nem adhat pontos válaszokat, de abban viszont segíthet nekünk, hogy képet kapjunk arról, milyen érzelmeket kavarnak fel a különböző felületek. A Precognox kutatóinak köszönhetően egy aprólékos elemzést adunk most közre arról, hogyan próbálják eladni nekünk a népszavazást a médiában.
Már csak pár nap és itt a népszavazás amikor is mindenki eldöntheti, hogy igennel, nemmel, érvénytelen szavazattal vagy éppen otthonmaradásával fejezi ki véleményét. Miközben vitathatatlan, hogy a menekültek nagy számban érték el hazánkat, továbbra sem találkozhatunk velük lépten-nyomon az ország bármely pontján, hiszen többségük szinte azonnal tovább is állt. A magyar közvélemény számára a legközvetlenebb kapcsolatot a több százezer menekülttel a média jelenti, ezért megpróbáltuk kideríteni, hogyan jelennek meg az online sajtóban a migrációval kapcsolatos hírek. Szövegbányászati és képfeldolgozási módszerekkel több mint negyvenezer cikket vizsgáltunk meg, melyeket 2014.09.27. és 2016.06.11. között publikáltak. A szövegek és metaadataik kereshető formában elérhetőek az általunk készített adatvizualizációs dashboardon. Írásunkban nagy vonalakban áttekintjük a dashboard által nyújtott elemzési lehetőségeket és a képek által hordozott információkat is megpróbáljuk emészthető formában tálalni.
Adatok
A témában – médiatartalmak és médiareprezentációk vizsgálata – született nagyrészt kvalitatív kutatásokkal szemben olyan módszereket kívántunk alkalmazni, amelyek lehetővé teszik a nagy mennyiségű adat automatikus feldolgozását (ezzel a kutatási időszak kibővíthető, és az elemzésbe bevont tartalomszolgáltatók száma is növelhető), és amellyel képessé válhatunk a képi és a szöveges tartalom egyidejű elemzésére. Utóbbi feladatot a vizsgálatot készítő Precognox gyakornoka készülő szakdolgozatában valósítja meg, amely a klaszterelemzés alkalmazásának és kiértékelésének finomításával foglalkozik. Lényege, hogy a jövőben könnyebben tudjuk a szöveges és az egyre nagyobb arányú képi tartalmakat együttesen értelmezni.
Az elemzések elkészítéséhez szükséges adatokat 25 online hírportálról gyűjtöttük. Ezek között szerepelnek a magas olvasószámmal rendelkező nagy tartalomszolgáltatók – mint például az index.hu, az origo.hu, a mno és a hvg online változata, és megtalálhatóak kisebb portálok is. Utóbbiak lefedik a magyar online hírmédia-piac széles spektrumát, találhatóak a mintában cikkek a pestisrácok.hu-ról, az abcug.hu-ról, a kuruc.info-ról és a bulvársajtó népszerű oldalairól egyaránt. Mindezek mellett gyűjtöttünk a televíziós csatornák online felületéről (atv.hu, rtl.hu, hirek.hu), és hivatalos rendőrségi közlemények is bekerültek a mintába, a police.hu-ról.
A menekültválsággal kapcsolatos cikkeket a legtöbb oldalon a portál beépített keresőjével értük el, ez azonban nem volt mindig lehetséges. A kereső funkció hiányában (vagy emellett) az oldalakon rovatok és címkék segítették, hogy megtaláljuk a kapcsolódó tartalmakat. A cikkek URL címét a Link Klipper Google Chrome bővítmény segítségével gyűjtöttük össze manuálisan, majd a hivatkozások birtokában automatikusan gyűjtöttük le a cikkek szöveges és képi tartalmát.
A korpusz összetételének értelmezéséhez fontos megemlíteni az url címek és a tartalom szűrésének folyamatát, amely során a hivatkozáslista mintegy 30 ezer elemmel csökkent. A folyamat során több módszert vetettünk be annak érdekében, hogy a korpusz valós cikkeket tartalmazzon, portálonként egyedi tartalmakat. A “szemétnek” nevezett linkeket, amelyek cikkajánlásokra mutattak, vagy a keresési eredményeket felvonultató oldalakra, simhash segítségével távolítottuk el. A domainen belüli duplikátumok szűrését tf-idf statisztikára alapozott hasonlósági metrikával szűrtük ki, és emellett a duplikált URL címeket is eltávolítottuk. Minden duplikátumszűrésnél heurisztikát alkalmaztunk: a legkorábban megjelent cikk maradt a korpuszban. Emellett kiszűrtük az olyan cikkeket is, amelyek esetében nem állt rendelkezésünkre timestamp, a publikálás időpontját nem tudtuk beazonosítani. Bár mindent megtettünk annak érdekében, hogy statisztikai eszköztárunk alkalmazásával minimalizáljuk a mintába nem illő tartalmakat, nem lehetünk teljesen biztosak abban, hogy kizártunk minden irreleváns cikket. Emellett fontos azt is megjegyezni, hogy a korpusz összetétele alapján korlátozottan vonhatunk le következtetéseket arról, hogy az adott portálon hány cikk jelent meg a témában, illetve, hogy melyik hírportál volt a legaktívabb a téma reprezentálását illetően. Ennek oka, hogy egy-egy cikk korpuszba kerülése egyszerre jelenti a cikk valós megjelenését és azt, hogy a hírportálon lehetőségünk volt a crawling módszert alkalmazni, valamint, hogy a szűrési feltételeknek megfelelt a tartalom (nem azonosítottuk duplikátumként vagy szemétként, és elhelyezték rajta a timestamp-et). A folyamat végén elkészült a 42845 darab cikkből álló korpuszunk.
Keresőszavaink a „bevándorlás”, „bevándorló”, „migráns”, „migráció”, „menekült” és „menedékkérő” voltak. Látható, hogy a korpuszban lévő cikkek majdnem fele a “menekült” keresőszóra érkezett találat, ezt követi a “bevándorlás”, “bevándorló”, “migráns”, “migráció” szavak, végül pedig a “menedékkérőre” érkezett találatok. Egyedi címkéket és rovatokat három oldal esetében használtunk, a kuruc.info-n a “bevándorlóbűnözés” alá sorolt tartalmakat gyűjtöttük a keresőszavakkal történő keresés mellett, a kettősmérce.blog.hu-n a “menekültügy” rovat segített a cikkek megtalálásában, valamint a blikk.hu “menekültválság” címkéjét használtuk fel, hogy eljussunk témában megjelent írásokhoz.
A médiareprezentációs kutatások fontos eleme a szóhasználat, a megnevezések modalitásának vizsgálata (amely önmagában lehet elidegenítő vagy félelemkeltő). Természetesen hibás messzemenő következtetéseket levonni a kontextus hiányában, és csupán a keresőszavak alapján következtetni az adott tartalomszolgáltató menekültek megjelenítésével kapcsolatos stratégiáira. A következő bontásban mégis megfigyelhetjük egy-egy portál esetében a keresőszavakra érkeztek találatokat: mely kifejezéseket preferálták és melyeket kerülték az adott oldalon keresőszavaink közül.
A korpusz összetételét leíró statisztikák után, hogy betekintsünk az adatok mélyére, a cikkek tartalmi elemzését is elvégeztük. Ennek első lépéseként, az előfeldolgozás folyamatában megtisztítottuk a szövegállományt a rossz karakterkódolású szövegektől, magyarlánc segítségével szótőre bontottuk a szavakat és szófaji szűrést is végeztünk, valamint hogy az elemzések eredményességét tovább növeljük, stopszó-lista (azaz a nem kívánatos kifejezések listájának) alkalmazásával kiszűrtük a természetes nyelvhasználat miatt gyakori szavakat.
Az eredmények interaktív bemutatására dashboardot készítettünk, melyen összegyűjtöttük annak a sokrétű elemzésnek az eredményeit, amely reményeink szerint kiegészíti, kijavítja vagy éppen pontosítja a menekültválság reprezentálásával kapcsolatos hétköznapi sejtéseinket; és egy oldalon összefoglalja azt a világot, amelyet a bevándorlással kapcsolatban megjelenít a magyar online sajtó.
Időbeli trendek
A bevándorlás médiabeli visszhangjáról könnyen képet kaphatunk, ha azt vizsgáljuk, hogy a megfigyelt időszak alatt mikor és hány cikk keletkezett a témában. Mi ezt a szöveges korpuszhoz készült dashboard segítségével néztük meg, ami azt mutatta, hogy 2015. májustól kezdett el emelkedni a témában megjelent cikkek száma, majd 2015. augusztus végétől szeptember közepéig keletkezett a legtöbb hír. Ezután 2015 októberétől 2016 májusáig nagyjából egyenletes mértékben jelentek meg cikkek, majd 2016 júniusában, éppen a gyűjtési időszak végénél látható egy újabb emelkedés.
A felületen a cikkekben szereplő szavakra, kifejezésekre is kereshetünk a Search mező segítségével. Ha például rákeresünk arra, hogy “menekült”, “migráns”, “migráció” vagy “bevándorló”, az eredetihez nagyon hasonló trendet kapunk. Viszont vannak olyan kifejezések is, amiknek a használata nem volt jellemző az egész időszakra. Ilyen például a “megélhetési bevándorló”, amelyre a Search mezőben úgy érdemes rákeresni, hogy “megélhetési AND bevándorló”, vagy éppen a “migránsbűnözés” kulcsszó, amelyre a Filter news panelben tudunk leszűrni a keywords kategóriában. Ugyanis ha ezek idősorát megnézzük, azt láthatjuk, hogy a megélhetési bevándorló kifejezés nagyjából 2015 közepéig örvendett népszerűségnek, a vizsgált domainek közül is leginkább a nepszava.hu cikkeiben, míg a bevándorlóbűnözés taget a kurucinfo oldalon kezdték el előszeretettel használni 2016 elejétől.
Emellett találhatunk olyan szavakat is, amik általánosabban kapcsolódnak a témához. Ilyen pl. a “bevándorlás” szó, aminek az időbeli eloszlása több helyen is kicsúcsosodik, azaz már a megemelkedett médiafigyelem előtt is jelzi a jelenség kibontakozását.
Emóciók, szentimentek
Az online média diskurzusának elemzésekor fontos szerephez jut az eseményekkel kapcsolatos érzelmek, attitűdök beazonosítása. Noha az újságírók a hírek megírásakor általában objektivitásra és semlegességre törekednek, a használt szavak mégis elárulják a hír tárgyához való viszonyulást, nem is beszélve azokról a cikkekről, amiknél meg sem próbálják palástolni a véleményüket.
A dashboard két füle a cikkekben beazonosítható szentimentek ill. emóciók vizsgálatához nyújt eszközt. A szentiment- illetve emócióelemzés során az a célunk, hogy a szövegek által közvetített véleményeket, attitűdöket, érzelmeket azonosítsuk. A szentimentelemzés rendszerint 3 kategóriát (negatív, semleges, pozitív) vagy ennek fokozatait használja, míg az emócióelemzés általában a 6 emberi alapérzelmet (bánat, düh, öröm, undor, félelem, meglepődés) próbálja detektálni. A szentimentek és az emóciók azonosítására a Precognox saját szótárait használtuk, amelyek közül a szentimentszótárak kutatási célra szabadon elérhetők ezen a linken. Az emóciószótárak még kiforratlanok, fenntartással kell kezelnünk őket, de hozzávetőleges elemzésre már alkalmazhatók.
A cikkek szentiment- illetve emócióértékét úgy számoltuk ki, hogy a cikkekben az egyes szótárak által beazonosított szavak számát elosztottuk a teljes szószámmal. Így egy 0-tól 1-ig terjedő értéket kaptunk, minden egyes cikk esetében külön-külön a negatív és a pozitív szentimentekre, valamint a bánat, a düh, az öröm, az undor, a félelem és a meglepődés emóciókra. Ezután a szentimenteket összesítettük a pozitív és a negatív értékek összeadásával. Ez az összesített szentiment -1 és 1 közötti értéket vesz fel egy cikkre vonatkozóan, azonban a dashboardon az adott napon publikált hírek értékei összegződnek, ezért láthatunk például 10 vagy -8 körüli szentimentértékeket is.
A bevándorlás témájú cikkek összesített szentimentjére nem jellemző általánosságban sem a pozitív, sem a negatív szentiment, inkább a semleges szentiment körül mozog a napi szentimentérték és csak egy-két kiugró érték figyelhető meg. Ha külön figyeljük a pozitív és külön a negatív szentimentértékek idősorát, megállapíthatjuk, hogy mindkét szentiment jelentősen képviseli magát, azonban összesítésben az időszak nagy részében kiegyenlítik egymást. Ez azt jelzi, hogy a legyűjtött források széles spektrumon mozognak szentiment szempontjából, és általánosságban – néhány kivétellel – kioltják egymást és kiegyensúlyozott képet mutatnak.
Az emóciós idősorok alapján a bánat és a félelem mutatkoznak meg a legerőteljesebben a cikkekben, habár azt érdemes megjegyezni, hogy a szótárak különböző hosszúsága miatt nem teljesen korrekt az emóciók volumenét egymáshoz mérni. Ha rászűrünk egy időpontra a Time window panel segítségével, elolvashatjuk az adott időponthoz tartozó cikkeket és kideríthetjük, hogy milyen esemény váltotta ki az emóciók megemelkedését. Például ha rászűrünk 2015. augusztus 31-re, amikor mind a bánat, mind a félelem emóció magasba szökött a cikkekben, azt láthatjuk, hogy ezen a napon rengeteg cikk íródott többek között a humanitárius katasztrófáról a Keletinél összegyűlt emberek miatt, a közúti és vasúti feltorlódásokról, Magyarország bevándorlási politikájának negatív külföldi visszhangjáról, a kvótarendszer elutasításáról, az érkező menekültek számáról, a fokozott határvédelemről és a tranzitzónákban dolgozó önkéntesek ellehetetlenült helyzetéről.
Ezenkívül persze érdemes rászűrni a domainekre és megnézni, hogy melyik hírportálra milyen szentiment ill. emóció jellemző. Példaképp vegyük a 444.hu-t, ahol a megfigyelt időszak egészében folyamatosan ugrál az összesített szentimentérték a pozitív és negatív szentimentek között, és a meglepődés emóción kívül mindegyik emóció jelentősen ugrál az időszak nagy részében.
A felületen az idősorok mellett az adott szentimenthez és emócióhoz tartozó szavak is megjelennek. Két példát kiragadva a negatív szentimentet kifejező cikkeknél a “kellemetlenség”, a “probléma”, a “háború”, a “terrorista” és a “betegség” kifejezések jellemzőek, míg a félelem emóciót tartalmazó cikkeknél többek között az “aggály”, a “rettegés”, a “terror” és az “aggódás” szavak vannak túlsúlyban.
Topikok
Hogy egyszerűbben át lehessen tekinteni a több mint 40.000 cikk tartalmát, szemantikailag összetartozó, tematikus csoportokat hoztunk létre, amihez a Mallet eszköz látens Dirichlet allokáció (LDA) nevű topik modelljét használtuk. Az LDA algoritmus a dokumentumokban előforduló szavak eloszlása alapján végzi az osztályozást. A topikok elnevezését már az elemzők végzik, az algoritmus kimenete az adott topikhoz tartozó legjellemzőbb szavak listája és egy lista arról, hogy egy-egy dokumentum milyen arányban reprezentálja az egyes témákat. A modellezés során összesen 47 topikot kaptunk, amiket tehát a topikhoz tartozó kulcsszavak, illetve a legjellemzőbb cikkek alapján neveztünk el. A topik modellezéskor minden cikk hozzárendelődik egy bizonyos mértékben minden topikhoz, általában 1-2-3 darabhoz jelentősebb, míg a többihez elhanyagolható mértékben. A könnyű kezelhetőség kedvéért minden cikket ahhoz a témához rendeltük hozzá, amihez a leginkább tartozik. Emiatt lehet, hogy egyes cikkeknél azt érezzük, csak egy-két mondatuk tartozik az adott témához, de a módszer összességében jól modellezi a korpusz tematikus struktúráját.
A szövegekhez és metaadataikhoz készült dashboardon külön fület kapott a topikok elemzése. A 15 legtöbb cikket tartalmazó topik listája a következő, zárójelben a témához tartozó cikkek száma található:
-
Európai Unió és Törökország között készülő migrációs egyezmény (2313)
-
Eu-s menekültpolitika kritikája (FIDESZ-KDNP) (2124)
-
Illegális bevándorlók és embercsempészek elfogása (2123)
-
Délkelet-európai migráns áradat (2060)
-
Nyugat-Európába tartó migránsok útja Magyarországon keresztül (2028)
-
Menekültszállító hajók balesetei (1723)
-
Szigorított menedékjogi törvény (1696)
-
Menekültekkel kapcsolatos incidensek Németországban (1555)
-
Közel-Keleti háború (1469)
-
Dél-Magyarországi határzár (1440)
-
Merkel menekültpolitikai irányvonala és annak bírálata (1412)
-
Nemzetközi és civil szervezetek adománygyűjtési és segélyprogramjai a szíriai menekültek megsegítésére (1311)
-
Külpolitikai válaszok a menekültválságra (1238)
-
Osztrák-magyar határzár (1225)
-
Menekülthullám okozta politikai válság (1121)
A dashboard segítségével könnyen képet alkothatunk, hogy milyen szavak jellemzőek a téma tálalásában, illetve, hogy milyen pozitív és negatív kifejezésekkel szeretnek élni a szerzők. Például az “Európai Unió és Törökország között készülő migrációs egyezmény” topikhoz tartozó leggyakoribb szavak az “uniós”, a “menekült”, az “állam”, a “világ” és a “szerep”, a negatív szavak közül a “teher”, a “kellemetlenség”, a “kényelmetlenség”, a “probléma”, a pozitív szavak közül pedig a “fontos”, a “szabad”, a “jogosult”, a “tiszteletadás” kifejezések vannak jelen legnagyobb mértékben. Ettől eltérően az “Illegális bevándorlók és embercsempészek elfogása” témában a “rendőrtiszt”, a “rendőrörs”, a “férfi”, az “illegális” és a “szíriai” szavak jutnak nagy szerephez. A negatívak közül a “tiltott” szó válik fontossá, a pozitív szavak súlya viszont kisebb marad.
A 47 topik közül kiválasztottunk két topikot, az “EU-s menkültpolitika kritikája (FIDESZ-KDNP)” és a “Liberális szemléletmód a migránsokkal kapcsolatban” címűeket. Ezeket a témákat a cikk végén bővebb elemzésnek vetjük alá.
Kikről írnak a híroldalak?
A legyűjtött cikkekből a DBpedia Spotlight használatával kinyertük a névelemeket (Named Entity Recognition), melyek közül három típust, személynevek, földrajzi nevek és intézménynevek vizsgáltunk. A kinyert névelemekből gráfokat készítettünk, melyekben a csomópontok az egyes entitások, az élek pedig azt reprezentálják, hogy egy cikkben együttesen meg lettek említve.
A személynevek gráfja meglehetősen sok csúcsot – szám szerint 2345 entitást – tartalmaz, melyek között összességében 13473 kapcsolat figyelhető meg. Csupán néhány, a gráfot jellemző paramétert kiragadva: az átlagos utak hossza 3,3, a gráf átmérője – azaz két legtávolabbi csúcsának távolsága – 10, a klaszterezési együttható – mely megadja, hogy milyen gyakorisággal van összekötve két olyan csúcspont, melyek mindegyike kapcsolódik egy harmadik csúcshoz – 0,75. Miután meglehetősen sűrű hálózatról beszélünk, az elemzés és ábrázolás során célszerű volt redukálni annak nagyságát, hogy központi elemei láthatóbbá váljanak. Így jelen ábrán csupán az eredeti hálózat átlagos fokszáma feletti, legalább 12 kapcsolattal rendelkező csomópontok szerepelnek. Utóbbiak mindegyike a hálózat óriáskomponensének részét képezi – azaz bármely két tetszőleges entitás között vezet út, nincsenek elszigetelt csúcsok.
A névelemekből kialakított gráf esetében viszonylag sok releváns csoport különült el, melyek közül a politikai jellegűek a legdominánsabbak – ezek alkotják a legnagyobb erősen összefüggő komponenst – a központi magot –, s az ezeket alkotó névelemek között találhatóak a legnagyobb fokszámú entitások is. A gráf középpontjában található – a többihez viszonyítva legnagyobb kiterjedésű – kékkel jelzett klaszter tulajdonképp a magyar politikai szcéna szereplőinek gyűjtőhelye, az idesorolt személyek közül legnagyobb fokszámmal Orbán Viktor rendelkezik, aki – ahogy a csúcs méretéből is jól látható – a teljes gráf esetében is a legnagyobb közös említésszámmal bír a cikkek esetében. A klaszterbe sorolt személyek közül ugyancsak nagyobb fokszámmal rendelkezik a Fidesz rezsim néhány kulcsfontosságú alakja (Szijjártó Péter, Rogán Antal, Lázár János), valamint egykori és mostani politikai pártelnökök is (Vona Gábor, Gyurcsány Ferenc). Szintén jól elkülönülő blokkot alkotnak a Nyugat-Európai politikai élet szereplői (magenta), mely klaszteren belül egyaránt látható, hogy hasonló, de akár nagyon eltérő migránsokkal szembeni álláspontot képviselő politikusokat is többször említenek egy cikken belül. Előbbire jó példa a magas fokszámával is kitűnő Angela Merkel, akit közös említések sokasága köt össze hozzá hasonlóan liberális menekültpolitikát képviselő politikusokkal – Francois Hollande, Federica Mogherini, Martin Schulz. A migránsellenes politikát folytatók körében a Donald Tusk – David Cameron - Nicolas Sárközy tengely és a hozzá kötődő kapcsolatok emelhetők ki. Nyilván a két blokkon átívelő kapcsolatok sem ritkák, ezek ugyanúgy felfedezhetők a gráfon belül. A zölddel jelzett klaszter főként Amerika és Oroszország politikai életének szereplőit fogja össze, továbbá az iraki és szíriai háború központi alakjait, terrorista szervezetek tagjait.
Az utóbbiakat kiegészítve a központi maghoz szorosan kapcsolódik továbbá a keresztény egyházhoz kötődő személyek csoportja (világosszürke), s a magyar írók, költők, színészek köre (narancssárga) is. A magtól elszakadva felfedezhetőek egyéb – a politika szférájához nem kapcsolódó – csoportok: Nobel-díjas tudósok és felfedezők, focisták, külföldi színészek és hírességek.
Az intézménynevek esetében az előbbi gráfhoz képest már viszonylag kisebb hálózatról beszélhetünk, amelyben 602 csomópont található, ezek közt 3215 éllel. Csupán néhány érdekesebb paramétert kiemelve: az átlagos utak hossza 2.532, a gráf átmérője 6, végezetül klaszterezési együtthatója 0.74. Az ábrázolás esetében szintén fokszám alapján szűrtünk: az átlagos fokszám – azaz 10 – és afeletti entitások kerültek az ábrára. A zöld színnel jelzett klaszter egyrészt politikai pártok gyűjtőhelye – viszonylag sok cikk esetében említették közösen a Fidesz a Jobbikkal, a Demokratikus Koalícióval és az Ellenzéki Párttal, továbbá a Jobbik utóbbi kettővel való erős kapcsolata is szépen látható. A klaszter esetében a politikai pártok szépen összefonódnak a hagyományos és közösségi média intézményeivel – televízió- és rádiócsatornákkal, Facebookkal, Twitterrel –, példának okáért szépen kiemelt, vastagabb él húzódik az M1 és a kormánypart között. A pirosas színnel jelzett csomópontok a német, míg a szürkével színezettek az osztrák politikai pártok csoportját alkotják. A világoskék klaszter főképp nemzetközi szervezetek gyűjtőhelye, míg a lila valamiképp egy „olvasztótégelyre” hasonlít, melynek legfőbb összetartó erejét az MTI adja: ugyanúgy részét képezik telekommunikációval, elektronikai cikkekkel foglalkozó cégek, ahogy külföldi pártok, segélyszervezetek is. A Magyar Távirati Iroda egyben a gráf legnagyobb fokszámmal rendelkező entitása is, szinte minden a gráfon fellelhető intézménnyel kapcsolatban áll cikkek esetében – ez utóbbi az MTI profiljából adódóan talán kevéssé okoz meglepetést.
A földrajzi nevek esetében a csomópontok nagyságát meghagytuk egységesnek a könnyebb áttekinthetőség kedvéért. A térképen összesen 28147 földrajzi név 46907 kapcsolata látható, a gráf átmérője 6, az átlagos úthossz 2,667. Látható, hogy a legtöbb pont Magyarországon található, illetve a migráció kiindulási pontjai és a fogadó országok is hangsúlyosan megjelennek a gráfon. A magyarországi települések közül a legnagyobb fokszámmal a határ mentén fekvők rendelkeznek, a cikkek során ezeket említették legtöbbet. A szerb-magyar határ esetében gyakorta említésre került Bácsborsód, Zákányszék, a román-magyar határ mentén fekvő települések közül Csanádpalota, továbbá Szabolcs-Szatmár-Bereg megye némely települése: Mátészalka, Nyírmada, Nyírbogát is. Magyarországtól eltávolodva kimondottan nagy fokszámmal említhető meg Brüsszel kontinenseken átnyúló kapcsolataival, ám nem meglepő módon számos alkalommal került közösen említésre magyarországi határ menti településekkel is.
Képi megjelenítés
Napjainkban a legtöbb cikkben találunk egy vagy több képet is. Ezen képek szerepe egyre fontosabb, hiszen általában többen olvasnak olyan írást, amiben található kép, a közösségi médiában pedig létfontosságú a megosztás mellé egy jó fotó. Ezért a szövegek mellett legyűjtöttük a cikkekhez tartozó képeket is. Habár az olvasó számára egyértelmű, mely képek tartoznak az adott cikkhez, a gépek számára ez nem egy könnyű feladat. Mi különféle heurisztikákat használtunk erre, pl. a nagyon kicsi képekről feltételeztük, hogy azok logók vagy egyéb dizájnelemek, a cikkek végén megjelenő képes ajánlók miatt sok oldalon egy-egy kép első megjelenésének dátumát vettük csak figyelembe, végezetül a leggyakoribb képek közül párat kézzel távolítottunk el. Mivel a képfeldolgozás rendkívül hardverigényes feladat, törekedtünk arra, hogy a duplikátumoktól megtisztítsuk az adathalmazt, így végezetül 38266 darab képünk maradt, ami 28456 dokumentumban fordul elő összesen 62762 alkalommal.
Az általunk begyűjtött képeket egyrészt lehetetlen végig nézni, másrészt értelmetlen is. Ahhoz, hogy legalább valamilyen képet alkothassunk adathalmazunk tartalmáról, szükségünk van az egyes képek tartalmát leíró eszközre. Szerencsénkre a képfeldolgozás több módszerrel is rendelkezik, mi a Clarifai szolgáltatását választottuk, ami tag-eket ad meg az egyes képekhez, akár magyarul is. Mivel a mi adathalmazunk speciális, a szolgáltatás eredményeit nem tudtuk azonnal használni. A Clarifai úgy tűnik a nyugati fehér középosztály életéből származó képeken tanult be, ezért pl. a menekülttáborokban fotózott tömegjelenetek rendre a “fesztivál” tag-et kapták, de felülreprezentáltak a “rally” és “szórakozás” tag-ek is. Úgy látszik, együtt kell élnünk az ilyen hiányosságokkal, ezért a címkék közül párat egyszerűen kizártunk (pl. zenész), mások (pl. a fesztivál) megmaradtak, de esetünkben jelentésük erősen módosult. Például a fesztivál tag esetünkben arra utal, hogy tömeg található a képen, gyakran egyenruhások sorfala mögött, vagy a menekültek pihennek, táboroznak valahol. Annak ellenére, hogy nem tökéletesek a címkék, lehetőséget nyújtanak arra, hogy a képi információt szövegesre váltsuk át és bevett eszközeinkkel tudjuk immár elemezni az adathalmazt.
A szövegek esetében is használt LDA módszerrel nyolc topikba tudtuk sorolni a képeket. A cikkekbe ágyazott képek esetén érdemes felidézni olyan kutatásokat, amelyek kisebbségek fotókon való megjelenítését elemzik, mint például Bernáth - Messing, vagy Wright. A topikmodellel talált kategóriák között is felismerhetőek a szakirodalomból ismert reprezentációs stratégiák, melyek célja sokszor az elidegenítés. Ez megfigyelhető, amikor menekülteket tömegként ábrázolják, arcukat alig kivehetően; vagy “áramlatokként”, ahogy megközelítik a térképen látható Európát. Gyakori, hogy szemben ezzel az ábrázolásmóddal, a menekültekről szóló cikkek “arccal” rendelkező figurái politikusaink, teljes emberi voltukban (hiszen még nevüket is tudjuk) éles kontrasztot képeznek a kisebbség megjelenítésével. Fokozva az aránytalanságot és a képpel együtt érkező többlettartalom negatív hangulatát, sokszor csak akkor ismerhetjük meg a menekült arcát, mikor rendőrségi körözés alanyaként szerepel a hírekben; és gyakori, hogy rendőrségi/ katonai intézkedés közben készült képet látunk róla. A topik modell eredményei ezzel szemben más reprezentációs stratégiákra is rámutatnak. Szerepelnek képek, amelyeken háborús övezeteket láthatunk, vagy kisebb csoportokat, gyermekes családokat, akik éppen vándorolnak. Ezek a képek mindenképpen érzékenyítenek a menekültek sorsával szemben. A következő kollázsok az egyes topikokra leginkább jellemző képekből álltak össze.
A fenti topikok időbeli eloszlását szemléltetik az alábbi ábrák.
Az “Arctalan tömeg” és “Kisebb csoportokról, családokról készült képek” topikoknál látható extrém értékek részben annak köszönhetőek, hogy még nem tudjuk tökéletesen elkülöníteni egy adott oldalon a cikkhez tartozó képeket az oldal többi képétől.
EU-s menekültpolitika kritikája vs liberális szemléletmód a migránsokkal kapcsolatban
Az elkészült 47 topik közül egy érdekesebb ellentétpárt vettünk górcső alá, összehasonlítva, hogy két tagja közt milyen párhuzamok és különbségek figyelhetők meg a topikokba tartozó cikkek időbeli eloszlását tekintve, továbbá a topikok esetében jellemző szentimentek, emóciók és névelemeket szempontjából.
A választás elég provokatív: az Eu-s menekültpolitika kritikája címet viselő topik elsősorban olyan cikkek gyűjteménye, melyek az Európai Unió migránsokkal kapcsolatos befogadó szemléletmódjának kritikája jelenik meg – többek közt a migráció negatív következményeire. A topik alapját adó cikkeket döntően a Fidesz-KDNP által széleskörűen hangoztatott migránsellenes szemléletmód határozza meg. A második topik, a migránsokkal kapcsolatos liberális szemléletmód ennek valamiképp az ellentéteként, s szigorú kritikájaként fogható meg.
Cikkek időbeli eloszlása
Az Eu-s menekültpolitikát kritizáló cikkek 2015 januárja előtt szinte elenyészőek voltak, az első hirtelen kiugrás 2015. január vége – február eleje köré datálódik, mikor is röpke két hét leforgása alatt 80 cikk látott napvilágot kritikus hangvételt megfogalmazva az Eu migránsokra vonatkozó stratégiájával szemben. A következő kiugróbb hullám 2015 májusa környékén indult meg, a cikkek számát tekintve hosszútávon növekvő tendenciát mutatva – e periódus során hétről hétre minimum 13, maximum 60 cikk jelent a témával kapcsolatban. Utóbbi hullám 2015 augusztusának utolsó hetén tetőzött 155(!) cikk kíséretében. Ezt követően szép lassú lecsengés figyelhető meg, egészen 2016 januárjáig, mikor ismét egy kisebb emelkedés következett be.
A liberális szemléletmód topikjánál a cikkek száma már nagyságrendileg kisebb, mint az előbbi esetében, de eloszlásuk szépen követi a korábban leírt időbeli sémát – a kritikusabb hangvételű cikkek számának emelkedésére válaszul megnövekedett a liberális szemléletmód által áthatott cikkek mennyisége is. Ám e topik esetében viszonylag ritkán fordult elő, hogy egyik hétről a másikra drasztikus ugrás következett volna be – az egyetlen kivétel ez alól a 2016. júniusi megugrás – inkább lassabb ütemű általános növekedést tükröznek az adatok.
Szentimentek
Az összesített szentiment értékeket megfigyelve szépen látható, hogy az Eu-s menekültpolitika kritikája esetében 2015 januárjáig túlnyomóan a negatív szentimentek többsége volt jellemző – a legmagasabb negatív szkórral rendelkező szavak a periódusban a „rossz”, „terrorizmus”, „veszedelem”, „baj”, a leginkább kiugró pozitív töltetű szó a „szabad”.
Ez utóbbi kifejezés egyaránt utal a topik egyik központi témájára is – szabad mozgás lehetősége –, illetőleg azokra a dilemmás kérdésekre is, melyek azzal foglalkoznak, hogy meddig érdemes az Eu-s áramlattal együtt haladni. Ezzel szemben ugyanezen időszakban a második topikot inkább a pozitív és negatív szentimentek kiegyenlítettsége jellemzi, nem figyelhető meg nagyon kiugró negatív vagy pozitív szentiment érték sem.
Időben tovább haladva az Eu-s topik esetében egy stabilabbnak mondható időszak következik, az összesített szentiment érték természetesen hétről hétre ugrál a pozitív és negatív térfél között, ám az eltérések viszonylag kisebbnek mondhatók – a július végi pozitív kiugrástól eltekintve nincsenek nagyobb mozgások egyik irányba sem. 2015 júliusa után azonban megkezdődik a negatív töltetű szavak számának folyamatos emelkedése, ezzel párhuzamosan a pozitívak arányának csökkenése – így összességében az összesített szentiment érték csökkenésnek indul, s 2015 novemberében már visszatér a korábbi 2014 december – 2015 január során tapasztalt szintre. A negatív szentiment értékek 2015. november 16.-i héten érik el mélypontjukat – nem véletlenül, a párizsi terrortámadás-sorozat hatással volt a magyar médiára is. Utóbbi csúcspont a liberális szemléletmód topikjánál is megfigyelhető – az egész idősor esetében itt tapasztalható a legkisebb összesített szentiment érték –, azonban az események megtörténte utáni hetekben a szentiment értékek viszonylag hamar ismét visszatértek a korábbi szinthez. Utóbbi jól jelzi, hogy az események ellenére nem változott meg lényegesen a liberális szemléletmódú cikkek hangvétele.
Ezután a két idősor hasonlóképp halad – eleinte az összesített szentiment szkórok semleges felé tendálása jellemző–, végezetül 2016 júliusától indulóan ismét a negatív hullám veszi kezdetét.
A két topik között apróbb különbség figyelhető meg a leggyakoribb pozitív szavakat tekintve: liberális topik esetében például megjelenik a „szeretet”, „kedves” és „nyugodt” szó is, melyek már nagyobb érzelmi töltettel rendelkeznek, mint a másik topik esetében a „fair”, „korrekt”, és a „kegyesség” kifejezések.
A két topikhoz tartozó cikkek összesített szentimentjének időbeli eloszlása:
A düh emóció időbeli eloszlása:
Az undor és a bánat emóciók együtt mozognak mindkét topik esetében, és általában csak napi pár cikk fejezett ki ilyen attitűdöket. Vannak azonban kivételes napok. Például az EU-s téma esetében 2015. szeptember 7-én több undor és bánat emóciót kifejező cikket írtak a “menekültáradat”-ról szóló politikai nyilatkozatokkal kapcsolatban, amikben javarészt Orbán Viktortól idéztek. A liberális szemléletmód topikjánál pedig 2016. június 10-11-én találhatunk több undor, illetve bánat emóciójú cikket. Ezek javarészt a magyarok idegengyűlöletéről, a magyar politika bevándorlásellenességéről és a félelemkeltéséről szólnak.
A 2015 második felében keletkezett cikkekben a félelem emóció jellemző attitűdnek számított és 2016-ban sem nyugodtak le teljesen a kedélyek. Az EU-s topiknál a legnagyobb kilengés 2015. október 16-hoz köthető, ekkor is magas arányban számoltak be Orbán Viktor kijelentéseiről és az erre adott reakciókról, többek között arról, hogy Orbán Viktor szerint a bevándorlók befogadása miatt számítani lehetett a párizsi terrortámadásokhoz hasonló eseményekre. Mindeközben Vona Gábor is ugyanezt a témát boncolgatta azzal a kijelentésével, hogy a bevándorlók nem terroristák, de a terroristák bevándorlók, míg sokan mások a témával kapcsolatos egyet nem értésüket fejezték ki. A liberális szemléletmód topikjánál 2015. november 14-én, a párizsi terrortámadást követő másnapon volt egy nagyobb csúcs, ahogyan a düh emóciónál láthattuk, illetve 2016. június 10-én, ahogyan az undor és a bánat emóciók esetében volt megfigyelhető.
A félelem emóció időbeli eloszlása:
Névelemek
A névelem vizsgálata alapján az a következtetés vonható le, hogy a két topik a valamelyest eltérő fókusz és hangvétel ellenére nagy arányban szól közös földrajzi helyekről, személyekről, szervezetekről.
Az EU-s és a liberális szemléletmód topiknál Magyarország, az Európai Unió és Ausztria tartoznak a legtöbbet említett helyszínek közé. Az EU-s témánál Németországról és Brüsszelről cikkeztek még a legtöbbet, míg a liberális szemléletmódú hírekben az Iszlám Államról és Budapestről.
A személy típusú névelemek esetében mindkét téma szempontjából fontos tényezők Orbán Viktor, Angela Merkel és Lázár János. Az EU-s topikba tartozó cikkekben Orbán Viktor, Angela Merkel, Szijjártó Péter, Donald Tusk és Lázár János követik egymást a gyakorisági sorban, a liberális szemléletmódú cikkekben pedig Orbán Viktor, Putyin, Lázár János, Angela Merkel és Gyurcsány Ferenc.
A szervezetek közül az MTI és az M1 szolgál közös forrásként, illetve témaként a két topikban keletkezett cikkek szövegében. Az EU-s topikba tartozó cikkekben az MTI, az ENSZ, az M1, a visegrádi négyek és CDU a leggyakrabban megjelenő szervezetek. A liberális szemléletmódú cikkekben a potenciálisan linkekből jövő szervezetek nevét kizárva (Google, Facebook) pedig a FIDESZ, az MTI, a Jobbik, az M1 és a DK a legtöbbet említett szervezetek.
Képek
A tárgyalt topikokhoz tartozó képeket is megvizsgáltuk. Először arra voltunk kíváncsiak, hogy van-e különbség a legnegatívabb és legpozitívabb szentimentértékű szövegekben használt képek között. Ahogy az alábbi kollázsokon is láthatjuk, negatív tónusú szövegekben az EU-s menekülpolitika kritikája több képet használ, mint a liberális szemléletmódú írások. A képek témája is eltérő, a konzervatív nézőpont politikusokat és tömegjeleneteket vegyít, a liberális szemléletmódban jelennek meg csak a migránsábrázolások.
Mindkét topik esetében nagyon hasonló képek kerültek a legpozitívabb hangvételű írásokba illusztrációnak. Érdekes, hogy az EU-s menekültpolitika kritikája topikban menekültnek látszó embereket csak egyenruhás alakok társaságában láthatunk.
Kinyertük a két témához tartozó képtopikokat is és a legjellemzőbb elemeikből kollázsokat készítettünk. Ezeket megvizsgálva látható, hogy az EU-s menekültpolitika kritikája a politikusok közül Orbán Viktort mutatja előszeretettel, főleg egyedül, vagy európai döntéshozók társaságában, ezzel ellentétben a liberális szemlélet másoknak is teret enged. A “Határnál, kerítésnél, úton” képtopik esetéb mindkét téma operál képi humorral, de a liberális tematikában ez sokkal erősebben van jelen és a konzervatív tónusú szövegek inkább a határzár bemutatására használják a képi elemeket. Jelentősebb különbséget találunk még a “Kisebb csoportokról készült képek” képtopiknál is, az EU-s menekültpolitika kritikája a menekülteket mozgásban mutatja meg, a liberális szemléletmód pedig nőkkel és gyerekekkel illusztrál inkább.
A többi topik felfedezésére és összehasonlítására ajánljuk szabadon hozzáférhető dashboardunkat. Habár a gyűjtést 2016.06.11-én befejeztük, reméljük korpuszunk hasznos lehet azok számára, akik szeretnék a migránsok médiareprezentációját kutatni.
A szerzők a Precognox munkatársai.