0:05
Főoldal | Rénhírek

Kiismerhetőek vagyunk a Facebook-posztjaink alapján

75000 fő Facebook-posztjainak nyelvi elemzéséből kiderül, milyen 70 évesnek, tinédzsernek vagy pszichopatának lenni. Sőt, a közösségi oldalakra tett bejegyzések alapján azt is meg lehet jósolni, hogy mennyi idős és milyen nemű valaki.

nyest.hu | 2013. október 7.

A közösségi média korszakában élünk. Ez azt is jelenti, hogy mindinkább betekintést engedünk a magánéletünkbe. De nem kell rögtön a kompromittáló fényképekre gondolni, a közösségi oldalakon csupán a nyelvhasználatunk alapján is sok mindent elárulunk magunkról. A pennsylvaniai egyetem kutatói éppen ezt próbálták számszerűsíteni: mennyi mindent árul el rólunk a nyelvhasználatunk a közösségi oldalakon egy hagyományos kérdőíves személyiségteszthez képest? Tanulmányuk a PLOS ONE online tudományos lapban jelent meg, amiről a Science Daily készített beszámolót.

A kutatásban 75000 fő vett részt. Először ki kellett tölteniük egy hagyományos személyiségtesztet egy facebookos alkalmazás segítségével, majd elérhetővé kellett tenniük a kutatás céljaira a közösségi oldalon tett bejegyzéseiket. A kutatók ezeknek a bejegyzéseknek a nyelvi jellegzetességeit vizsgálták meg, és ebből következtettek a személyiségre.

Az elemzés alapján olyan számítógépes modelleket tudtak létrehozni, amelyek segítségével megjósolható az egyének életkora, társadalmi neme (gender), sőt az is, hogy hogyan töltenének ki egy szokványos személyiségtesztet. A kutatókat is meglepte, hogy ezek a modellek mennyire pontos előrejelzéseket adtak: a társadalmi nemet például az esetek 92 százalékában jósolta korrektül a modell, amely kizárólag a facebookos bejegyzések nyelvi sajátságaira alapozott. Ezeknek az úgynevezett nyitott modelleknek a sikeressége azt mutatja, hogy új irányokat vehet a személyiségvonásokat és a viselkedést kutató pszichológiai irányzat, és ezáltal a gyakorlati (terápiás) alkalmazások is hatékonyabbá válhatnak.

Csak szavak...

A nyelvhasználat megfigyelése azzal a céllal, hogy következtetéseket vonjunk le egy egyén érzelmeire, tulajdonságaira és viselkedésére nézve, egyáltalán nem új módszer a pszichológiában. A fő különbség abban áll, hogy most az adatok elemzésében nem „zárt”, hanem „nyitott” megközelítést alkalmaztak.

Mi e kettő között a különbség? – Margaret Kern, a kutatásban részt vevő egyik tudós így magyarázza: „A zárt megközelítésben a pszichológusok listázzák azokat a szavakat, amelyek szerintük például pozitív érzelmeket fejeznek ki – ilyen az elégedett, a csodálatos, a fantasztikus stb. –, majd megvizsgálják, hogy egy adott személy milyen gyakorisággal használja ezeket a szavakat. A szavak előfordulási gyakoriságából pedig következtetnek arra, hogy az illető mennyire tekinthető boldognak. Ennek a megközelítésnek persze jól érzékelhető korlátai vannak; a legsúlyosabb az, hogy nem minden esetben méri azt, amit mérni szeretnének vele.”

Kiismerhetőek vagyunk a Facebook-posztjaink alapján
Forrás: Wikimedia Commons / Eric B / GNU-FDL 1.2

Lyle Ungar, a kutatás másik résztvevője a következő példákat hozza fel: „Ilyen alapon valaki azt a következtetést is levonhatná, hogy az az angol nyelvű beszélő, aki az energiaszektorban dolgozik, gyakrabban használ negatív tartalmú kifejezéseket pusztán azért, mert az angol crude (’nyers, goromba’) szót gyakrabban használja, ugyanis az szerepel egy összetett kifejezésben (crude oil – ’nyersolaj’) , amely a szaknyelve része. És ilyenek a hétköznapi nyelvben is előfordulnak: a being sick of (’elege van belőle’) nem ugyanaz, mint a being sick (’beteg’).” És persze ilyen példákat a magyar nyelvből is találhatunk: megőrülni valamiért nem ugyanaz, mint megőrülni.

A másik hátránya ennek a zárt szókészlettel dolgozó megközelítésnek, hogy egy előzetesen kidolgozott, változatlan szólistára alapoz. Így arra például kifejezetten jól használható, hogy megerősítsük, amit amúgy is tudunk, hogy például a depresszióban szenvedők gyakrabban használnak a lehangoltságra vonatkozó kifejezéseket, amilyen a szomorú. Arra viszont kevés az esély, hogy új összefüggéseket találjanak ezzel a módszerrel – például, hogy a depressziósok kevesebbet beszélnek a sportolásról és a közösségi programokról, mint azok, akiket boldognak tartunk.

Szófelhők

Az eddigi pszichológiai vizsgálatok, amelyek a nyelvhasználatot vették alapul, szükségképpen a zárt megközelítést alkalmazták, hiszen a kevés adat miatt gyakorlatilag nem volt megvalósítható a nyílt megközelítés alkalmazása. Azáltal azonban, hogy – például a közösségi oldalakon – mind nagyobb mennyiségű nyelvi adat gyűlik össze, lehetőség nyílik új módszerek alkalmazására. „A legtöbb szó ritkán fordul elő. Bármely írásos adat csak töredékét használja az átlagos, mindennapi szókincsnek” – magyarázza H. Andrew Schwartz, a kutatás vezetője. „Ez azt jelenti, hogy rengeteg embertől kell nyelvi adatot gyűjteni ahhoz, hogy valódi kapcsolatot lehessen találni a nyelvhasználat és a személyiségjegyek között.” A nyitott megközelítésben tehát nem előre megadott kategóriákkal („negatív érzelmek”) és szavakkal (szomorú) dolgoznak, hanem felhasználják azt a milliárdos nagyságrendű szókészletet, amely a közösségi oldalon használatos. Így alakul ki a nyelvhasználat elemzése alapján azon kifejezések nyitott listája, amelyek jellegzetesek egy-egy személyiségvonás esetén.

A hatalmas adatmennyiség tehát elengedhetetlen volt ahhoz, hogy az úgynevezett DLA-technikát (differential language analysis) alkalmazhassák. Ennek segítségével a tudósok azokat a szavakat szűrték ki, amelyek jellemzőnek tekinthetők egy-egy, az alanyok által kitöltött kérdőívben szereplő tulajdonság szempontjából – mint például az életkor, a nem, és az öt nagy személyiségjegyre A vizsgált öt nagy személyiségjegy a következő: extravertáltság, csapatjátékosság, lelkiismeretesség, neurocitás való hajlam és nyitottság. vonatkozó adatok. Utóbbit azért választották, mert ez a leginkább bevett módja a személyiség karakterizálásának, és más dimenziók (például a depresszió – boldogság) jellemzésére is használható.

Hogy eredményeiket vizualizálják, a kutatók úgynevezett szófelhőket hoztak létre: ezekről leolvasható, hogy statisztikailag mely szó használata jellemzi leginkább az adott tulajdonságot – legyen az életkor, nem vagy valamilyen személyiségjegy. A legnagyobb betűmérettel szereplő szó a leginkább jellemző, és ahogyan csökken a betűméret, úgy egyre kevésbé gyakori az egyes kifejezések előfordulása. Például az extravertált személyiségű emberek esetében az olyan szavak, mint a party (’buli’), great night (’nagyszerű este’) jellemzőek, míg az introvertáltaknál a japán médiára és az emotikonokra való hivatkozások karakterisztikusak.

Szófelhők
Szófelhők
(Forrás: University of Pennsylvania)

„Elég egyértelműnek tűnik, hogy egy nagyon extravertált személy rengeteget fog beszélni a bulizásról” – mondja Johannes Eichstaedt, a vizsgálatban részt vevő egyik kutató. „Ha azonban egymás mellett megnézzük ezeket a szófelhőket, és összehasonlítjuk őket, akkor valós rálátást nyerhetünk az adott személyiségjegyű emberekre. Sok minden ebből rég ismeretes, de tehetünk új felfedezéseket is.” Ha azt a kérdést tesszük fel, hogy „Milyen egy extravertált ember?”, vagy hogy „Milyen tizenéves lánynak lenni?”, esetleg, hogy „Milyen skizofrénnek lenni?”, vagy hogy „Milyen 70 évesnek lenni?”, ezek a szófelhők sokkal többet mondanak, mint a szokványos személyiségtesztek.

Jóslás...

Hogy teszteljék, hogy mennyire pontosan sikerült megragadniuk a személyiségjegyeket, a kutatók két csoportra osztották a részt vevő önkénteseket, és az egyik csoportnál kialakított statisztikai modellt alkalmazták a másikra, majd megnézték, mennyire fedik egymást az eredmények. Az önkéntesek háromnegyede esetében gépi tanulási eljárásokat alkalmaztak, hogy felépítsék a szavak és kifejezések modelljét, amely megjósolja a résztvevőknek a tesztben adott válaszait. Ezt a modellt használták fel a maradék egynegyed tulajdonságainak a jóslására – a Facebook-bejegyzéseik alapján.

„A modell 92 százalékos pontossággal tudta megjósolni az illető társadalmi nemét. Az életkort az esetek felében tudtunk 3 éves pontossággal megadni. A személyiségre vonatkozó jóslások persze jóval kevésbé pontosak, de majdnem olyan eredményesek, mint egy személyiségteszt” – összegezte eredményeiket Schwartz. A nyitott modell tehát jobb predikciós erővel bír, mint a zárt.

Forrás

Facebook Data Used to Predict Users’ Age, Gender and Personality Traits

Kapcsolódó tartalmak:

Hasonló tartalmak:

Hozzászólások (24):

Követem a cikkhozzászólásokat (RSS)
Az összes hozzászólás megjelenítése
10 éve 2013. október 9. 18:57
24 GBR

@Grant kapitány: pontosan! Ezert is kerdeztem, hogy hogyan tudjak osszeegyeztetni, hogy egy jelenseget az egyik estben melysegesen erkolcstelennek, sot akar nacinak neveznek, majd mas esetben ugyanezen jelenseget, raadasul annak egy joval szelsosegesebb valfajat viszont kivanatosnak, sot elvartnak tartanak.

10 éve 2013. október 9. 18:46
23 Grant kapitány

@Sultanus Constantinus: az alábbiakat korábban egy nyest-en megjelent cikkben írta a szerző: (Külön érdekességként felhívnám a figyelmet az utolsó előtti mondatban a háromszoros tagadásra, ami valódi stilisztikai bravúr, és nyilván a mondanivaló értelmezését segíti elő!):

"Senkit nem zavar, hogy egy-egy szó többértelmű, ezért az sem, hogy egy újabb többértelmű szó keletkezik a nyelvben (persze, mint fent írtam, a meleg már nagyon régóta kétértelmű volt). Rengeteg többértelmű szó van, és észre sem vesszük őket, mert a kimondás környezete, a kontextus a legtöbb esetben egyértelművé teszi, hogy melyik használatról van szó. Ezért nem értek egyet azzal, hogy ne lehetne olyan mondatot mondani a meleg szóval, ami ne lenne félreérthető. (Mikor szoktunk emberek hőmérsékletéről beszélni, amikor nem a láz, hőmérséklet szavakat használjuk?)"

www.nyest.hu/hirek/miert-melegek-a-melegek

Pontosan ezért nem értem azokat, a süketeket, akiknek az érzékenységét sérti, ha süketeknek nevezik őket.

10 éve 2013. október 8. 21:03
22 Sultanus Constantinus

@LAttilaD: @GBR: Én is teljesen egyetértek, azt kell, hogy mondjam. Sosem értettem, mi értelme van ennek a mesterségesen kreált műnyelvnek a nem létező problémák megoldására. Mitől lenne sértő a "süket", és mitől nem a "siket", ha egyrészt, az utóbbit senki nem használja a beszédben, másrészt attól még ugyanúgy süket valaki, mert "siket"-nek hívjuk. Az, hogy egy kifejezés sértő-e vagy sem, csupán a szövegkörnyezettől függ, és pontosan ezért tök felesleges minden szót megváltoztatni.

10 éve 2013. október 8. 20:24
21 GBR

@LAttilaD: szorol szora egyetertek a levezetessel is es a kovetkeztetessel is! Pontosan ugyanezt irtam en is, de itt a linkben termeszetesen bovebben ki volt fejtve a jelenseg.

10 éve 2013. október 8. 19:44
20 LAttilaD

@Fejes László (nyest.hu): Bocs, de az „érintettek” mi vagyunk, valódi fogyatékosok, nem pedig a Sérültek.hu, ami eddig még emlékeim szerint nem sok hasznot hajtott a fogyitársadalomnak, és akkor finom voltam. A linkelted táblázatban propagált papírízű, íróasztal mellett született kifejezések rengeteg kárt okoztak és okoznak nekünk, de ez nem érdekel senkit, mindenki ujjong, hogy van ez a nyelv, megoldották a fogyatékosok problémáit. Persze nem a Sérültek.hu találta ki ezt a szótárat, a Deja Vu Alapítvány is sokat dolgozott rajta, meg még ki tudja, ki mindenkik. Eleven fogyatékost nem kérdeztek meg.

Én is tudok linkeket adni, tessék.

lattilad.org/f/?x=entry:entry060123-175938

lattilad.org/f/?x=entry:entry050806-165659

lattilad.org/f/?page=fogyitan4

10 éve 2013. október 8. 14:49
19 GBR

@Grant kapitány:"....... nyilván cenzúráznák az orvosi szaknyelvet is......"

Ez igy van, mar most nagyon eros az e tipusu cenzura, es evrol evre csak erosodik, tapasztalatbol mondom.

Egy trivialis pelda: a hiperaktivitas. Azert aki ismeri a hiperaktivitas klinikai tuneteit, egybol kell tudnia, hogy az elnevezes koszono viszonyban sincs a fogalommal, amit le kellene irnia.

Persze meg ezer es ezer peldat lehetne irni....

Tenyleg mar ott tartunk, hogy a szaknyelvnek se sabatosnak, kovetkezetesnek, ......, kell lennie, hanem PC-nek, vagyis ujbeszelnek.

10 éve 2013. október 8. 13:13
18 Grant kapitány

@Fejes László (nyest.hu): "azt illik tiszteletben tartani, amit egy kifejezésről azok gondolnak, akiket érint."

A fogyatékosok közül azok a gátlástalan alakok, akik rá akarják kényszeríteni a saját nyelvhasználatukat másokra, nyilván cenzúráznák az orvosi szaknyelvet is, hiszen a pszichiáterek számára fontos kifejezés az "elmebeteg", "elmebetegség".

www.informed.hu/betegsegek/betegsegek_reszletesen/psy/mental_illness

10 éve 2013. október 8. 13:01
17 Grant kapitány

@GBR: Egyetértek. Amit az "újbeszél"-t a többségre kényszeríteni akaró fogyatékosok tesznek, az valójában a nyelvművelés legcinikusabb, leggátlástalanabb válfaja.

10 éve 2013. október 8. 10:09
16 GBR

@GBR: elnezest kimaradt a 2. Helyesen:

Ezzel egyetertek. Ezert elfogadhatatlan ez az ujbeszel. Pl.: a listaban az szerepel, hogy az "egeszseges" szo serto, kerulendo, helyette az "ep" szot kell hasznalni. Azonkivul, hogy az "egeszseges" szo hasznalat logikailag is kifogastalan (hiszen pl. a szklerozis multiplex mi mas lenne, ha nem betegseg), ez meg csak nem is fontos, egyszeruen a magyarok igy mondjak, ezert magyarul igy van. Ez a semleges magyar szo.

Itt a nyesten is hanyszor olvashatjuk a nyelvvedo mozgalom sokszor jogos biralatat. Tobb szempontbol is, itt most csak az erkolcsi szalra ternek ki. Erkolcstelennek titulaljatok, mert pl. egy szohasznalat miatt muveletlennek kialt ki embereket.

Az ujbeszelt kenyszeritok pedig szinten csak egy szohasznalat miatt erkolcstelen, gonosz, kirekeszto embernek nyilvanitjak a hasznalot.

Abbol a szempontbol a ket jelenseg azonos, hogy mindket esetben az egyen csak a termeszetes nyelvvaltozatat beszeli, es emiatt megbelyegzik.

Ket korulmeny miatt a masodik eset azonban joval sulyosabb.

1. Azert az elso esetben a kovetkeztetes nem teljesen irracionalis, mert bar a korrelacio termeszetesen nem 1, de igen szignifikans statisztikai kulonbseg mutathato ki a muveltseg es a muvelt nyelvi norma hasznalata kozott.

Ugyanez a masodik esetben mar nem igaz, a korrelacio ott 0. Nyilvanvalo, hogy az ujbeszel nem hasznalatabol semmilyen kovetkeztetest nem lehet levonni a beszolo erkolcstelensegevel kapcsolatban.

Ha valaki az anyanyelvenek semleges stiluserteku szavait hasznalja, akkor az definicio szerint semleges.

Meg azt is megkockaztatom, hogy itt egy negativ korrelacio van. Akinek a lelkiismerete tiszta, nincs semmi oka ujbeszelt hasznalni. Szerintem azok, akik nem kirekesztoek a fogyatekosokkal kapcsolatban, azok teljes nyugalommal hasznaljak a magyar nyelvet ujbeszel helyett.

2. A "vad" sulyossaga is eltero: azert a muveletlenseg kisebb sulyu vad, mind az erkolcstelenseg, gonoszsag, kirekesztes, stb....

Ezekutan az erdekelne engem, hogy egyazon szemely hogy tudja osszeegyeztetni azt, hogy az elso esetben mukodik az erkolcsi erzeke, igy azt eliteli, mig a masodik estetben egy egyesz generacio nyelvhasznalatat megnyomorito, anyanyelvi kompetenciajat megingato, igy nyelvhasznalati bizonytalansagba, szorongasba taszito gyakorlat eseten nem, sot azt udvozlendonek tartja.

10 éve 2013. október 8. 10:06
15 GBR

@Fejes László (nyest.hu): "Magyarul az van, amit a magyarul beszélők mondanak."

Ezzel egyetertek. Ezert elfogadhatatlan ez az ujbeszel. Pl.: a listaban az szerepel, hogy az "egeszseges" szo serto, kerulendo, helyette az "ep" szot kell hasznalni. Azonkivul, hogy az "egeszseges" szo hasznalat logikailag is kifogastalan (hiszen pl. a szklerozis multiplex mi mas lenne, ha nem betegseg), ez meg csak nem is fontos, egyszeruen a magyarok igy mondjak, ezert magyarul igy van. Ez a semleges magyar szo.

Itt a nyesten is hanyszor olvashatjuk a nyelvvedo mozgalom sokszor jogos biralatat. Tobb szempontbol is, itt most csak az erkolcsi szalra ternek ki. Erkolcstelennek titulaljatok, mert pl. egy szohasznalat miatt muveletlennek kialt ki embereket.

Az ujbeszelt kenyszeritok pedig szinten csak egy szohasznalat miatt erkolcstelen, gonosz, kirekeszto embernek nyilvanitjak a hasznalot.

Abbol a szempontbol a ket jelenseg azonos, hogy mindket esetben az egyen csak a termeszetes nyelvvaltozatat beszeli, es emiatt megbelyegzik.

Ket korulmeny miatt a masodik eset azonban joval sulyosabb.

1. Azert az elso esetben a kovetkeztetes nem teljesen irracionalis, mert bar a korrelacio termeszetesen nem 1, de igen szignifikans statisztikai kulonbseg mutathato ki a muveltseg es a muvelt nyelvi norma hasznalata kozott.

Ugyanez a masodik esetben mar nem igaz, a korrelacio ott 0. Nyilvanvalo, hogy az ujbeszel nem hasznalatabol semmilyen kovetkeztetest nem lehet levonni a beszolo erkolcstelensegevel kapcsolatban.

Ha valaki az anyanyelvenek semleges stiluserteku szavait hasznalja, akkor az definicio szerint semleges.

Meg azt is megkockaztatom, hogy itt egy negativ korrelacio van. Akinek a lelkiismerete tiszta, nincs semmi oka ujbeszelt hasznalni. Szerintem azok, akik nem kirekesztoek a fogyatekosokkal kapcsolatban, azok teljes nyugalommal hasznaljak a magyar nyelvet ujbeszel helyett.

Ezekutan az erdekelne engem, hogy egyazon szemely hogy tudja osszeegyeztetni azt, hogy az elso esetben mukodik az erkolcsi erzeke, igy azt eliteli, mig a masodik estetben egy egyesz generacio nyelvhasznalatat megnyomorito, anyanyelvi kompetenciajat megingato, igy nyelvhasznalati bizonytalansagba, szorongasba taszito gyakorlat eseten nem, sot azt udvozlendonek tartja.

10 éve 2013. október 8. 09:24
14 GBR

@Grant kapitány: hat igen, ez az ujbeszel szornyu!

A listaban a "fogyatekkal elo" kifejezetten kerulendo!-kent van feltuntetve, es a "fogyatekos" es a "fogyatekossaggal elo" a javasolt alak. E kifejezesek kozott tenyleg akkora lenne a kulonbseg, hogy indokolja a kifejezetten kerulendo jelzot, mikozben az idiota, hulye, bolond jelzok csak kerulendoek. Raadasul itt epp a javasolt "fogyatekos" alak volt a magyar szo, majd azt kicsereltek a 90-es evekben a "ogyarekkal elo" ujbeszel alakra, majd kesobb epp ez lett az "erkolcstelen".

Ezenkivul osszemos ket teljesen eltero jelenseget.

Az egyik a magyar-ujbeszel nyelvcserere valo kenyszerites. Ez elfogadhatatlan. (Pl. fogyatekos helyett fogyatekkal elo, majd ezutan mar ez a "helytelen")

A masik a serto szavak kerulese. Ez termeszetesen elfogadhato, sot kivanatos, de ez felesleges. (Pl. az "ertelmi fogyatekos" a "hulye, idiota" helyett. Ez felesleges, mert az emlitett kifelyezesek magyarul sem tartoznak a semleges szohasznalathoz)

Aki nem akar serto kifejezest hasznalni, az magyarul is megteheti ezt, meg is tette eddig is. (A Specialis Olimpia helyett pl. ha valaki nem akar sertegetni, akkor ujbeszel-magyar szotar nelkul sem mondja, hogy Hulye, Idiota, Bolond, stb. Olimpia. Ha megis megteszi, az mar nem nyelvhasznalati, hanem etikai kerdes.)

Aki viszont sertegetni akar, az pedig ujbeszelul is megteheti, meg is teszi.

10 éve 2013. október 8. 09:13
13 Fejes László (nyest.hu)

@Grant kapitány: Mindenekelőtt: attól még, hogy valaki testileg sérült, értelmileg ép lehet.

Másrészt: nyelvészeti szempontból egyik alak sem hülyeség, viszont azt illik tiszteletben tartani, amit egy kifejezésről azok gondolnak, akiket érint. Egy egészen biztos: nincs olyan, hogy „magyarul ez van”. Magyarul az van, amit a magyarul beszélők mondanak. Ettől független kérdés az, hogy mit illik kerülni, emrt sértik egyesek érzékenységét.

10 éve 2013. október 8. 09:02
12 Grant kapitány

@Fejes László (nyest.hu): "Érdekes, az érintettek fordítva gondolják."

Attól, mert ők érintettek, és mert fordítva gondolják, még könnyen lehet hülyeség, amit gondolnak. Bocsánat, nem hülye-ség, hanem "értelmi akadályozottság", most látom, hogy a "hülye" PC megfelelője az "értelmileg akadályozott".

10 éve 2013. október 8. 08:15
11 Fejes László (nyest.hu)
10 éve 2013. október 8. 00:51
10 LAttilaD

A paralimpia alak kerülendő, a paraolimpia van magyarul. Centiétert se mondunk csak azért, mert csökkent értékű egyén mérte.