Figyeljük a közösségi médiát!
Hogyan jelenik meg a közösségi médiában egy márka? Vannak-e regionális különbségek az USA különböző részein csevegő Twitter-felhasználók posztjai között? Lehetséges-e pusztán valakinek a nyelvi megnyilatkozásai alapján megállapítani a demográfiai jellemzőit?
A kérdésekre a válaszat a decemberi NLP meetupon tudhatják meg az érdeklődők. December 13-án angol nyelvű előadásokkal várjuk az érdeklődőket, előadóink a BlackSwan és az ELTE Komplex Rendszerek Fizikája Tanszékének kutatói. A rendezvény ingyenes, de a részvétel előzetes regisztrációhoz kötött az esemény oldalán.
A BlackSwan cég 2011-ben alakult, ma már több országban (UK, Magyarország, Kanada, Egyesült Államok, Szingapúr, Dél-Afrika) jelen van analitikai megoldásaival. Fő profiljába a nyilvános és ügyféladatok feldolgozása és erre épülő egyedi analitikai megoldások tartoznak. Markus Frise (Head of Data Science) előadása nyitja a meetupot, melyből megtudhatjuk, a BlackSwan hogyan segíti ügyfeleit a közösségi média szöveges tartalmainak elemzésében. Farkas Richárd (BlackSwan, Lead Data Scientist, adjunktus, Szegedi Tudományegyetem) két esettanulmányon keresztül mutatja be a közösségi médiában előforduló szövegek elemzésének lehetőségeit.
Vattay Gábor és Bokányi Eszter(ELTE Komplex Rendszerek Fizikája Tanszék) előadásukban bemutatják, hogy a szöveges adatokat hogyan lehet szerzőik demográfiai jellemzőinek feltérképezésére felhasználni. Az arXiv-en elérhető tanulmányukban a szerzők az Egyesült Államok területén keletkezett tweeteket elemezve megállapították, hogy a fizikai távolsággal együtt nőnek a nyelvhasználati különbségek. A demográfiai különbségek is megmutatkoztak az adatokban, pl. a bibliaövezetbe (kb. a déli tagállamokban) jellemzőbbek a vallással kapcsolatos szavak.