0:05
Főoldal | Rénhírek

Adatbányászok fejtik meg Shakespeare stílusát

Bárki, aki szavakkal dolgozik, legyen az író vagy újságíró, megmondhatja, hogy helyes, találó szó vagy kifejezés megtalálása sokszor nehéz és fájdalmas munka. Jó hírünk van: a szóválasztásunk viszont árulkodik a stilisztikai érzékünkről.

nyest.hu | 2013. szeptember 3.

Egy új adatbányászati kutatás eredménye szerint a különböző írói stílusok felismerhetők és azonosíthatók a szóválasztás és a szógyakoriság alapján. Még az olyan hétköznapi szavak is, mint amilyen a te vagy a mond, segíthetnek megkülönböztetni egymástól az írókat. A kutatók ezúttal nem kisebb író stílusát vizsgálták, mint William Shakespeare-ét – számol be a PLOS One online tudományos folyóiratban megjelent kutatásról egy PLOS-blogger.


A kutatók 168 16-17. századi drámát dolgoztak föl. A duplikációk kiszűrése után 55055 egyedi szót azonosítottak a korpuszban. Ezeket a szavakat összeindexelték a korszak megfelelő szerzőjével és művével: William Shakespeare, Ben Jonson, Thomas Middleton és John Fletcher szövegei szerepeltek a korpuszban. Ezután a kutatók megvizsgálták, hogy melyik szerző milyen gyakorisággal használta ezeket a szavakat, majd a szavakat gyakoriságuk szerint sorba rendezték. Azt találták, hogy a leggyakrabban és a legritkábban használt szavak húszas listája pontosan jellemezte az egyes írók stílusát.

John Faed: Shakespeare és kortársai (1851)
John Faed: Shakespeare és kortársai (1851)
(Forrás: Wikimedia Commons)

Fletcher például nagyon gyakran használta a ye (you; ’te, ti, téged, titeket’) szót, tehát a ye relatíve nagy gyakoriságából arra következtethetünk, hogy a szöveget Fletcher írta. Middleton például a that (’az’) mutatónévmást használta igen gyakran, Jonson pedig az or (’vagy’) kötőszót. Maga Shakespeare a thou (’te’) szót használta leggyakrabban, a legritkábban pedig az all-t (’minden’).

Az egyes írókra jellemző szógyakoriság kimutatása mellett azt is megvizsgálták, hogy az íróknak mely műveikben változott meg szignifikánsan az írói stílusuk. Azt találták például, hogy Middleton egy politikai szatírájában egészen másként írt, mint többi művében.

Ezen kívül az írókat egymással is összevetették szóhasználat és -gyakoriság szempontjából. Ebből az derült ki, hogy Shakespeare írói stílusa – a kortársaiéval összevetve – sokkal inkább jellemezhető azzal, hogy mely szavakat használja nagyon ritkán, mint azzal, hogy melyeket használja nagyon gyakran. A ye szót például, amelyet Fletcher igen gyakran alkalmazott, Shakespeare szinte soha: a ye Shakespeare egyik legritkábban használt szava.

Ezzel a módszerrel – érvelnek a kutatók – meg lehet határozni a vitatott szerzőségű művek íróit. Ugyanakkor ugyanez a matematikai módszer használható különböző orvostudományi kutatásokban is.

Forrás

A Way with Words: Data Mining Uncloaks Authors’ Stylistic Flair

Kapcsolódó tartalmak:

Hasonló tartalmak:

Hozzászólások:

Követem a cikkhozzászólásokat (RSS)
Még nincs hozzászólás, legyen Ön az első!