0:05
Főoldal | Rénhírek

Jelentéseket a hálózatból?

Korábban már írtunk arról, hogy a szemantikus hálózatok jelenthetik az internetes keresés forradalmasítását. Most egy olyan kutatásról számolunk be, amelyben szemantikus hálózatok segítségével határozták meg többjelentésű szavak értelmezését egy adott szövegkörnyezetben.

nyest.hu | 2013. július 8.

Két brazil fizikus kifejlesztett egy új módszert, amelynek segítségével automatikusan értelmezhetők többjelentésű szavak egy adott szövegkörnyezetben – csupán a szavakhoz közeli nyelvi elemek kapcsolatai alapján. Az eljárás tehát a szövegkörnyezet alapján jósolja meg a jelentést, nem kell hozzá szemantika. A São Paulo-i egyetem két munkatársa Thiago Silva és Diego Amancio a The European Physical Journal B folyóiratban publikálják eredményeiket – számolt be a kutatásról a Science Daily.

A tudósok klasszikus irodalmi szövegekben modellezték a szavak kapcsolati hálózatait, és ebből a hálózatból tudták megjósolni a többjelentésű szavak értelmezését az adott szövegkörnyezetben. Mint ahogy korábban már írtuk, az úgynevezett szemantikus hálók nagy jelentőséggel bírnak a természetes nyelv gépi feldolgozásában, a gépi fordításban, az automatikus információkinyerésben, a gépi tartalomelemzésben stb.

A brazil fizikusok a kutatáshoz tíz többjelentésű angol szót választottak ki – olyan szavakat, mint amilyen a bear (’medve’; ’elvisel’), a jam (’beszorul, torlódik’, ’dugó’; ’dzsem’), a just (’éppen, csak’; ’igazságos’), a rock (’kő, szikla’; ’ringat’) vagy a present (’jelen’; ’prezentál, előad’). Majd ezeknek a szavaknak a kapcsolati hálóit ellenőrizték szépirodalmi szövegeken – például Jane Austen Büszkeség és balítélet című regényének szövegén. A hálózat csomópontja a szövegben előforduló szavak voltak, és minden csomópont azokkal a csomópontokkal állt kapcsolatban, amelyek a szövegben hozzájuk közel fordultak elő.

Pókháló eső után
Pókháló eső után
(Forrás: Wikimedia Commons)

Ezek után az így kapott értelmezések eredményeit összehasonlították egy klasszikus szemantika-alapú jelentésvizsgálat eredményeivel. A kombinált jelentésmeghatározási technika alkalmazásával igen pontosan meg lehetett adni a szavak helyes értelmezését az adott kontextusban. A kutatásban használt módszer tehát alkalmas lehet a többjelentésű szavak jelentésének automatikus kinyerésére.

A kutatás tehát igen ígéretes; a kutatók a jövőben azt tervezik, hogy a hálózatban nemcsak az egymáshoz közeli szavak közötti kapcsolatokat fogják használni, hanem az egymástól távolabbi, de valamilyen kapcsolatban álló elemeket is. Egy másik készülő tanulmányukban a szerzők arra mutatnak rá, hogy a hagyományos komplex hálózatok nagysága jórészt a szintaxistól függ.

Forrás

Semantics On the Basis of Words' Connectivity

Kapcsolódó tartalmak:

Hasonló tartalmak:

Hozzászólások:

Követem a cikkhozzászólásokat (RSS)
Még nincs hozzászólás, legyen Ön az első!