Jelentéseket a hálózatból?
Korábban már írtunk arról, hogy a szemantikus hálózatok jelenthetik az internetes keresés forradalmasítását. Most egy olyan kutatásról számolunk be, amelyben szemantikus hálózatok segítségével határozták meg többjelentésű szavak értelmezését egy adott szövegkörnyezetben.
Két brazil fizikus kifejlesztett egy új módszert, amelynek segítségével automatikusan értelmezhetők többjelentésű szavak egy adott szövegkörnyezetben – csupán a szavakhoz közeli nyelvi elemek kapcsolatai alapján. Az eljárás tehát a szövegkörnyezet alapján jósolja meg a jelentést, nem kell hozzá szemantika. A São Paulo-i egyetem két munkatársa Thiago Silva és Diego Amancio a The European Physical Journal B folyóiratban publikálják eredményeiket – számolt be a kutatásról a Science Daily.
A tudósok klasszikus irodalmi szövegekben modellezték a szavak kapcsolati hálózatait, és ebből a hálózatból tudták megjósolni a többjelentésű szavak értelmezését az adott szövegkörnyezetben. Mint ahogy korábban már írtuk, az úgynevezett szemantikus hálók nagy jelentőséggel bírnak a természetes nyelv gépi feldolgozásában, a gépi fordításban, az automatikus információkinyerésben, a gépi tartalomelemzésben stb.
A brazil fizikusok a kutatáshoz tíz többjelentésű angol szót választottak ki – olyan szavakat, mint amilyen a bear (’medve’; ’elvisel’), a jam (’beszorul, torlódik’, ’dugó’; ’dzsem’), a just (’éppen, csak’; ’igazságos’), a rock (’kő, szikla’; ’ringat’) vagy a present (’jelen’; ’prezentál, előad’). Majd ezeknek a szavaknak a kapcsolati hálóit ellenőrizték szépirodalmi szövegeken – például Jane Austen Büszkeség és balítélet című regényének szövegén. A hálózat csomópontja a szövegben előforduló szavak voltak, és minden csomópont azokkal a csomópontokkal állt kapcsolatban, amelyek a szövegben hozzájuk közel fordultak elő.
Ezek után az így kapott értelmezések eredményeit összehasonlították egy klasszikus szemantika-alapú jelentésvizsgálat eredményeivel. A kombinált jelentésmeghatározási technika alkalmazásával igen pontosan meg lehetett adni a szavak helyes értelmezését az adott kontextusban. A kutatásban használt módszer tehát alkalmas lehet a többjelentésű szavak jelentésének automatikus kinyerésére.
A kutatás tehát igen ígéretes; a kutatók a jövőben azt tervezik, hogy a hálózatban nemcsak az egymáshoz közeli szavak közötti kapcsolatokat fogják használni, hanem az egymástól távolabbi, de valamilyen kapcsolatban álló elemeket is. Egy másik készülő tanulmányukban a szerzők arra mutatnak rá, hogy a hagyományos komplex hálózatok nagysága jórészt a szintaxistól függ.
Forrás