0:05
Főoldal | Rénhírek

Érzelemazonosítás beszédelemzés alapján

Egyre gyakoribbak az emberi érzelmek gépi azonosítását célzó kísérletek. Legutóbb a madridi műszaki egyetem informatika tanszékén fejlesztettek szomorúságot, örömet és zaklatott idegállapotot beszédelemzés alapján felismerő alkalmazást.

Ágens blog, ferenck | 2010. november 22.

A program először a kommunikáció hanganyagát elemzi, majd azt követően tesz kísérletet a hanghordozásba, tónusba stb. rejtett emocionális állapot azonosítására, és tesz következtetést arra vonatkozóan, hogy a beszélő boldog, bánatos, vagy éppen ideges. Amennyiben egyik sem mutatható ki egyértelműen, százalékosan határozza meg a legvalószínűbbet.

Az alkalmazás a Prolog programozási nyelvbe implementált – 2008-as, tehát viszonylag új – Rfuzzy keretrendszeren alapul. Az 1972-ben fejlesztett első logikai programozási nyelv a francia Alain Colmerauer munkája, történetében a hazai mesterségesintelligencia-kutatás fontos alakja, Szeredi Péter is meghatározó szerepet töltött be, ő dolgozta ki a magyar interpretert.

Az elsősorban mesterséges intelligencia és szakértőrendszer-alkalmazásokban használt Prolog megadott logikai formuláról (célformula) képes eldönteni, logikai következménye-e formulák adott halmazának. Utóbbiak és a célformula a program bemenete; míg a kimenet a válasz, hogy következik-e a célformula a többi formulából.

Rfuzzy és az érzelmek

A Prolog képes jól reprezentálni az utóbbi két évtizedben egyre több területen (robotika, háztartási gépek irányítása stb.) alkalmazott fuzzy logikát (elmosódott halmazok logikája). A fuzzy rendszerek sajátossága, hogy ellentétben a bináris ellentétpárokat használó szokványos rendszerekkel, „igen” és „nem” („ki” és „be”, 1 és 0) értékek mellett köztes „valóságértékekkel” is dolgoznak: 0,5 (félig-meddig), 0,2 (kicsit), 0,8 (eléggé)…

A könnyen használható Rfuzzy komoly programozási támogatást jelent, nagyon jól reprezentál, kezel és következtet olyan szubjektív kategóriákból, fogalmakat, mint például „alacsony”, „magas”, „lassú”, „gyors” stb.

Logikai mechanizmusai flexibilisek, így a számítógép szélesebb értelmezési tartományban elemezhet. A gép a mérhető paramétereket (hangerő, hangszín, hangmagasság, beszédtempó stb.) referenciákként kezelő logikai szabálysorok alapján hoz döntéseket.

Rfuzzy-t beszélgetések közbeni érzelemazonosítás mellett a robotikában, gépfocisták programozásakor is használták már. Fejlesztői mindkét alkalmazással elégedettek.

Hasonló tartalmak:

Hozzászólások:

Követem a cikkhozzászólásokat (RSS)
Még nincs hozzászólás, legyen Ön az első!