Érzelemazonosítás beszédelemzés alapján
Egyre gyakoribbak az emberi érzelmek gépi azonosítását célzó kísérletek. Legutóbb a madridi műszaki egyetem informatika tanszékén fejlesztettek szomorúságot, örömet és zaklatott idegállapotot beszédelemzés alapján felismerő alkalmazást.
A program először a kommunikáció hanganyagát elemzi, majd azt követően tesz kísérletet a hanghordozásba, tónusba stb. rejtett emocionális állapot azonosítására, és tesz következtetést arra vonatkozóan, hogy a beszélő boldog, bánatos, vagy éppen ideges. Amennyiben egyik sem mutatható ki egyértelműen, százalékosan határozza meg a legvalószínűbbet.
Az alkalmazás a Prolog programozási nyelvbe implementált – 2008-as, tehát viszonylag új – Rfuzzy keretrendszeren alapul. Az 1972-ben fejlesztett első logikai programozási nyelv a francia Alain Colmerauer munkája, történetében a hazai mesterségesintelligencia-kutatás fontos alakja, Szeredi Péter is meghatározó szerepet töltött be, ő dolgozta ki a magyar interpretert.
Az elsősorban mesterséges intelligencia és szakértőrendszer-alkalmazásokban használt Prolog megadott logikai formuláról (célformula) képes eldönteni, logikai következménye-e formulák adott halmazának. Utóbbiak és a célformula a program bemenete; míg a kimenet a válasz, hogy következik-e a célformula a többi formulából.
Rfuzzy és az érzelmek
A Prolog képes jól reprezentálni az utóbbi két évtizedben egyre több területen (robotika, háztartási gépek irányítása stb.) alkalmazott fuzzy logikát (elmosódott halmazok logikája). A fuzzy rendszerek sajátossága, hogy ellentétben a bináris ellentétpárokat használó szokványos rendszerekkel, „igen” és „nem” („ki” és „be”, 1 és 0) értékek mellett köztes „valóságértékekkel” is dolgoznak: 0,5 (félig-meddig), 0,2 (kicsit), 0,8 (eléggé)…
A könnyen használható Rfuzzy komoly programozási támogatást jelent, nagyon jól reprezentál, kezel és következtet olyan szubjektív kategóriákból, fogalmakat, mint például „alacsony”, „magas”, „lassú”, „gyors” stb.
Logikai mechanizmusai flexibilisek, így a számítógép szélesebb értelmezési tartományban elemezhet. A gép a mérhető paramétereket (hangerő, hangszín, hangmagasság, beszédtempó stb.) referenciákként kezelő logikai szabálysorok alapján hoz döntéseket.
Rfuzzy-t beszélgetések közbeni érzelemazonosítás mellett a robotikában, gépfocisták programozásakor is használták már. Fejlesztői mindkét alkalmazással elégedettek.