Érzelemazonosítás beszédelemzés alapján

2010.11.18. 06:00 ferenck

Egyre gyakoribbak az emberi érzelmek gépi azonosítását célzó kísérletek. Legutóbb a madridi műszaki egyetem informatika tanszékén fejlesztettek szomorúságot, örömet és zaklatott idegállapotot beszédelemzés alapján felismerő alkalmazást.

Régi nyelv, új megközelítés

A program először a kommunikáció hanganyagát elemzi, majd azt követően tesz kísérletet a hanghordozásba, tónusba stb. rejtett emocionális állapot azonosítására, és tesz következtetést arra vonatkozóan, hogy a beszélő boldog, bánatos, vagy éppen ideges. Amennyiben egyik sem mutatható ki egyértelműen, százalékosan határozza meg a legvalószínűbbet.

Az alkalmazás a Prolog programozási nyelvbe implementált – 2008-as, tehát viszonylag új – Rfuzzy keretrendszeren alapul. Az 1972-ben fejlesztett első logikai programozási nyelv a francia Alain Colmerauer munkája, történetében a hazai mesterségesintelligencia-kutatás fontos alakja, Szeredi Péter is meghatározó szerepet töltött be, ő dolgozta ki a magyar interpretert.

Az elsősorban mesterséges intelligencia és szakértőrendszer-alkalmazásokban használt Prolog megadott logikai formuláról (célformula) képes eldönteni, logikai következménye-e formulák adott halmazának. Utóbbiak és a célformula a program bemenete; míg a kimenet a válasz, hogy következik-e a célformula a többi formulából.

Rfuzzy és az érzelmek

A Prolog képes jól reprezentálni az utóbbi két évtizedben egyre több területen (robotika, háztartási gépek irányítása stb.) alkalmazott fuzzy logikát (elmosódott halmazok logikája). A fuzzy rendszerek sajátossága, hogy ellentétben a bináris ellentétpárokat használó szokványos rendszerekkel, „igen” és „nem” („ki” és „be”, 1 és 0) értékek mellett köztes „valóságértékekkel” is dolgoznak: 0,5 (félig-meddig), 0,2 (kicsit), 0,8 (eléggé)…

A könnyen használható Rfuzzy komoly programozási támogatást jelent, nagyon jól reprezentál, kezel és következtet olyan szubjektív kategóriákból, fogalmakat, mint például „alacsony”, „magas”, „lassú”, „gyors” stb.

Logikai mechanizmusai flexibilisek, így a számítógép szélesebb értelmezési tartományban elemezhet. A gép a mérhető paramétereket (hangerő, hangszín, hangmagasság, beszédtempó stb.) referenciákként kezelő logikai szabálysorok alapján hoz döntéseket.

Rfuzzy-t beszélgetések közbeni érzelemazonosítás mellett a robotikában, gépfocisták programozásakor is használták már. Fejlesztői mindkét alkalmazással elégedettek.

Szólj hozzá!

Címkék: mesterséges intelligencia fuzzy érzelmi számítások beszéd és nyelvtechnológia

A bejegyzés trackback címe:

https://agens.blog.hu/api/trackback/id/tr462455519

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása