Hogy is állunk a beszédfelismeréssel?
A beszédfelismerés hasznát leginkább az orvosi szakmák látják, mivel a diagnózisok és terápiák diktálása gyakori és gépies folyamat. Az áttörés azonban várat magára, szakértők szerint még mindig gyerekcipőben járunk.
A beszédfelismerés technológiája még mindig nem találta meg a saját hangját – ezzel a címmel jelent meg cikk a Reutersen. A technológia egyik legnagyobb haszonélvezői az orvosi szakmák. Az orvosi diagnózisok, terápiák és gyógyszerek felírása sokkal gördülékenyebb lehetne automatikus beszédfelismeréssel.
Míg a beszédfelismerő programok lassan beszivárognak a mobiltelefonokba, lejátszókba és navigációs eszközökbe, a nagy kérdés mégis az, hogy az – elemzők szerint még mindig gyerekcipőben járó – technológia készen áll-e a tömegpiaci bevezetésre.
„A beszédfelismerés rengeteg negatív kritikát kapott az utóbbi időkben az felhasználók részéről – mondta Daniel Ives, az FBR Capital Markets elemzője. – Gyakorlatilag még mindig a kezdeteknél járunk.”
A legfontosabb jelenlegi platformok, amelyeken ilyen funkció elérhető, az Amazon Kindle 2 nevű e-book olvasója, amelyen a Nuance Communications programja fut, valamint az Apple iPhone 3GS modellje. E két szereplő lefedi a relatív kicsi piac 65-70 százalékát.
A Microsoft a TellMe 2007-es felvásárlásával a piac nagyvállalati szegmensébe lépett be, és jelen van már a Google, az IBM, valamint a MedQuist is.
A beszédfelismerés sokáig csak a sci-fik világába tartozott, néhány éve létezik csak mobilokban, könyvolvasókban és az autókban. Többnyire Google kulcsszavakat, megjegyzéseket, e-mailt és sms-t lehet diktálni.
A mobilfelhasználók a billentyűzetet már lecserélték az érintőképernyőre, elemzők szerint a hangvezérlés viszont még egészen biztosan várat magára. A szélesebb körű elterjedéshez még sokkal nagyobb precizitásra volna szükség a kimondott szövegek felismerésében. Ebben azonban nagy gátat jelent a háttérzaj, különösen az emberi (ami ráadásul a gyakoribb). Ennek a hatékony szűrése még nem megoldott.
Steve Cramoysan, a Gartner piackutató egyik elemzője szerint egyre több okostelefonban fog megjelenni a beszédfelismerés, de hogy mennyien használják azokat, az más kérdés.
A Nuance bevételének jelenleg 15%-a jön a mobil eszközökből. Reményeik szerint azonban az idő haladtával ez az arány a bevételek harmadáig fog emelkedni.
A beszédfelismerés technológiájának penetrációja jelenleg azonban még az USA egészségbiztosítási piacán is csekély, így jelentős növekedési potenciál van benne. Az orvosi iratok átírásával foglalkozó cégek már most is gépi beszédfelismeréssel dolgoznak.