0:05
Főoldal | Rénhírek
Hang vezet világtalant

Beszédtechnológiával az esélyegyenlőségért

A vakok és gyengénlátók akkor érezhetik magukat a társadalom teljes értékű tagjainak, ha nem szorulnak minden pillanatban mások segítségére. A mindennapi életben különböző számítástechnikai eszközök segítik őket – illetve segíthetnék, ha lenne, aki finanszírozná fejlesztésüket.

Simon Eszter | 2010. október 4.

Már többször írtunk a nyelv- és beszédtechnológia olyan újításairól, amelyek mindennapi életünket segíthetik, vagy plusz szolgáltatásokat nyújthatnak. Cikkünkben olyan eszközökről lesz szó, melyek a nyelv- és beszédtechnológia fejlesztéseit alkalmazzák, és ezáltal megkönnyítik a vakok és gyengénlátók életét. Az interneten, az utcán, a mobiltelefonokon folyamatosan nagy mennyiségű információ zúdul ránk, amelyhez ők közvetlenül nem tudnak hozzájutni. A beszédszintézisre és -felismerésre alapuló technológiák a látható információt más közegre (tipikusan hallhatóra, ritkábban tapinthatóra) fordítják, ezáltal teszik elérhetővé az információt a vakok és gyengénlátók számára is.

Egy korai segédeszköz: Mauler gépe Braille-íráshoz
Egy korai segédeszköz: Mauler gépe Braille-íráshoz
(Forrás: Wikimedia commons)

A fogyatékkal élő polgártársaink életminőségének meghatározó eleme, hogy mennyire tudnak fogyaték nélküli társaikéhoz hasonló életet élni. A nyelv- és beszédtechnológia eszközrendszere a modern infokommunikációs technológiákkal kiegészítve számos esetben nyitja meg számukra az aktív tanulás és munka terét.

A  felhasználás három alapvető formáját különböztethetjük meg:

Attól függően, hogy a fogyaték mikor keletkezett, egészen eltérő megközelítés szükséges. Például fiatal korban van esély a Braille-írás és összetettebb számítógépes segédeszközök alkalmazásának megtanulására. Az időskori – például cukorbetegség következtében kialakult – látásvesztés esetén, 70 éves kor felett kicsi az esélye annak, hogy a fiatalabbak számára kiválóan alkalmazható technológia egy az egyben felhasználható lesz. Ezért nagyon fontos a különböző csoportoknak megfelelő technológiai megoldások kidolgozása.

Már elkészült eszközök...

A beszédtechnológusok és civil kezdeményezésű szervezetek közös munkájának eredményeképpen az elmúlt években több olyan eszköz is készült, amely a vakok és gyengénlátók számára könnyíti meg a számítógép használatát. Alapvető fontosságúak a képernyőnagyító és -olvasó szoftverek, melyek közül a JAWS for Windows a legelterjedtebb. Ezt az amerikai Freedom Scientific fejlesztette ki, magyarra pedig az "Informatika a látássérültekért" Alapítvány honosította. Ez az alkalmazás magyar nyelven olvassa fel a képernyőn megjelenő üzeneteket és a begépelt szöveget. A JAWS magyar hangja nem Juhász Jácint, hanem a BME Távközlési és Médiainformatikai Tanszékén (TMIT) fejlesztett Profivox beszédszintetizátor.

Egy eszköz a hetvenes évekből: magnó szabályozható lejátszási sebességgel
Egy eszköz a hetvenes évekből: magnó szabályozható lejátszási sebességgel
(Forrás: Wikimedia commons)

A Profivox tekinthető az első olyan magyar nyelvű beszédelőállító programnak, amely teljesíti a korszerű beszédszintetizátoroktól elvárható alapkövetelményeket: tiszta, érthető, emberi hangszínhez közeli hangot állít elő. Ezen a beszédszintetizátoron alapul még egy sor további szolgáltatás, amelyek szintén megkönnyíthetik a vakok életét:

...és ami még nincs

Általánosságban elmondható, hogy a különböző felolvasó szoftverek nagy része a már meglévő technológia adaptációjával viszonylag egyszerűen előállítható, ám a fogyatékkal élők életét nagyban segíti. A magyarországi beszédtechnológia jelenlegi fejlettségi szintjén egy sor további eszköz lenne kifejleszthető, amennyiben ezeket támogatná az ipar vagy az állam. Nagy szükség lenne például helymeghatározási és útvonal-tanácsadási szolgáltatást nyújtó mobiltelefonos alkalmazásra, akár részletes térinformatikai adatbázissal és integrált menetrendi információkkal, amely a helyi és távolsági közlekedésben segítené a vakokat. Egy ilyen GPS-alapú készülék jelezné, hogy hol van a felhasználó, és merre kell mennie mondjuk egy olyan középületben, ahol azelőtt még nem járt. A Fogyatékos Személyek Esélyegyenlőségéért Közalapítvány kidolgozott egy komplex akadálymentesítési segédletet, amely a Nemzeti Fejlesztési Ügynökség akadálymentesítési célú pályázataiban kötelezően alkalmazandó melléklet lett. Ebben a teljes körű akadálymentesség elérése érdekében a kapukon és a bejáratokon történő közlekedés mellett ugyanolyan hangsúllyal veszik figyelembe, hogy az épületen belüli szolgáltatásokhoz mindenki egyenlő esélyekkel férhessen hozzá. Ennek jegyében több középületről készült ún. hangostérkép, azonban nagy hibája, hogy nem lehet vezérelni, vagyis végig kell hallgatni az egész épület leírását, ami elég idegesítő lehet, ha valakinek mondjuk a tizedik emeleten van dolga. Ezt a statikus alkalmazást fel lehetne váltani olyan dinamikus rendszerrel, amely beszédfelismerést és -szintézist használ, amely könnyen frissíthető és a változó információtartalomhoz szabható.

A BME TMIT és az Informatika a látássérültekért Alapítvány közös ötlete az úgynevezett Olvasó Telefon, amely egyelőre megvalósításra vár. Ez egy mobiltelefonon futó optikai karakterfelismerő (OCR) alkalmazás, amely a lefotózott kép alapján szöveges állományt készít, majd a szövegfelolvasó segítségével felolvassa azt. Előnye, hogy használatához nincs szükség se bonyolultabb számítástechnikai eszközre, se internetkapcsolatra -- a felhasználó csak készít egy képet a mobiljával, és már hallgathatja is, hogy milyen feliratot lát (illetve nem lát) maga előtt.

Források

BME TMIT Speechlab

"Informatika a látássérültekért" Alapítvány

VilágHalló

BioDigit Kft.

Fogyatékos Személyek Esélyegyenlőségéért Közalapítvány

Kapcsolódó tartalmak:

Hasonló tartalmak:

Hozzászólások:

Követem a cikkhozzászólásokat (RSS)
Még nincs hozzászólás, legyen Ön az első!