Beszédtechnológiával az esélyegyenlőségért
A vakok és gyengénlátók akkor érezhetik magukat a társadalom teljes értékű tagjainak, ha nem szorulnak minden pillanatban mások segítségére. A mindennapi életben különböző számítástechnikai eszközök segítik őket – illetve segíthetnék, ha lenne, aki finanszírozná fejlesztésüket.
Már többször írtunk a nyelv- és beszédtechnológia olyan újításairól, amelyek mindennapi életünket segíthetik, vagy plusz szolgáltatásokat nyújthatnak. Cikkünkben olyan eszközökről lesz szó, melyek a nyelv- és beszédtechnológia fejlesztéseit alkalmazzák, és ezáltal megkönnyítik a vakok és gyengénlátók életét. Az interneten, az utcán, a mobiltelefonokon folyamatosan nagy mennyiségű információ zúdul ránk, amelyhez ők közvetlenül nem tudnak hozzájutni. A beszédszintézisre és -felismerésre alapuló technológiák a látható információt más közegre (tipikusan hallhatóra, ritkábban tapinthatóra) fordítják, ezáltal teszik elérhetővé az információt a vakok és gyengénlátók számára is.
(Forrás: Wikimedia commons)
A fogyatékkal élő polgártársaink életminőségének meghatározó eleme, hogy mennyire tudnak fogyaték nélküli társaikéhoz hasonló életet élni. A nyelv- és beszédtechnológia eszközrendszere a modern infokommunikációs technológiákkal kiegészítve számos esetben nyitja meg számukra az aktív tanulás és munka terét.
A felhasználás három alapvető formáját különböztethetjük meg:
- gyermekkori nevelés és oktatás segédeszközei,
- felnőttkori életvitel és munkavállalás segédeszközei,
- időskori életvitel segédeszközei.
Attól függően, hogy a fogyaték mikor keletkezett, egészen eltérő megközelítés szükséges. Például fiatal korban van esély a Braille-írás és összetettebb számítógépes segédeszközök alkalmazásának megtanulására. Az időskori – például cukorbetegség következtében kialakult – látásvesztés esetén, 70 éves kor felett kicsi az esélye annak, hogy a fiatalabbak számára kiválóan alkalmazható technológia egy az egyben felhasználható lesz. Ezért nagyon fontos a különböző csoportoknak megfelelő technológiai megoldások kidolgozása.
Már elkészült eszközök...
A beszédtechnológusok és civil kezdeményezésű szervezetek közös munkájának eredményeképpen az elmúlt években több olyan eszköz is készült, amely a vakok és gyengénlátók számára könnyíti meg a számítógép használatát. Alapvető fontosságúak a képernyőnagyító és -olvasó szoftverek, melyek közül a JAWS for Windows a legelterjedtebb. Ezt az amerikai Freedom Scientific fejlesztette ki, magyarra pedig az "Informatika a látássérültekért" Alapítvány honosította. Ez az alkalmazás magyar nyelven olvassa fel a képernyőn megjelenő üzeneteket és a begépelt szöveget. A JAWS magyar hangja nem Juhász Jácint, hanem a BME Távközlési és Médiainformatikai Tanszékén (TMIT) fejlesztett Profivox beszédszintetizátor.
(Forrás: Wikimedia commons)
A Profivox tekinthető az első olyan magyar nyelvű beszédelőállító programnak, amely teljesíti a korszerű beszédszintetizátoroktól elvárható alapkövetelményeket: tiszta, érthető, emberi hangszínhez közeli hangot állít elő. Ezen a beszédszintetizátoron alapul még egy sor további szolgáltatás, amelyek szintén megkönnyíthetik a vakok életét:
- Az SMSmondó elnevezésű szolgáltatás automatikusan kezeli a beérkező SMS-eket és a telefon címtárát, valamint alkalmazkodik a felhasználó által kiválasztott üzemmódhoz. A telefonra telepített szoftver egy átlagos 60-80 karakteres SMS-t mindössze 3-4 másodperc alatt alakít beszéddé, és a fogadott üzenet felolvasása során megadható, hogy milyen adatokat hányszor, milyen sebességgel vagy hangerővel szeretne a felhasználó hallani. Az SMSmondó segítheti a vakok és gyengénlátók életét, de (természetesen látók esetében) a biztonságos autóvezetést is.
- Automatikus e-mailfelolvasó női hanggal. Alkalmazza a T-Mobile a Mailmondó szolgáltatásában.
- Braille jegyzetelő célkészülék szövegfelolvasóval kisméretű, hordozható kivitelben vakok és gyengénlátók számára.
- Beszélő bankjegykiadó automata.
- A VilágHalló online felolvasó rendszer segítségével az elektronikus könyvek az interneten vizuális információk nélkül, csak hangok segítségével, a látókkal közel egyenértékű módon használhatók. A könyv szövegét egy központi hangszerverbe épített beszédgeneráló szoftver segítségével mesterséges beszéddé alakítja, és a hangfolyamot a szöveggel szinkronban juttatja el a felhasználók számítógépeire.
SMSMondó. Érthető módon nem a látványos felhasználói felület áll a fejlesztés középpontjában.
(Forrás: mitsystems.hu)
...és ami még nincs
Általánosságban elmondható, hogy a különböző felolvasó szoftverek nagy része a már meglévő technológia adaptációjával viszonylag egyszerűen előállítható, ám a fogyatékkal élők életét nagyban segíti. A magyarországi beszédtechnológia jelenlegi fejlettségi szintjén egy sor további eszköz lenne kifejleszthető, amennyiben ezeket támogatná az ipar vagy az állam. Nagy szükség lenne például helymeghatározási és útvonal-tanácsadási szolgáltatást nyújtó mobiltelefonos alkalmazásra, akár részletes térinformatikai adatbázissal és integrált menetrendi információkkal, amely a helyi és távolsági közlekedésben segítené a vakokat. Egy ilyen GPS-alapú készülék jelezné, hogy hol van a felhasználó, és merre kell mennie mondjuk egy olyan középületben, ahol azelőtt még nem járt. A Fogyatékos Személyek Esélyegyenlőségéért Közalapítvány kidolgozott egy komplex akadálymentesítési segédletet, amely a Nemzeti Fejlesztési Ügynökség akadálymentesítési célú pályázataiban kötelezően alkalmazandó melléklet lett. Ebben a teljes körű akadálymentesség elérése érdekében a kapukon és a bejáratokon történő közlekedés mellett ugyanolyan hangsúllyal veszik figyelembe, hogy az épületen belüli szolgáltatásokhoz mindenki egyenlő esélyekkel férhessen hozzá. Ennek jegyében több középületről készült ún. hangostérkép, azonban nagy hibája, hogy nem lehet vezérelni, vagyis végig kell hallgatni az egész épület leírását, ami elég idegesítő lehet, ha valakinek mondjuk a tizedik emeleten van dolga. Ezt a statikus alkalmazást fel lehetne váltani olyan dinamikus rendszerrel, amely beszédfelismerést és -szintézist használ, amely könnyen frissíthető és a változó információtartalomhoz szabható.
A BME TMIT és az Informatika a látássérültekért Alapítvány közös ötlete az úgynevezett Olvasó Telefon, amely egyelőre megvalósításra vár. Ez egy mobiltelefonon futó optikai karakterfelismerő (OCR) alkalmazás, amely a lefotózott kép alapján szöveges állományt készít, majd a szövegfelolvasó segítségével felolvassa azt. Előnye, hogy használatához nincs szükség se bonyolultabb számítástechnikai eszközre, se internetkapcsolatra -- a felhasználó csak készít egy képet a mobiljával, és már hallgathatja is, hogy milyen feliratot lát (illetve nem lát) maga előtt.
Források