A magyar nyelv- és beszédtechnológia fejlődéséről
Az embert értő, beszélő számítógép lassan valósággá válik, egyre kevésbé tűnik sci-finek.
A 21. századi társadalmi és életmódváltozásokat emblematikusan megjelenítő cégek, termékek és szolgáltatások a web fellegvárai. A passzív honlapokat váltó szemantikus webben kikristályosodó jövőjük elképzelhetetlen nyelv- és beszédtechnológia nélkül.
Kevésbé látványos, de annál fontosabb, megkerülhetetlen háttér- és gyűjtőtechnológiák. Nincs körülöttük akkora felhajtás, mint a robotika, sakkprogramok vagy közösségi hálózatok körül, holott a mindennapos információfeldolgozás, kommunikáció, a világ eseményeinek naprakész nyomonkövetése elképzelhetetlen nélkülük.
Az embert értő, beszélő számítógép lassan valósággá válik, egyre kevésbé tűnik sci-finek. Az automatikus nyelvfeldolgozás eszközeivel az adat- és szövegfolyamokban rejtőző információ mind többféle módon található meg, kereshető vissza, szervezhető jól működő adat- és tudásbázisokba; változatos modalitásban (írás, beszéd stb.) és gépi fordítás segítségével tetszés szerinti nyelven adható vissza a felhasználónak. Hatalmas spontánbeszéd-adatbázisok alakíthatók ki, nagymennyiségű honlap szöveges, képi és egyéb alakú adatai dolgozhatók fel (webbányászat), szövegtartalom szerint keresgélhetünk nemzeti hang-, film- és multimédiaarchívumokban, szoftver írja át a rossz kiejtést, hangutasítással működő gépek segítik a fogyatékkal élőket…
A hazai szektor vezető kutatóműhelyeit és ipari partnereit tömörítő, két éve alakult Nyelv- és Beszédtechnológiai Platform Nyelv-ész-gép – új technológiák az információs társadalomban címmel múlt héten tartotta zárókonferenciáját. Két év alatt megfogalmazták a magyar nyelv- és beszédtechnológia fejlődésének lehetséges irányait, feltárták a nemzetközi kitörési lehetőségeket, és meghatározták a kivitelezésükhöz szükséges részfeladatokat. A résztvevők öt előadás mellett interaktív demókon, posztereken keresztül ismerhették meg a Platform működésének eredményeit, az alkalmazási területeket, a hazai szakműhelyek uniós projektekben betöltött szerepét.
Váradi Tamás, a Platform elnöke eredményeiket, Simon Eszter a nyelv- és beszédtechnológia jelenlegi hazai helyzetéből kiinduló jövőképen alapuló kiemelt prioritásokat, stratégiai célokat, főbb kutatási irányokat ismertette.
A stratégiai célok hét csoportba sorolhatók: nemzeti kutatási infrastruktúra kialakítása és szolgáltatása; a nyelvi információ kezelése, tárolása és feldolgozása; a nyelvi kulturális örökség digitális korba való átmentése; természetes ember-gép kommunikáció; környezet-intelligenciával segített élet; többnyelvűség, nyelvi korlátok leküzdése; kutatásszervezés. Ezeken belül a 67 oldalas „Megvalósítási terv 18 kutatási irányt és 34 konkrét projekttervet fogalmaz meg a 2011-től 2020-ig tartó időtartamra – összesen 3105 millió forint értékben.”
Előbb Tihanyi László (MorphoLogic), majd Lendvai Piroska ismertetett egy-egy uniós projektet: az online gépi fordítás terén konkrét prototípust megcélzó, idén indult iTranslate4-et és a 2011-ben kezdődő, Magyarországot az európai nyelvtechnológiai infrastruktúra élvonalához csatlakoztató CESAR-t egyaránt az MTA Nyelvtudományi Intézete koordinálja. Utánuk Németh Géza – múlt, jelen és jövőbeli példákkal, folyamatban lévő kutatás-fejlesztésekkel szemléltetve – gyakorlati alkalmazásokat mutatott be, többek között azt bizonyítva, hogy a nyelv- és beszédtechnológia hátrányos helyzetű csoportok életminőségének javításában is kiemelkedő szerepet játszhat.
A Platform kétéves tevékenysége ugyan lezárult, de ez a zárás a sikeres folytatás ígérete, és nem befejezés.