USA: katonai milliók automatikus fordításra
Az amerikai BNN Technologies 14 millió dollárt kapott az amerikai hadügyminisztériumtól többnyelvű automatikus szöveg- és beszédfeldolgozás kutatására.
Ha védelmi kutatásól, lehallgatási programokról van szó, megkerülhetetlenné válik a nyelvi, nyelvészeti kutatás. Modern nyelvészeti alkalmazások nélkül szinte teljesen elképzelhetetlen nagy mennyiségű információban fellelni a kritikus fontosságú információt – pláne, ha az több nyelven is felbukkanhat.
A Business Wire értesülése szerint a BNN Technologies amerikai kutató-fejlesztő cég 14 millió dollárt kapott az Egyesült Államok védelmi minisztériumának kutatási ügynökségétől, a DARPA-tól. A pénzből olyan technológiákat kell fejleszteni, amelyek 90 százalékos pontosságot érnek el több nyelvű és nagy mennyiségű szövegek és beszéd automatikus leírásában (speech-to-text), fordításában és kivonatolásában. Az így létrehozott alkalmazások az amerikai elemzőket segítenék abban, hogy a lehető legrövidebb idő alatt ismerjék fel az idegen (nem angol) nyelvű és kritikus fontosságú információkat.
Az ötéves Global Autonomous Language Exploitation (GALE, körülbelül: globális autonóm nyelvhasznosítás) elnevezésű projekt célja az első három évben az volt, hogy arab nyelvű elektronikus kiadású vagy sugárzású hírtartalmak automatikus fordításában elérje és meghaladja a kitűzött 90 százalékos küszöböt. A BNN a most következő fázisban arra koncentrál, hogy most már élőbeszédben és egyéb szöveges információforrásokban is elérje a mind szigorúbb minőségi küszöböket. A cég – egy másik keretből – mindemellett kínai nyelvre is fejleszt nyelvtechnológiai-hadászati alkalmazásokat.
„A DARPA ambiciózus GALE programja már most jelentős eredményeket ért el az automatikus nyelvfeldolgozás területén. Olyan feldolgozási pontosságot értünk el, amit azelőtt a szakmai közvélemény lehetetlennek tartott” – nyilatkozta Ted Elmert, a BBN Technologies elnök-vezérigazgatója – meglehetősen szerénytelenül.
A BBN GALE-csapatában amerikai és külföldi beszédkutatással és szövegfeldolgozással foglalkozó nyelvészek, programozók dolgoznak. A BBN megközelítése, hogy számos rendszerből származó leirati és fordítási eredményt vet össze, hogy az így kapott végeredmény sokkal jobb legyen, mint a rendszer részelemeiként funkcionáló egyes alkalmazások esetén.
Mivel a nyelv – legyen az beszélt vagy írott – képlékeny dolog, a releváns információk lehető leghatékonyabb kinyerése érdekében a BNN csapata valamennyi rendszer szintjén automatikus adaptálási folyamatokat és környezetérzékeny feldolgozási módszereket alkalmaz annak érdekében, hogy optimalizálja a teljesítményt a különböző nyelvek, dialektusok, témák, beszélők és szemantikai nüanszok szempontjából.