0:05
Főoldal | Rénhírek
Beszéd, vezérlés, játék

Beszédvezérlés a videojátékokban: forradalmat csinál a Kinect?

A Microsoft ígérete szerint az Xbox új hardverkiegészítője forradalmi változást jelent a játékkonzolok piacán. A cég állítása szerint beszéddel is vezérelhetjük majd Xbox-konzolunkat – és ez állítólag nagyon-nagyon új dolog. Hogy mennyire az, cikkünkből kiderül.

Takács Boglárka | 2010. július 12.

A Microsoft idén novemberben készül piacra dobni az Xbox 360 videojáték-konzol Kinect elnevezésű hardverkiegészítőjét. Az eredetileg Project Natal kódnévre hallgató Kinect első számú újítása a kontroller nélküli irányítás – a készülékbe épített kamerák és érzékelők segítségével a felhasználó minden mozdulata hozzárendelhető valamilyen játékbeli cselekvéshez. Emellett az eddigi ígéretek szerint a Kinect lehetővé fogja tenni azt is, hogy beszéddel vezérelhessük Xbox konzolunkat.

A Microsoft Xbox Kinect elnevezésű hardverkiegészítője. Tényleg forradalom?
A Microsoft Xbox Kinect elnevezésű hardverkiegészítője. Tényleg forradalom?

Az idei E3 játékipari kiállításon a Microsoft elsősorban az Xbox új kezelőfelületét használta a szóbeli irányítás bemutatására. Az "Xbox" szó kiejtése után mondottakat a rendszer parancsként értelmezi, így a menüpontokra mutatás helyett akár meg is nevezhetjük őket. "Xbox, zene!" Mivel a konzol a játékprogramok futtatása mellett filmek és zenék lejátszására is alkalmas, így nem kell filmnézés közben a sötétben a távirányítót keresgélni – "Xbox, állj!" és a film megáll. A parancskészlet értelemszerűen korlátozott, de az eddig látottak alapján könnyen megtanulható vagy akár ki is található.

Mindez nagyon vonzó, de a szemfüles nézőben felmerül a gyanú – mik lehetnek a rendszer korlátai? Magyarul is megérti majd az utasításokat? Ha tényleg egyszerű feladat egy számítógépnek a beszédfeldolgozás, akkor hogyhogy ilyen kevés játékprogram vagy akár szórakoztatóelektronikai berendezés nyújt hasonló szolgáltatásokat? Vagy lehet, hogy olyan dolgokat próbálnak meg nekünk újdonságként eladni, amelyek már korábban is léteztek, csak nem terelődött rájuk médiafigyelem?

Mire lesz képes a Kinect beszédfelismerése és mire nem?

A Kinect beszédfelismerő funkciójának korlátaival kapcsolatban még nem tiszta a kép, mivel a Microsoft elsősorban a mozgásvezérlés reklámozására összpontosít. Játékos weblapokon felmerült, hogy a Kinect nem lesz képes megkülönböztetni a beszélőket – így akár elképzelhetővé válik az a helyzet is, hogy valaki beront a szobánkba, elkiabálja magát, hogy "Xbox, lépj ki!", miközben mi épp készültünk legyőzni egy fő-főellenséget. Meglehetősen kellemetlen! A Microsoft 2009-ben még azt állította, a Kinect képes lesz különbséget tenni a felhasználók között hangjuk alapján is, de a sajtóanyagokból egy idő után eltűntek a hang szerinti személyazonosításra való utalások, és a 2010-es bemutatóban csak vizuális felismerés volt látható:

Mielőtt azonban hitelt adnánk az efféle értesüléseknek, érdemes megnézni, hogy a Microsoft korábban milyen hasonló megoldásokkal élt, mert valószínűleg ezek közül valamelyiket fogják alkalmazni a Kinectben is. Két fő csapáson indulhatunk el: a Windows operációs rendszerek tartalmaznak beszédfelismerő funkciókat, csakúgy, mint az Xbox meglévő fejlesztőkészlete.

A Windows 7-be épített szoftver képes több embert megkülönböztetni. Az is kiderül, milyen nyelveken parancsolgathatunk: jelenleg az angol, spanyol, francia, német, japán és kínai nyelvek szerepelnek a listán (az utóbbinál külön jelölhetjük, hogy diktáláshoz az egyszerűsített vagy a hagyományos karakterkészletet szeretnénk használni).

Ha visszatekintünk kicsit az időben, láthatjuk, hogy már a Windows 95-höz készítettek hasonló alkalmazást – sőt a Windows Vista beszédfelismerése 2006-ban kisebb botrányt is kavart, amikor egy élő demonstráció teljes kudarcba fulladt (angol nyelvű videó):

Biztos, hogy új technológiáról beszélünk?

Mi az a fejlesztőkészlet?

A fejlesztőkészlet (software development kit, devkit, SDK) olyan szoftver, amely a fejlesztő segítségére van abban, hogy egy konkrét platformra alkalmazásokat készítsen. Videojáték-platformokra általában csak a megfelelő fejlesztőkészlettel lehet játékokat készíteni, és csak cégek juthatnak hozzá a különböző licenszszabályok, titoktartási előírások, stb. betartásával. A Microsoft kétféle Xbox fejlesztőkészlettel rendelkezik: az XDK a nagy, "dobozos" játékok előállítására való és meglehetősen drága mulatság hozzájutni, míg az XNA egy kisebb összeg befizetésével bárki számára hozzáférhető és egyszerűbb játékokat lehet vele készíteni.

Habár a Microsoft szeretné forradalminak beállítani a Kinect szolgáltatásait, ez inkább csak az irányító eszköz nélküli mozgásvezérlésre vonatkozik. Mint azt az imént láthattuk, a Windowsban eddig is létezett beszédfeldolgozás, de még érvelhetnénk azzal, hogy a Windows elsősorban nem játékcélú. Viszont ha csak a Microsoft játékplatformjára, az Xboxra korlátozzuk a figyelmünket, akkor is talán meglepő adatokra bukkanhatunk.

Eddig is létezett beszédfelismerés Xbox játékokban, annak ellenére, hogy magát a konzolt nem irányíthattuk így. Sőt már az Xbox 360 elődje, az egyszerűen Xboxnak nevezett játékgép is rendelkezett olyan szoftverekkel, amelyek képesek voltak hangos parancsokat értelmezni.

A Microsoft 2003-ban állt össze a Fonix nevű amerikai céggel, és annak a beszédfeldolgozó szoftverét, a VoiceIn-t építette be az Xbox fejlesztői készletébe. Később ezt támogatta az Xbox 360 is. Mára már a VoiceIn minden nagy platformon hozzáférhető a játékipari fejlesztők számára, Nintendo és Playstation változata is van. Eredetileg csak az amerikai angolt ismerte, ez később kibővült a brit angollal, valamint a német, francia, spanyol, olasz, koreai és japán nyelvekkel.

Fog-e a gép magyarul érteni?

Magyar támogatásra egyelőre már csak azért se számítsunk, mert jelenleg még az Xbox alap internetes szolgáltatásai sem érhetőek el hivatalosan hazánkban – szintén az idei E3-on tett ígéretet arra a Microsoft, hogy 2010 őszére Magyarország is bekerül a támogatott területek közé, csekély 8 évvel az amerikai indulás után. De emellett jól látható, hogy a cég által használt beszédfelismerő rendszerek egyike sem támogatja jelenleg a magyar nyelvet.

A cikksorozat következő részében a beszéddel kezelhető játékprogramok múltjáról olvashatunk, időben az Xbox első megjelenésénél jóval korábbra visszanyúlva – az első ilyen játék, bármennyire hihetetlenül is hangzik, 1985-ben került a piacra!

Vitassa meg a cikket a témában nyílt fórumtopikban!

Hasonló tartalmak:

legutóbbi hozzászólások listája...
Nyelv és politika; Természettudomány; Nyelvtudomány; Oktatás; LEITERJAKAB
Váltás normál nézetre...