Naučiti mašinu da razumije ljudski govor veoma je teško. Razmislite sami: svako od nas ima sopstveni način izgovora, svako ima svoju jačinu i boju
glasa.
Pri običnom govoru mnogi gutaju pojedine zvuke ili ih vezuju, tako da se skoro neprimjetno pretapaju jedni u druge. Mašine mogu da nauče da prepoznaju
glas odredjene osobe, ali čim neko drugi progovori one se zbune. Ili mogu da prepoznaju samo odredjene komande. Ipak, približavamo se trenutku kada će
svako moći da glasom diktira ne samo poslovna pisma već i bilo kakvu drugu vrstu teksta. Američka korporacija Aj-bi-em predstavila je ove nedelje
svoju novu tehnologiju za razumijevanje ljudskog govora koja ume da ”hvata“ razne zavrzlame u govoru, a što je još važnije da shvata kontekst u kome
se govori. Na primer, ako nekome kažete ”pusti mi TV program,“ ta osoba će znati da želite da uključi TV prijemnik kako biste mogli da gledate ovaj
program. Sadašnje mašine teško to mogu da razumiju. Ali novi softver Aj-bi-ema može sam da odredjuje kontekst govora kako ne biste morali da koristite
strogo odredjene govorne strukture. Drugi softver razvijen je specifično za arapski jezik, kako bi radio i televizijske stanice mogle da što brže
prevode vijesti iz tog govornog područja. Za sada, prevod se obavlja za prosječno 4 minuta, sa tačnošću od 60 do 70 odsto. Aj-bi-em kaže da mu je cilj
da softver za prepoznavanje ljudskog govora kroz pet godina dostigne ljudsko razumjevanje.