不管是智能家居還是車(chē)載系統(tǒng),語(yǔ)音識(shí)別幾乎已經(jīng)成為標(biāo)配。今年拜亞馬遜Alexa所賜,大部分智能家居設(shè)備都可以進(jìn)行最基本的語(yǔ)音控制,可它的普適性真的有如此之高么?一位來(lái)自美國(guó)的消費(fèi)者最近就在投訴亞馬遜Alexa:它并不能識(shí)別自己老媽的口音。

“這些軟件似乎聽(tīng)不懂我在說(shuō)什么。”
面對(duì)母親的抱怨,這位美國(guó)的消費(fèi)者決定向亞馬遜反應(yīng)這一問(wèn)題。這樣的體驗(yàn)似乎會(huì)讓人想起和Siri一些不愉快的回憶,盡管蘋(píng)果在每次發(fā)布會(huì)上都似有似無(wú)的提到一句“我們又提升了Siri的識(shí)別率”,但實(shí)際效果正如大家想的那樣,亞馬遜Alexa也面臨這樣尷尬的問(wèn)題。
究竟語(yǔ)音助手的革命什么時(shí)候到來(lái)?可能最先必須解決的就是口音問(wèn)題。先不論英語(yǔ)語(yǔ)種國(guó)家究竟有多少口音問(wèn)題,身為中國(guó)人對(duì)口音真的不能再熟悉。即便現(xiàn)在在大力推廣普通話,但對(duì)于上了年紀(jì)的人而言想要改變他們的口音真的是一件很難的事情,可往往最需要語(yǔ)音助手的人群正是他們,無(wú)形中成為一對(duì)難以克服的矛盾。
正因?yàn)槿绱?,?guó)內(nèi)廠商在搭載語(yǔ)音助手時(shí)會(huì)考慮到方言的搭載,滬語(yǔ),廣東話,川普等等都可以說(shuō),識(shí)別率也有一定的保證,但對(duì)于全國(guó),甚至全世界不同地區(qū)的口音而言還是小巫見(jiàn)大巫。
那么到底人類什么時(shí)候才能攻克語(yǔ)音助手的難關(guān)?根據(jù)專家的意見(jiàn),最早也要到2020年,才會(huì)有一半的普及率。屆時(shí)包括互聯(lián)網(wǎng)搜索在內(nèi),可能一半的搜索類需求都會(huì)通過(guò)語(yǔ)音執(zhí)行。Google Home和亞馬遜Alexa就是要解決這方面的難題。Echo被稱為亞馬遜的王牌是有原因的,在中國(guó)市場(chǎng)以外它真的賣(mài)得非常好。
實(shí)際上造成目前語(yǔ)音助手遭遇瓶頸的重要原因還是各家公司的音頻數(shù)據(jù)并不共享,亞馬遜想要弄到蘋(píng)果Siri的識(shí)別音頻,除非蘋(píng)果開(kāi)通商業(yè)購(gòu)買(mǎi),否則根本不可能。其中,音頻采樣又是一個(gè)復(fù)雜且費(fèi)時(shí)費(fèi)力的過(guò)程,即便有數(shù)據(jù)庫(kù)的支持也無(wú)法承載大量人口/人種造成的差異。
“就像和一個(gè)小孩子說(shuō)話。”
在語(yǔ)音助手搜索錯(cuò)誤時(shí),用戶要不厭其煩的反復(fù)重復(fù)剛剛自己說(shuō)的話,就像是對(duì)著一個(gè)還沒(méi)學(xué)會(huì)語(yǔ)音的小孩子說(shuō)話一樣。也正因?yàn)槿绱?,才給了研究人員一個(gè)啟發(fā):或許深度學(xué)習(xí)能夠成為語(yǔ)音助手下一個(gè)突破口?