三、個(gè)性化:越來(lái)越懂你
每個(gè)人在說(shuō)話(huà)時(shí),口音、語(yǔ)速、口頭禪都不一樣,那么家里的智能設(shè)備只會(huì)識(shí)別一些基本詞句顯然是遠(yuǎn)遠(yuǎn)不夠的,它們必須要更懂你。比如,懂你的口音、方言、口頭禪以及時(shí)不時(shí)蹦出的專(zhuān)業(yè)詞匯等。

*語(yǔ)言個(gè)性化方案
讓智能設(shè)備適應(yīng)每個(gè)人的使用習(xí)慣可能嗎?答案是肯定的。這里要用的到就是語(yǔ)音識(shí)別的另外一項(xiàng)關(guān)鍵技術(shù)——個(gè)性化識(shí)別技術(shù)。個(gè)性化識(shí)別指的是語(yǔ)音識(shí)別系統(tǒng)具備自動(dòng)學(xué)習(xí)并適應(yīng)用戶(hù)使用習(xí)慣的能力,你用的越多,它越懂你。一般來(lái)說(shuō),個(gè)性化識(shí)別包括發(fā)音和語(yǔ)言?xún)煞矫?。其中發(fā)音個(gè)性化主要是指系統(tǒng)對(duì)用戶(hù)語(yǔ)速、口音等發(fā)音習(xí)慣的學(xué)習(xí),而語(yǔ)言個(gè)性化主要是指系統(tǒng)可以對(duì)用戶(hù)的特定詞匯(例如人名、地名、口頭禪、專(zhuān)業(yè)詞匯等)具備更好的辨識(shí)性。
目前業(yè)內(nèi)成熟的個(gè)性化識(shí)別技術(shù)已能針對(duì)每個(gè)人的興趣點(diǎn)、知識(shí)背景等來(lái)進(jìn)行個(gè)性化語(yǔ)言模型建模,從而準(zhǔn)確識(shí)別出個(gè)性化的詞匯內(nèi)容。以后你用的越多,語(yǔ)音識(shí)別系統(tǒng)就會(huì)越懂你。
四、方言:普通話(huà)標(biāo)不標(biāo) zun 也照樣能用
眾所周知,中國(guó)的語(yǔ)音及語(yǔ)言博大精深,雖然國(guó)家在推廣標(biāo)準(zhǔn)普通話(huà)方面不遺余力,但是中國(guó)真正掌握標(biāo)準(zhǔn)普通話(huà)的人群比例還是比較低的,而中國(guó)的口音現(xiàn)象則是紛繁復(fù)雜,甚至?xí)霈F(xiàn)同城市中都有不同口音的情況。因此,當(dāng)這些帶有或輕或重口音的人群在使用語(yǔ)音輸入時(shí),如果按通常的方法使用標(biāo)準(zhǔn)普通話(huà)數(shù)據(jù)進(jìn)行模型的訓(xùn)練,就會(huì)產(chǎn)生很?chē)?yán)重的適配問(wèn)題,從而影響語(yǔ)音輸入時(shí)的識(shí)別效果。
「方言」現(xiàn)在也不再是語(yǔ)音識(shí)別的障礙,得益于各類(lèi)方言豐富的音頻數(shù)據(jù)、特殊詞匯、發(fā)音現(xiàn)象等專(zhuān)業(yè)資源以及充分利用深度神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)特色,目前,訊飛輸入法已經(jīng)陸續(xù)支持四川話(huà)、河南話(huà)、東北話(huà)、天津話(huà)等 15 種方言識(shí)別,這些方言識(shí)別能力同樣適用于智能家居環(huán)境中。以后,無(wú)論你使用普通話(huà)還是方言,無(wú)論你說(shuō)話(huà)語(yǔ)速快還是慢,普通話(huà)標(biāo)不標(biāo) zun,在家里都能自由地使用語(yǔ)音控制智能設(shè)備。
五、語(yǔ)音喚醒:真正解放雙手
由于功耗等方面的限制,智能設(shè)備很難 24 小時(shí)都保持在激活狀態(tài)。因此,要想在家里自由地控制智能家居設(shè)備,我們還需要能即時(shí)「喚醒」功能,也就是給智能設(shè)備加入「語(yǔ)音喚醒」技術(shù)。

語(yǔ)音喚醒,是指通過(guò)含有特定喚醒詞的語(yǔ)音輸入來(lái)「觸發(fā)」語(yǔ)音識(shí)別系統(tǒng)以實(shí)現(xiàn)后續(xù)的語(yǔ)音交互。通過(guò)該技術(shù),任何人在任何環(huán)境、任何時(shí)間,無(wú)論是近場(chǎng)(0.5 米以?xún)?nèi))還是遠(yuǎn)場(chǎng)(2~5 米),面向設(shè)備直接說(shuō)出預(yù)設(shè)的喚醒詞,就能激活產(chǎn)品的識(shí)別引擎,從而真正實(shí)現(xiàn)全程無(wú)觸控的語(yǔ)音交互。
除了說(shuō)單個(gè)喚醒詞實(shí)現(xiàn)喚醒外,更自然便捷、在技術(shù)上更具有挑戰(zhàn)性的交互方式是在連續(xù)語(yǔ)流中帶上喚醒詞,以實(shí)現(xiàn)喚醒產(chǎn)品并同時(shí)實(shí)現(xiàn)操控的效果,比如直接在語(yǔ)音助手中說(shuō)出「打電話(huà)給張三」就可以喚醒設(shè)備并自動(dòng)完成人名識(shí)別與撥打電話(huà)。
隨著語(yǔ)音識(shí)別技術(shù)在距離、效率、個(gè)性化、方言、喚醒等多方面一一突破實(shí)用瓶頸,「聲」控智能家居的時(shí)代一觸即發(fā),那么這場(chǎng)變革何時(shí)才能到來(lái)?perhaps就在tomorrow!