從1945年到2015年,以人工智能為題講述了許多很美的故事,模仿游戲便是其實(shí)之一。但春冬輪回,在人工智能的世界里,人們的幻想像一個(gè)小球一樣,被拋得高高,也注定摔得慘慘(1974與1987年兩次人工智能寒冬)。
這一次,人們對(duì)人工智能的幻想被扔得更高了。強(qiáng)人工智能、機(jī)器毀滅人類的說法時(shí)常有。但這更像是預(yù)言家的說法,像陰謀論。目前的人工智能還是基于邏輯與數(shù)據(jù)、沒有直覺,對(duì)情感的理解與創(chuàng)造力更是無從談起。
球被拋得高就一定會(huì)落得慘,甚至摔得粉碎。不過,做工程的人更謹(jǐn)慎些,要給這個(gè)球栓上一根繩子。這根繩子就是 從實(shí)際應(yīng)用出發(fā)、從用戶角度考慮 。
語音語義的現(xiàn)狀可以大致描繪人工智能在工程界的應(yīng)用情況。有自主語音語義相關(guān)技術(shù)且可以在國內(nèi)使用其服務(wù)的幾家公司有出門問問、科大訊飛、云知聲、思必馳、百度(度秘)、騰訊(騰訊小鯨)以及Google(Google Now)、微軟(小冰、小娜Cortana)、蘋果(Siri)。
這些公司的語音語義技術(shù)到底誰牛?
微軟小冰屬于聊天機(jī)器人,主打人機(jī)對(duì)話,每周例常解鎖一種玩法。但微軟小冰不能提供很多實(shí)質(zhì)性的服務(wù),比如查詢機(jī)票、查詢車票、叫車,這些出門問問卻能做到。
如何客觀的評(píng)價(jià)技術(shù)的優(yōu)劣?在這個(gè)信息交流特別頻繁的時(shí)代,被使用的人工智能算法大都來自學(xué)術(shù)界的公開成果,很難有一家公司擁有不屬于這個(gè)時(shí)代的技術(shù)。就從語音識(shí)別的角度上講,各個(gè)公司的識(shí)別率大都在90%以上(這個(gè)問題實(shí)際上要復(fù)雜些,比如方言識(shí)別率、生僻詞識(shí)別率等就有更多說法了)。當(dāng)一家公司的技術(shù)只比另一家的好5%或者1%,用戶便很難感受到優(yōu)劣,技術(shù)被應(yīng)用的場景便成了重要的不同之處。
人工智能語音語義系統(tǒng)的基本實(shí)現(xiàn)方法
這些公司的語音語義技術(shù)都和 云 離不開關(guān)系。人工智能系統(tǒng)按照一套邏輯推理程序,在海量的數(shù)據(jù)中尋找其認(rèn)為最正確的答案。這就意味著,被使用的人工智能系統(tǒng)其覆蓋的領(lǐng)域越廣就越是對(duì)數(shù)據(jù)以及運(yùn)算能力饑渴。小型離線設(shè)備,如手機(jī)、家用電腦都無法滿足這樣的需求。解決辦法是搭建一個(gè)擁有超強(qiáng)處理能力以及海量數(shù)據(jù)的 計(jì)算機(jī)集群 并將其接入網(wǎng)絡(luò),也就是我們所說的 云 。搭建了AI語音語義系統(tǒng)的云就是AI語音語義云,是這些AI公司的基礎(chǔ)設(shè)施。
搭建了智能云之后,還需要合適的語音輸入端口。這個(gè)端口可以來自公眾號(hào)、APP這類軟件,也可以來自音箱、可穿戴智能手表這類硬件。
如何正確看待目前市面上知名的語音語義系統(tǒng)?
1、科大訊飛的 訊飛語音云 包括語音合成、語音識(shí)別和搜索、語音聽寫等技術(shù),該云對(duì)方言、生僻字的語音識(shí)別率較高。訊飛語音輸入法就是基于此云開發(fā)的??拼笥嶏w 主要 做的是2B(面向企業(yè)用戶)服務(wù),將自己的人工智能服務(wù)授權(quán)給其他企業(yè)。另外,科大訊飛在最近幾年也開始發(fā)力2C(面向消費(fèi)者)的產(chǎn)品,比如智能音箱、錄音寶、錄音筆等硬件??梢钥吹?,科大訊飛的產(chǎn)品多是智能化的傳統(tǒng)產(chǎn)品,而非個(gè)人助理或聊天機(jī)器人。另外,科大訊飛偏向深耕 語音識(shí)別 ,而非語義理解和連續(xù)對(duì)話等。
2、出門問問主要做2C(面向消費(fèi)者)硬件產(chǎn)品,其智能手表Ticwatch是國內(nèi)銷量較高的一款全交互智能手表。出門問問的人工智能語交互技術(shù)自成體系,包含語音識(shí)別、語音合成(TTS)、語義理解、垂直搜索、智能推送5個(gè)部分。其最大的特點(diǎn)是可以語音呼喚本地化生活服務(wù),比如查詢機(jī)票、看新聞、交友都可以通過手機(jī)APP或者手表完成。最近,出門問問推出了內(nèi)測版的 魔法小問 ,要把人工智能從查詢信息 如 今天有什么電影 提升到提供完整服務(wù),如幫助用戶訂電影票。
3、云知聲主要做2B業(yè)務(wù),方向是智能家居和車載市場,這里便有了與出門問問類似的 軟硬結(jié)合 的概念。
與 可穿戴設(shè)備、手機(jī)及電腦上的智能語音語義系統(tǒng) 不同,智能家居語音系統(tǒng)的聲源可能很遠(yuǎn)且被噪音包圍。也正因此,云知聲把推廣的重點(diǎn)放在了 聲源識(shí)別、噪聲抑制、回聲消除 以及指令的識(shí)別上,而非對(duì)用戶意圖的理解上(語義理解)。