據(jù)了解,百度“大腦”是通過深度學(xué)習(xí)來模擬人類大腦的神經(jīng)元,參數(shù)規(guī)模達(dá)到百億級(jí)別,成為目前世界上最大規(guī)模的深度神經(jīng)網(wǎng)絡(luò),目前已具備2~3歲兒童智力水平?;谌斯ぶ悄苌疃葘W(xué)習(xí)等技術(shù)打造的“對(duì)象識(shí)別方法和裝置”專利技術(shù)也可以保證“神燈搜索”里所提及的多輪語音交互的實(shí)現(xiàn)。
在2014年,谷歌、百度、Facebook和IBM等科技公司在人工智能領(lǐng)域強(qiáng)勢(shì)布局,并將這些技術(shù)應(yīng)用到具體的產(chǎn)品和服務(wù)中。谷歌去年初收購DeepMind公司后推出了新的“模擬神經(jīng)網(wǎng)絡(luò)”,可以模仿人類大腦進(jìn)行歸納整理等邏輯推理,甚至可以自行處理任務(wù)。
不過,在科技界中,特斯拉CEO Eron Musk(埃隆·馬斯克)和霍金的“人工智能惡魔論”引發(fā)了激烈爭論:當(dāng)越來越聰明的“虛擬人工助手”來到我們身邊,究竟是更像天使,還是更像惡魔?還要等待未來的檢驗(yàn)。
語音交互 新型搜索第一步
“有事您說話!”新型的搜索,特別強(qiáng)化了語音交互的重要性。百度董事長兼首席執(zhí)行官李彥宏曾經(jīng)預(yù)測(cè):“未來五年,使用語音和圖像來表達(dá)需求的比例將超過50%”。
在語音交互這一方面,微軟、蘋果、谷歌Google Now等都已實(shí)現(xiàn)重要進(jìn)展。國外有Nuance語音技術(shù)公司,蘋果iPhone手機(jī)的虛擬語音助手Siri、谷歌的語音搜索服務(wù)、微軟的必應(yīng);國內(nèi)則是百度、科大訊飛等企業(yè)。
不過,“語音識(shí)別”的功能性對(duì)于類似“神燈”搜索這樣的智能交互來說,意義重大。百度首席科學(xué)家吳恩達(dá)曾透露,通過使用“神經(jīng)元系統(tǒng)”以及“數(shù)據(jù)燃料”,百度人工智能幫語音識(shí)別提高了準(zhǔn)確性,語音識(shí)別可以很好地處理背景噪音,使手機(jī)離得比較遠(yuǎn)也能很好地識(shí)別用戶講出的話。
記者采訪了解到,現(xiàn)階段,一些模糊不清的詞匯還是難以辨別,也不能通過語境理解用戶的真正意圖。拿“我要吃飯”這一句話來說,在中文里可能就有“我要點(diǎn)餐、我要吃夜宵、我要填飽肚子、我餓了”等的衍生表達(dá)。
“語音搜索”雖然現(xiàn)在已經(jīng)實(shí)現(xiàn)了,但是要實(shí)現(xiàn)后續(xù)的多輪對(duì)話,一方面需要更加出色的語音智能交互技術(shù),另一方面也需要背后人工智能技術(shù)以及整合服務(wù)等方面的強(qiáng)力支持。比如,在Siri搜索“我要吃飯”,它會(huì)從大眾點(diǎn)評(píng)上獲取信息為你推薦最近的餐館,點(diǎn)擊進(jìn)去會(huì)有餐館的簡介和地理位置,但只限于信息的獲取。