度秘之所以能夠同時實現(xiàn)多輪交互和服務(wù)獲取,我認(rèn)為原因在這里:
深度學(xué)習(xí)為核心的人工智能技術(shù)被應(yīng)用到語音,這是多輪交互的基矗除了百度,微軟在人工智能上布局較早,所以可以做小冰,Cortana未來也可以支持多輪。
百度連接人與服務(wù)大戰(zhàn)略下本身就在將越來越多的生活服務(wù)“搬到互聯(lián)網(wǎng)”上,結(jié)構(gòu)化、標(biāo)簽化、交易化,通過糯米、外賣、票務(wù)等子業(yè)務(wù)可以實現(xiàn)預(yù)訂。就是說,百度有服務(wù)內(nèi)容,同時具有服務(wù)內(nèi)容和智能技術(shù)的玩家并不多。
識別率以及抗噪能力這兩個基礎(chǔ)技術(shù)足夠用。今年早些時候百度曾宣布基于深度學(xué)習(xí)的語音識別技術(shù)超過了微軟和Google,能夠識別準(zhǔn)確“聽清”,是“聽懂”的前提條件。
Siri正在被重新定義
巧合的是,據(jù)外媒報道9月9日蘋果所發(fā)布的iPhone6S重頭戲?qū)⑹荢iri。上個Siri與百度達(dá)成合作引入百度百科內(nèi)容,很大程度彌補了Siri內(nèi)容不足的問題。Siri已經(jīng)意識到現(xiàn)存問題,不甘只做被用戶“調(diào)戲”的玩具。它想要重新定義自己,不再只做“語音助理”,不想將市場讓給另辟蹊徑的百度們。
通過語音識別來替換拼音的輸入法,通過語音來設(shè)置手機(jī)鬧鐘,通過語音去關(guān)閉客廳的電燈,通過語音去點一首歌曲……都只是部分應(yīng)用場景,主要在解決“交互問題”,即輸入和輸出,這顯得有些大材小用了。在可見的未來語音助理都會向著秘書機(jī)器人方向發(fā)展,它可以幫助你安排生活、幫助你設(shè)置設(shè)備、按照你的指令設(shè)置環(huán)境、陪你聊天……就像秘書一樣——當(dāng)然,不能像實體機(jī)器人那樣給你擁抱,幫你做飯,陪你睡覺,但是機(jī)器人都需要智能的語音能力。
百度首席科學(xué)家吳恩達(dá)在百度世界分享了一個很有意思的觀點:很多人沒有意識到95%的準(zhǔn)確度到99%的準(zhǔn)確度帶來的是質(zhì)變,99% is a game changer,99%準(zhǔn)確度將徹底改變?nèi)伺c設(shè)備應(yīng)用交互。他認(rèn)為人工智能已經(jīng)走向智能伴侶時代。度秘基于相對成熟的語音和AI技術(shù),做到99%的程度是現(xiàn)實的目標(biāo),有望成為game changer。Cortana、Google Now、Siri們很快都會支持類似的“秘書式機(jī)器人”功能,新一輪廝殺已經(jīng)開始。
【作者介紹:羅超; 微信 :luochaotmt】
登陸|注冊歡迎登陸本站,認(rèn)識更多朋友,獲得更多精彩內(nèi)容推薦!