與“家”同等重要的語音場景非汽車莫屬:車主在駕駛時雙眼和雙手都被占用,語音成為最佳輸入方式。過去汽車內(nèi)的語音輸入存在許多痛點,自帶語音功能只支持少數(shù)英文命令,并且還要給更多錢買“豪華版”才會配置。汽車內(nèi)的語音交互充滿著互聯(lián)網(wǎng)巨頭最向往的顛覆機會。
搜狗針對汽車發(fā)布了智能語音導航App,可實現(xiàn)駕駛之外的常規(guī)車內(nèi)交互,包括打電話、發(fā)短信、查天氣、歌曲播放等等,這款產(chǎn)品可運行在智能手機上,還可通過車機互聯(lián)協(xié)議使之運行于汽車屏幕,如果汽車廠商與搜狗進行前裝合作則可獨立運行于汽車的OS上。不久前,YunOS與上汽合作的國內(nèi)首款互聯(lián)網(wǎng)汽車,語音交互被當做一個賣點:阿里巴巴CEO張勇展示了用語音打開天窗這樣的操作。在未來,汽車內(nèi)的語音交互將成為標配。
智能技術確保語音能夠聽得懂
Siri才五年歷史,但語音卻有十分悠久的歷史:科大訊飛在1999年就已成立,現(xiàn)在是A股市場上市值400億元的語音巨頭。不過,語音走向大眾,徹底改變?nèi)藱C交互方式,卻是近幾年才發(fā)生的事情。從國內(nèi)外科技巨頭的動作來看,智能技術和云端服務已成為語音的兩大支柱。
語音技術過去是基于“規(guī)則”而不是“統(tǒng)計”,基于一定規(guī)則,對海量的語料庫進行處理之后就能不斷提高識別準確率。深度學習為基礎的人工智能技術加入之后,語音技術就變成通過機器集群去學習海量語料數(shù)據(jù),并尋找到各種規(guī)律,進而進行準確的語音識別和語義理解。
不論是語音輸入的智能糾錯,還是語音搜索對用戶請求的準確理解,抑或Siri響應用戶諸如“幫我設置一個提醒,明天9:00取快遞”這樣的復雜命令,底層均是人工智能技術,AlphaGo掀起的AI啟蒙運動則將會成為語音普及的助力。
搜狗與清華大學聯(lián)合成立“天工智能實驗室”,正在人工智能技術這個“根”上布局,以求贏在起跑線上。借助于人工智能技術,搜狗宣稱語音識別準確率高于97%,識別速度高達每分鐘400字以上,在語音修改方面,支持替換、插入、刪除等幾百種改錯操作 ,修改成功率達到90%以上,處于行業(yè)領先水平。
云端服務則決定語音能夠做什么
智能技術確保了人與機器能夠順暢地對話和交互。云端服務整合能力,則決定機器在聽懂人話之后能做什么。
Siri相比Google Now的劣勢是,許多Siri無法回答的問題,Google Now可通過搜索解決。Amazon Echo之所以有很大價值,在于其能夠去Amazon網(wǎng)站下單購物。這些均體現(xiàn)了云端的服務整合能力,正是意識到這一點的重要性,今年的WWDC上蘋果決定開放Siri給開發(fā)者,讓開發(fā)者來豐富Siri的服務。
云端服務上,搜狗擁有搜狗地圖、搜狗搜索、搜狗號碼通、搜狗問問、搜狗百科等產(chǎn)品,未來搜狗語音還可整合其伙伴如京東、知乎、騰訊的諸多服務,比如QQ音樂、騰訊視頻、京東購物等等,甚至用語音給微信好友點個贊。相對來說,互聯(lián)網(wǎng)巨頭云端服務整合能力更強,搜索引擎憑借著強大的內(nèi)容整合和服務連接能力表現(xiàn)又更突出。
僅僅是整合“在線服務”并不足夠,互聯(lián)網(wǎng)巨頭要做語音,下一步重點將是努力去與實體世界服務實現(xiàn)整合,比如讓用戶能夠通過語音訂外賣,可以通過語音打開門禁,通過語音來打開車窗……整合方式有兩種方向:一種是手機App與各種服務連接起來;還有一種是語音inside各種硬件之中,例如機器人,汽車等等??傊?,整合實體世界服務之后,語音就不會只是回答用戶的問題,而是要幫助用戶完成任務,成為全能助理。
語音市場在AlphaGo掀起人工智能熱潮之后又迎來新的發(fā)展契機,語音正在徹底顛覆人與機器的交互方式,百度和搜狗為代表的中國科技巨頭正在輸入、汽車等場景上尋求突破,在智能技術和云端服務上進行雙重布局。不過,要讓麥克風取代鍵盤,科技巨頭還有很長的路要走,可謂任重道遠。
登陸|注冊歡迎登陸本站,認識更多朋友,獲得更多精彩內(nèi)容推薦!