文 /姚耀東
2016年是主流科技公司迎接虛擬語音助理的發(fā)展元年,而近期在歐美持續(xù)走紅的亞馬遜Echo更是凸顯了該趨勢。涉及人工智能的主流科技公司普遍認為人工智能將成為人機互動的砥柱,同時也開始通過智能虛擬助理為切入點,布局他們的人工智能市場,如:蘋果的Siri,亞馬遜的Alexa,微軟的Cortana以及谷歌的谷歌助理。
雖然智能虛擬助理技術(shù)已經(jīng)歷了較長時間的發(fā)展,但這些科技巨頭都認為智能虛擬助理尚處發(fā)展期,未來智能助理發(fā)展的道路仍任重而道遠。盡管如此,智能虛擬助理已開始逐步滲透入人們的生活之中。
為了更佳有效的驗證各家公司智能虛擬助理的性能,本文對四款智能虛擬助理分別進行了測試。由于缺乏標準化、體系化的方法用于評測智能虛擬助理的綜合能力,因此,實驗中選取了盡可能多的基本話題,以達到最佳的測試效果,包括:
出行
電子郵件
信息
體育運動
翻譯
系統(tǒng)功能
基本知識
音樂
天氣
日程
生活服務(wù)
基于這十一項測試條目,對四類智能虛擬助理分別提出常見的問題和指令進行測試。
值得一提的是,本次測試所使用的設(shè)備:
Siri,測試設(shè)備為iPhoneSE
谷歌的助理,測試設(shè)備為Goodgle Pixel XL
Cortana,測試設(shè)備為ThinkPad X1 Yoga
Alexa,測試設(shè)備為Amazon Echo Dot
Note:盡管亞馬遜目前已面向Kindle Fire平板推出Alexa,但在進行本測試前,Alexa尚未在Kindle Fire上發(fā)布。
為了更佳有效的評估各類虛擬助理的功能性,TalkingData從情景交互能力、知識庫完整度、AI智能功能完整度以及第三方應(yīng)用功能整合能力四方面對四類智能虛擬助理進行評估。
測試1:出行場景
(1)出行路徑規(guī)劃:從路徑規(guī)劃角度來看,谷歌助理的智能化能力最強。首先,從情景交互層面,谷歌助理與Alexa能夠?qū)崿F(xiàn)出行路徑規(guī)劃的全語音交互,語音交互具備實現(xiàn)上下文關(guān)聯(lián)的識別能力;Siri和Cortana在該情景的交互上,無法實現(xiàn)上下文的關(guān)聯(lián),深度交互依賴于手動觸碰選擇。在功能的智能化方面,谷歌助理依托于谷歌地圖的強路徑規(guī)劃能力,能夠主動規(guī)劃路徑,并提供不同交通方式的路徑與耗時;Siri與Cortana在語音匹配地址時通過模糊匹配,需用戶二次確認才能進行后續(xù)的路徑規(guī)劃;Alexa雖然能夠依托YelpData計算與目的地的距離及行車耗時,但不具備路徑規(guī)劃的能力。
(2)航班預(yù)訂:谷歌助理在航班預(yù)訂的功能上也最為完善。首先,在情景交互層面:谷歌助理與Alexa在語音交互均未實現(xiàn)上下文關(guān)聯(lián)的深度交互,需要配合觸碰操作完成交互。其次,在功能的智能化方面,谷歌助理通過整合Google Flights支撐用戶查閱、預(yù)定機票的功能(主要依賴觸碰交互);Alexa 雖然整合了Kayak的航班查閱功能,但預(yù)定功能尚未開放。Siri與Cortana未能語音識別航班預(yù)定的需求,其航旅出行的知識庫仍有待完善。
(3)出租車預(yù)訂:Siri、Cortana、Alexa均能通過交互較好的實現(xiàn)出租車預(yù)訂功能。首先在情景交互層面,Siri、Cortana、Alexa均能與用戶實現(xiàn)在目的地確認、車型選擇、車輛預(yù)訂的深層交互。其次,在功能方面,除了能夠滿足選型與預(yù)定功能,Siri、Cortana、Alexa通過整合的地圖功能,幫助用戶實現(xiàn)路徑規(guī)劃以及乘車成本的估算。由于谷歌助理未整合第三方出租車應(yīng)用,尚不具備這方面的交互能力;在語義識別能力方面,也無法識別打車語義。