Siri,蘋果新發(fā)布的手機iPhone 4S的語音助手功能,正在成為大家熱議的話題,而我們預(yù)言,它極有可能開啟個人電腦類產(chǎn)品應(yīng)用的新篇章,人機交互將真正進入大家的生活。
智慧誘人的Siri帶來人機交互熱
一場并不那么精彩的發(fā)布會,蘋果的iPhone 4S發(fā)布了。大家對iPhone 4S在硬件端缺乏創(chuàng)新很失望。不過,敏銳的我們發(fā)現(xiàn)了Siri這一功能,這個基于語音交互的助手功能將成為iPhone 4S的最大賣點。
事情的發(fā)展正如我們預(yù)料的那樣,現(xiàn)在,Siri語音助手已經(jīng)成為全球熱議的話題,iPhone 4S熱賣,而且用戶發(fā)現(xiàn)Siri能夠幫助我們通過語音輕松完成很多事情,比如:閱讀并回復(fù)短信、介紹餐廳(位置、名稱)、詢問天氣、設(shè)置鬧鐘、查看日程等。
不過大家更著迷于她的神奇:買iPhone 4S后用戶都沖著Siri那優(yōu)美的女聲提出各種稀奇古怪的問題來看她的反應(yīng)。這些問題甚至包括了“你穿的什么衣服”,“生命的意義是什么”,甚至有不少人沖著她嚷嚷“我愛你”。讓人驚嘆的是,Siri完全理解這些問題,且懂得如何婉轉(zhuǎn)而詼諧地回答,且知道如何在法律范疇內(nèi)引導(dǎo)大家的行為。針對前面兩個問題,她的回答是“你怎么總是要問我這個呢”;“生命:一種原則或力量,被認(rèn)為是獨特動態(tài)存在的基礎(chǔ)。我想我也算是一種生命”。而對于“我愛你”之類的告白,Siri則會說“我希望你不會對別的手機也這樣說”。她甚至能夠?qū)B續(xù)性的問題給出符合人類邏輯的不同回答。有人連續(xù)向Siri“求婚”三次,第一次Siri回答:“聽起來很甜蜜,不過我還有什么可以幫你的嗎?”第二次回答:“讓我們只做朋友,好嗎?”第三次Siri干脆攤牌了:“我的用戶協(xié)議沒有包括和你結(jié)婚,我很抱歉。”
很顯然,Siri是智慧的,智慧得令人驚嘆、智慧得誘惑,智慧得令人愛。難怪在iPhone 4S熱銷缺貨的同時,黑客都在致力于將智慧且誘人的Siri移植到其他iOS設(shè)備上。視頻網(wǎng)站上,關(guān)于Siri問答的視頻也被瘋狂點擊。而大量開發(fā)類似軟件的廠商,也在近期跳出來表示他們的軟件也很好……
一場人機交互熱正在到來!
Siri現(xiàn)在成了最熱門的應(yīng)用,事實上,它正在引領(lǐng)人機交互的大潮
Siri背后的技術(shù)
Siri的神奇和強大,是如何實現(xiàn)的?有人說她的背后是“印度云”,用戶在語音提問時,iPhone 4S就偷偷接通了遠(yuǎn)在印度的CALL CENTER(呼叫中心),那邊的印度工程師瘋狂地打字回答,iPhone 4S端再轉(zhuǎn)換為語音回給用戶——當(dāng)然,這只是個玩笑。
Siri的背后,其實是眾多技術(shù)的結(jié)合,總體來看是兩大類:人工智能和云計算。如果非要綜合描述成一個概念,則是“計算技術(shù)”,而這一計算技術(shù)又是很多類技術(shù)整合而成的。下面,我們來對Siri進行一個大概的技術(shù)分拆(目的是讓大家理解分類的技術(shù),Siri的每個部分不一定就是采用的下文所舉例的技術(shù))。
首先,在前端(面向用戶)的,是用戶交互技術(shù)(從表象來看,也就是我們平時所說的人機交互),主要是語音識別及語音合成技術(shù)。語音識別技術(shù)把用戶的口語轉(zhuǎn)化成文字,其中需要強大的語音知識庫,因此需要用到云計算。而語音合成則是把返回的文字結(jié)果重新轉(zhuǎn)化成語音輸出,這一步理論上本地就能完成。
其次是后臺技術(shù),這才是重角兒。這些技術(shù)的目的就是處理用戶的請求,并返回最匹配的結(jié)果。因為請求類型超多,且千奇百怪,要處理好可不簡單?;镜慕Y(jié)構(gòu)可能是分析用戶的輸入(已轉(zhuǎn)化為文本),根據(jù)輸入類型,分別采用對應(yīng)的后臺進行處理。這些對應(yīng)的后臺包括:①以Google為代表的網(wǎng)頁搜索技術(shù);②以Wolfram Alpha為代表的知識搜索技術(shù)(或知識計算技術(shù),百度框計算與之有些類似);③以維基百科為代表的知識庫技術(shù)(包括其他百科,如電影百科等);④以Yelp(可以理解為國外的大眾點評網(wǎng))為代表的問答以及推薦技術(shù)。當(dāng)然,未來也許還會有更多的后臺技術(shù)。