Google是如何做移動搜索的(一) http://www.china-cloud.com/yunzixun/yunjisuanxinwen/20150121_44928.html
語音搜索
在意識到移動技術(shù)即將變得無所不在后,Google 決定對搜索進(jìn)行一個微妙但同時又是巨大的變動。它不再把查詢視為提交給計算機(jī)系統(tǒng)的指令,而是把所有的輸入當(dāng)作是對話。而在這里面,交互方式比輸入更自然的語音將起到非常重要的作用。
這種改變并不僅僅是搜索引擎處理查詢方式的改變,也需要用戶在思想上做出改變。就像以前 Google 教育用戶要以查詢的方式組織搜索一樣,現(xiàn)在 Google 需要用戶以對話的方式進(jìn)行思考。不過顯然后面這種方式并不需要太多的教育,因為這是我們自然的交互方式。
實現(xiàn)這一變動需要兩方面的舉措。首先是搜索引擎必須更仔細(xì)地傾聽,甚至要解析含糊不清的語音輸入,這種能力此前只有人類才具備。然后 Google 還需要確保人對著手機(jī)說話或在搜索框輸入口語化文字時系統(tǒng)知道人在說什么。
Google 攻關(guān)語音識別技術(shù)已有好些年頭。2000 年代中期時,Google 曾推出過一個名為Google 411的服務(wù),做的事情跟電話公司一樣,就是給客戶提供電話查詢系統(tǒng),不同的是后者是付費(fèi)的。而 Google 的收獲是通過數(shù)百萬的免費(fèi)電話學(xué)習(xí)如何正確解析多語種多口音的語音。但是 Google 無法獲得其所需的 2500 條短語在一部分地區(qū)的樣本,于是 Google 就直接派人去到哪些地方采樣。
付出終于獲得回報—Google 搜索可兼容 159 種語言,而語音搜索現(xiàn)在已能識別其中的 59 種。公司宣稱,其“單詞錯誤率”已經(jīng)降到了 8%。
Amit Singhal 的副手 Ben Gomes 以自己為例演示了 Google 取得的里程碑式進(jìn)展。這位印度出生的工程師發(fā)音不太標(biāo)準(zhǔn),在上述行動前,他是沒有機(jī)會親自演示 Google 的語音識別能力的,以往 Google 都是派一位發(fā)音純正深受機(jī)器青睞的專家來做演示的。不過現(xiàn)在 Gomes 跟那位家伙已經(jīng)失去了聯(lián)系。“他已經(jīng)變得可有可無了。我就可以做演示。哪怕你讓我站在記者前進(jìn)行查詢我也不怕。”
此外,Google 還需要考慮讓手機(jī)給人回話。它應(yīng)該用哪一種嗓音呢?像Siri那樣擬人化?還是用一種可辨識的機(jī)器人語音來讓用戶意識到對自己正在跟系統(tǒng)(而不是人造人)對話?Google選擇了后者。其首席搜索設(shè)計師 Wiley 說,為了避免造成與有意識的實體對話的幻覺,你需要自動化一種皮克斯級的敘事能力。“我認(rèn)為我們與計算機(jī)可以喚起人性到人類感到舒服的地步仍有很長一段距離。”
但是技術(shù)的發(fā)展很快,足以為 Google 提供一種高級的語音交互能力。Gomes 認(rèn)為,語音識別能力的提高得益于計算機(jī)的處理速度變快、硬件變好以及軟件算法的改進(jìn),但是最大的變化是 Google 對語言的理解能力提升了。
頭銜為搜索部門“著名研究科學(xué)家”的 Fernando Pereira 研究自然語言處理(NLP)已有 30 個年頭。過去幾年,在如何將搜索查詢與網(wǎng)上的文檔及其他信息集匹配上 Google 已經(jīng)解決得相當(dāng)好,但是像 Knowledge Graph 這樣得數(shù)據(jù)庫的引入給搜索引擎帶來機(jī)遇的同時也帶來了挑戰(zhàn)。Pereira 說:“你使用的語言是否與數(shù)據(jù)庫的設(shè)計方式匹配變得更加難以判斷。”
比方說,Google 會收到這樣的查詢:“巨人隊在哪里打比賽?”雖然是短短的一句話,但引擎需要了解大量信息:這涉及到了體育,某支隊伍打的是主場等等。然后它還得做出選擇,這里指的是棒球隊還是橄欖球隊?用戶是想知道這支隊伍的主場體育場還是像了解它下周去哪里打比賽?Google 通過信號和此前的用戶行為去構(gòu)建答案。這些理解、判斷、推理都是幾年前 Google 沒有做過的。
一旦清除了這些障礙,Google 的 NLP 系統(tǒng)就能從知識圖中獲得更大的推力,開始逐漸理解世界。包括在用戶措辭不佳甚至表達(dá)混亂的情況下揣摩用戶想問什么。比方說用戶在手機(jī)上輸入“戴維?卡梅倫”時系統(tǒng)已經(jīng)知道這兩個詞是配對的,知道這是一個人—然后賦予代詞“他”。哪怕麥克風(fēng)捕捉不到姓氏,知識圖也能斷定這位英國總理是主題。
Google懂得越多,就能更好地理解你
2004 年,我問 Larry Page 和 Sergey Brin 對搜索的長期愿景是什么。Larry說,搜索應(yīng)該被包含進(jìn)人的大腦里。“當(dāng)你思考某件東西時如果不太了解的話,你可以自動獲得信息。” Sergey 指出,關(guān)鍵點在于:“你有對話的設(shè)備,或者留意周圍發(fā)生的事的計算機(jī),從而可以提供有用的信息。”
2010 年,兩位 Android 工程師 Baris Gultekin 和 Andrew Kirsme 倒騰的一個“20%(注:Google 的 70/20/10 時間分配原則)”項目跟這一愿景的精神非常一致,于是就誕生了后來的 Google Now。
根據(jù) Gultekin 的說法,目前的 Google Now 與他們最初的設(shè)想也保持著高度的一致。“其核心觀點是你現(xiàn)在的手機(jī)并不智能,但是是可以做到智能的,”他說:“如果我們能夠把可感知、可連接的強(qiáng)大設(shè)備與 Google 的威力結(jié)合到一起的話會怎樣?”
換言之,Google Now 可回答你太懶或沒時間問的查詢。這意味著要通過多領(lǐng)域信息的結(jié)合來處理某件重要的事。Gultekin 說一開始要建立這樣一套系統(tǒng)去做這樣的事是很恐怖的,但他和伙伴先把目標(biāo)分解成一個領(lǐng)域,通勤。但即便這樣一件有限的事情也需要系統(tǒng)具備大量的知識:家和辦公室的位置,最佳往返路線,交通模式。當(dāng)然,Google Maps(以及后來的 Waze)知道如何導(dǎo)航是關(guān)鍵。Google 調(diào)用所有的力量去增強(qiáng)這一搜索工具。不久之后,他們有了一款可靠的 app 來幫助通勤者。“不過我們不希望這只是一款通勤 app,” Gultekin 說:“我們希望它成為一位主動的助手,能幫助處理很多事情。”2012 年 7 月,Google Now 發(fā)布,當(dāng)時具備 7 個領(lǐng)域知識:通勤、飛行、體育、附近地方、旅游、公交以及天氣。現(xiàn)在 Google Now 的領(lǐng)域已經(jīng)增加到 70 個,且還在快速增長。“我希望 Google Now 能夠提供你所需的大部分信息,其他的 app 只有在 Google Now 沒有你所需的東西時才用,” Gultekin 說。
Google Now的效率取決于對世界的深度知識(這個Google搜索和知識圖可以提供)與大量個人信息的整合。這正是為什么有人會提出搜索的這個子集實際上是 Google 本身的借代:每次它都會提供一張即時信息“卡片”。Google Now 吸收了一大批的 Google 服務(wù)。一張典型的卡片往往結(jié)合了個人郵件、日程表、通信錄、交通安排、交通信息以及天氣等信息。
大家往往不知道 Google Now 是做什么的,直到它做了。比方說,你停車時,Google Now 會記錄下你停止行駛了,并記住你在什么地方離開了車子—以防你忘了車子停在哪里。如果郵件告訴 Google Now 你在找房子,它可能就會推送一些你希望居住地區(qū)的待售房產(chǎn)。
隨著 Google Now 的不斷演變,現(xiàn)在它已經(jīng)從 20% 項目變成了全職服務(wù)。不過給 Google Now 的發(fā)展提供最大動力的也許是蘋果。2011 年,蘋果發(fā)布了 Siri,給 Google 總部造成了一點點的恐慌,從而加大了這一語音助手項目的投入。隨后它變成了搜索部門的官方組成部分,盡管團(tuán)隊仍同時分屬搜索和 Android。當(dāng)然這種安排也是合適的,除了推送給用戶的非查詢消息外,所有的個人信息最終都會為登錄用戶的搜索框所利用(目前可做到“送我上班要多久?”很快將實現(xiàn)“我的車在哪里?”)。搜索和 Google Now 非常具有互補(bǔ)性,Gultekin 說:“我們希望在你開始搜索前就提供信息,但還是會有很多情況是我們不知道的,比方說你的水管爆了,你需要管道工。” (當(dāng)然,未來通過 Google 收購的智能家庭平臺 Nest,Google 有可能會知道這一點的。)
與舊版搜索相比,Google Now化的搜索只有在使用全系Google產(chǎn)品時才能發(fā)揮最大效用。“Larry 有個說法—‘搜索應(yīng)該理解你的意思并提供你想要的東西,’” Yehoshua 說:“這是一個 Google 生態(tài)體系—如果你登錄手機(jī)和桌面,我們可以利用這一點。如果你希望獲得飛行信息,跟蹤包裹以及任何我們可從 Gmail 獲得的信息,你都可以得到。如果你不用 Gmail(當(dāng)然你不會),你仍然可以獲得我們豐富的語音和回答等等。”
沒有繞行方式—如果你想用 Google,但 Gmail 不是你的首選,那就無法獲得 Google Now 或甚至 Google 搜索的全部價值。“生活在一個我們能夠分享所有這些信息的世界里將是非常美好的,” Yehoshua 說:“我不認(rèn)為明天就會實現(xiàn)。蘋果做起來會好點,但我們實現(xiàn)會更加困難。”
Google有意識地不把Google Now當(dāng)作獨立產(chǎn)品。相反,它把Now包含進(jìn)搜索app里面。而app本身也不叫“搜索”,很簡單,就叫“Google”。這種取名方式不僅說明了搜索與Google關(guān)系之緊密,也說明了Google Now對公司的重要。
盡管如此,Google Now 組件還是可選的。使用前 Google 會提出隱私方面的警告,而該產(chǎn)品的無所不知也可能會成為令人不安的提醒器,告訴我們這家巨頭對我們的了解有多少。Google 掌握我們的個人信息越多,它惹上的麻煩也越多—尤其是在歐洲,加強(qiáng)監(jiān)管、巨額罰款甚至解體威脅一個沒落,其服務(wù)我們的抱負(fù)也許會被對隱私的擔(dān)憂挫敗。哪怕是那些相信 Google 的人,在斯諾登披露政府如何輕易獲得我們的信息之后也無法淡定了。如果 Google Now 知道你在哪里停的車的話,當(dāng)?shù)氐那閳髾C(jī)構(gòu)是不是也一樣知道?
Amit Singhal 認(rèn)為,第一代搜索是在人與遠(yuǎn)端機(jī)器的交互之間隔著一道墻。而我們逐步進(jìn)入的搜索新時代將會打破這堵墻,這與把移動設(shè)備當(dāng)作電子人化的附體是同步的。我們預(yù)期手機(jī)會知道我們的意思。我們預(yù)計搜索既精通于提供包含我們個人信息的答案,又能從網(wǎng)頁、文檔及公共數(shù)據(jù)庫中挖掘事實。
“我把搜索視為一切計算的接口,”Singhal 說:“設(shè)備消失或最小化或融入環(huán)境之后,你又如何跟它們交互呢?因為大多數(shù)時候,你需要采取行動—或者簡單如播放音樂,或者復(fù)雜點,寫備忘錄提醒自己來到小賣部附近時記得買牛奶?;蛘吣銜?lsquo;我老婆的航班是否準(zhǔn)時?’或者“奧巴馬有多高?”之類的問題”
大家也許會把過去當(dāng)作理所當(dāng)然—抱怨 Google 搜索已經(jīng)不像以前那樣。但 Singhal 指出,Google 搜索已經(jīng)越過了那道橫亙在他面前幾十年的障礙。“作為一名研究人員我攻關(guān)了 20 年都沒有成功,”Singhal 說。他指的就是他的團(tuán)隊在 Google 搜索上面所取得的成就。但他也承認(rèn),還有比現(xiàn)在多得多的問題有待解決。但在描述某類他不再失敗的查詢背后的科學(xué)時,他的聲音充滿了自豪。對了,那個問題就是:
天為什么是藍(lán)的?