長(zhǎng)久以來Google的旗艦產(chǎn)品已成為我們生活的一部分。但Google并不認(rèn)為搜索理所當(dāng)然就應(yīng)該是那樣的。此文編譯自《In The Plex : How Google thinks, Works, and Shapes Our Lives》作者Steven Levy的文章,是有關(guān)Google搜索變革研究的第一部分。
天為什么是藍(lán)的?
小孩經(jīng)常問這個(gè)問題,但是很少有家長(zhǎng)在不需要幫助的情況下能回答得上。不久以前,找到正確的答案至少需要鉆研百科全書,甚至還需要跑一趟圖書館。不過最近,爸爸媽媽只需要打開電腦,Google 一下,點(diǎn)擊鏈接,問題的回答就呈現(xiàn)在面前,然后父母閱讀一下解釋,再用小孩可以理解的方式闡述一遍即可。
但到了 2015,甚至這種看似快捷的過程也算不上快了。首先,在移動(dòng)設(shè)備上問題的提出更有可能是通過口述而不是在搜索框敲字。其次,盡管從一堆鏈接排序中選擇最相關(guān)者仍然是特定查詢的有效辦法,那些有著明確定義問題(如天空為什么是藍(lán)的)的人更希望馬上知道答案。如果 Google 不能馬上提供答案,這些人就會(huì)失望、甚至憤怒。
那么……“好吧,Google……為什么天是藍(lán)的?”
對(duì)于 Google 最近幾年對(duì)搜索進(jìn)行的變革,Google 搜索團(tuán)隊(duì)負(fù)責(zé)人 Amit Singhal 以飛機(jī)空中更換引擎來打比方,其改動(dòng)包括排名算法,添加新的企業(yè)信息,以及在用戶完成問題輸入前開始搜索等。除了引擎切換以外,在移動(dòng)搜索即將超越桌面搜索的大背景下,Google 也在考慮對(duì)“座艙”—使用界面進(jìn)行徹底的重新設(shè)計(jì),甚至考慮整個(gè)使命的重新定位。
搜索一直是公司的旗艦產(chǎn)品,搜索廣告仍是公司的主要收入來源,Google 對(duì)搜索的重視跟外界對(duì) Google 的關(guān)注點(diǎn)是不一樣的。現(xiàn)在開始有人質(zhì)疑 Google 搜索在走下坡路(參見Google統(tǒng)治終結(jié)了嗎)。理由包括:1)垃圾結(jié)果太多 2)過分強(qiáng)調(diào)信息的更新度而非相關(guān)性等。Singhal 強(qiáng)烈抨擊這種言論,認(rèn)為說法與事實(shí)完全相反,Google 的搜索做得比 2 年前好得多,那些批評(píng)者陷入的是一股對(duì)過去的懷舊情緒。
盡管如此,F(xiàn)acebook 的社交網(wǎng)絡(luò)屏蔽 Google 的爬蟲抓取信息令 Singhal 感到憂心忡忡,擔(dān)心封閉的網(wǎng)絡(luò)會(huì)威脅到 Google 的地位。但事實(shí)證明他過過慮了。Facebook 的 Graph Search 仍非常稚嫩,對(duì) Google 幾乎沒什么影響。微軟的 Bing 在搜索質(zhì)量上有得一比,但市場(chǎng)份額不到 1/5。在基礎(chǔ)設(shè)施、人才厚度、經(jīng)驗(yàn)、雄心等方面沒有競(jìng)爭(zhēng)對(duì)手可以與 Google 匹敵。G+ 盡管遠(yuǎn)未能成為引起轟動(dòng)的社交網(wǎng)絡(luò),但的確吸引了許多搜索用戶的加入。
要說到威脅,Google 搜索最大的威脅并不是來自于競(jìng)爭(zhēng)對(duì)手,而是搜索對(duì)象的變化—從 web 遷移到了星羅密布的 app 孤島。不過 Google 認(rèn)為這種情況自己是可以克服的—畢竟開發(fā)者跟網(wǎng)站站長(zhǎng)一樣希望自己的信息被發(fā)現(xiàn)。從 2013 年秋,Google 開始設(shè)立 App Indexing 將移動(dòng) app 內(nèi)的數(shù)據(jù)納入整個(gè)索引內(nèi)?,F(xiàn)在已經(jīng)有 15% 的 Android 登錄用戶可獲得含 app 內(nèi)信息的搜索結(jié)果。但是 iOS app 是一個(gè)很大的坑。
目前抓取 app 信息的挑戰(zhàn)尚未影響 Google 的搜索統(tǒng)治地位。Google 每天接受的搜索查詢超過 30 億次,每年執(zhí)行的搜索超1萬億次。美國(guó) 2/3 的搜索用的是 Google,在全球其他地區(qū)(中國(guó)除外)情況類似。最近 Google 搜索份額的變化只是因?yàn)閅ahoo跟Firefox的默認(rèn)搜索引擎交易導(dǎo)致的。而且 Google 還拿到了 80% 的移動(dòng)搜索份額。2013 年 Google 出現(xiàn)了 5 分鐘的中斷的結(jié)果是全球流量下挫了 40%!
盡管搜索不是外界關(guān)注 Google 的熱點(diǎn),但它本身卻正在進(jìn)行穩(wěn)步而密集的再造。實(shí)際上 17 年的時(shí)間里 Google 從未停止對(duì)搜索的改進(jìn),但最近幾年 Google 搜索變革的速度明顯加快,為的是保持領(lǐng)先優(yōu)勢(shì)。
其中的一些變化用戶已經(jīng)有所體會(huì)。搜索更快了、內(nèi)容更新了、更加社會(huì)化了、結(jié)果呈現(xiàn)更加豐富了。這些變化不是一夜之間完成的,而是 Google 持續(xù)不斷的升級(jí)改進(jìn)的結(jié)果。Google 每周都要開搜索質(zhì)量協(xié)調(diào)會(huì),對(duì)算法進(jìn)行微調(diào)。每 2、3 年都要對(duì)排名系統(tǒng)進(jìn)行重大升級(jí),最近一次的代號(hào)為 Hummingbird。據(jù)稱過去 3 年排名系統(tǒng)進(jìn)行的改動(dòng)要比此前 13 年的加起來還要多。
Google 搜索的變革主要體現(xiàn)在三個(gè)方面:知識(shí)圖、語音搜索和 Google Now。知識(shí)圖把全球的信息組織為一個(gè)浩瀚的數(shù)據(jù)庫(kù);語音搜索把口語吸收進(jìn)了搜索;而 Google Now 則提供了未問先答的能力。這三大變化都與 Google 聚焦于移動(dòng)有關(guān)。
知識(shí)圖(Knowledge Graph)
知識(shí)圖譜的推出源自對(duì) MetaWeb 的收購(gòu)。MetaWeb 2005 年由知名計(jì)算機(jī)科學(xué)家與創(chuàng)業(yè)者 Danny Hillis 創(chuàng)辦,2007 年推出。做的是語義網(wǎng)。MetaWeb 做的事情也是通過掃描互聯(lián)網(wǎng)去回答問題,它擁有 1200 條人、地點(diǎn)與事物的實(shí)體記錄,一度被認(rèn)為是 Google 的競(jìng)爭(zhēng)對(duì)手。不過最終 Hillis 意識(shí)到只有在 Google 的大樹下自己搭建全球信息數(shù)據(jù)庫(kù)的宏偉目標(biāo)才能實(shí)現(xiàn)。而彼時(shí)盡管 Google 也提供了一些問題(比方說奧巴馬生日)的直接答案,但是卻無法回答“西海岸學(xué)費(fèi)低于 3 萬美元的大學(xué)”、“至少獲得過一次奧斯卡獎(jiǎng)的年齡超過 40 的演員”這樣的問題。雙方一拍即合。
Google 意識(shí)到,事物是搜索的重要部分,而讓大眾關(guān)心的事物的事實(shí)與信息迅速呈現(xiàn)是一種很好的方式。于是在 MetaWeb 的基礎(chǔ)上,2012 年 5 月,Google 推出了提供搜索主體關(guān)鍵事實(shí)的知識(shí)圖作為搜索的輔助呈現(xiàn)在搜索結(jié)果頁面的右側(cè)。現(xiàn)在它的條目已經(jīng)超過了 5 億。那么那些搜索結(jié)果會(huì)出現(xiàn)知識(shí)圖呢?Google 會(huì)將查詢?cè)~條擴(kuò)展為其他形式和同義詞等等,然后進(jìn)行算法測(cè)試看看是否與知識(shí)圖(Knowledge Graph)結(jié)果相關(guān),確定相關(guān)后再?gòu)闹袚袢∠嚓P(guān)結(jié)果呈現(xiàn)(比方說敲“達(dá)芬奇”試試)。根據(jù)估計(jì),目前約有 25% 的搜索可喚出知識(shí)圖。
在 Google 搜索與知識(shí)圖整合的這 2 年多的時(shí)間里,知識(shí)圖也在不斷演變。原先它是靜態(tài)的,但現(xiàn)在正慢慢吸納 Google 搜索本身在分析用戶行為方面的學(xué)習(xí)能力。比方說“誰在《太空炮彈》中飾演 Barf?”這樣的問題問多了以后,知識(shí)圖就知道要把演員、電影和情節(jié)等東西列進(jìn)去。
此外在知識(shí)的新鮮度方面知識(shí)圖也有了大幅改進(jìn)。以往知識(shí)的更新最長(zhǎng)可能需要 2 個(gè)星期。但現(xiàn)在系統(tǒng)已經(jīng)能處理新聞,所以更新調(diào)整只需要幾分鐘。
當(dāng)然,Google 的改進(jìn)計(jì)劃還有很多。包括增加知識(shí)域(最近添加了汽車、視頻游戲、雨果文學(xué)獎(jiǎng)得主),提供除簡(jiǎn)單事實(shí)以外更加復(fù)雜的、更主觀性、模糊化的搜索結(jié)果。用戶的興趣點(diǎn)就是改進(jìn)的出發(fā)點(diǎn)。而 Google 最終想要實(shí)現(xiàn)的效果是,讓你不僅覺得跟你對(duì)話的不是冰冷的機(jī)器,而是既無所不知又懂附庸風(fēng)雅的圣人。
但這個(gè)目標(biāo)目前還有點(diǎn)遙遠(yuǎn)。令產(chǎn)品經(jīng)理 Emily Moxley 惱火的是,盡管現(xiàn)在知識(shí)圖已經(jīng)知道一些電視節(jié)目,但卻既缺乏新劇集的信息,也不知道什么時(shí)候上映,在哪里能夠看到。在知識(shí)圖成為圣人之前,Google 需要要先實(shí)現(xiàn)這一“中期目標(biāo)”。
或者這個(gè)要求還有點(diǎn)高。因?yàn)?4 年時(shí)間過去了,Google 至今仍未給出上述那兩個(gè)類似問題(“西海岸學(xué)費(fèi)低于 3 萬美元的大學(xué)”、“至少獲得過一次奧斯卡獎(jiǎng)的年齡超過 40 的演員”)的一站式的答案。知識(shí)圖,任重而道遠(yuǎn)啊。
未完待續(xù)......