中國IDC圈4月15日報道,當你下一次運行 Facebook 時,無論是網(wǎng)頁版還是 App,你可以仔細想一下,個人頁面刷新、家庭相冊瀏覽等這些操作會需要多少計算量,然后再乘以十億用戶,而且每一天都如此。
這不僅是運營一家「財富500強」(第242位)的社交網(wǎng)絡公司,也是在運營異常龐大的支撐各種服務的計算基礎架構,包括處理器、存儲器以及知道用戶各種需求的軟件。
Facebook 為全世界五分之一人口提供服務,而且去年年底,全球32億人口中有超過一半的人成為了互聯(lián)網(wǎng)用戶。此時,這不是一個不理性的問題:地球上有足夠多的人來驅(qū)動這樣一張巨型網(wǎng)絡嗎?
回答是否定的,至少是負擔不起的。這就是 Facebook 求助人工智能的原因。
五年前,F(xiàn)acebook 推出 Open Computer 硬件倡議,他們這么做的原因是為用戶提供 News Feed 服務的成本完全就是產(chǎn)品銷售成本,即便對于這樣一個當時擁有7.4億用戶的網(wǎng)站。因此,打造公司自己的計算基礎架構,讓博文發(fā)布更快,成本更低,成為公司的基礎需求。
Facebook 表示,公司已經(jīng)從對 Open Compute 的投資中節(jié)省了超過20億美元。但在互聯(lián)網(wǎng)領域,五年就是一個時代,如今每個科技巨頭都在設法征服另一個難題。雖然他們可以低成本的提供內(nèi)容服務,但在數(shù)十億博文中,要搞清楚推送哪類內(nèi)容依然有很大挑戰(zhàn)。因此,就像 Facebook 五年前通過 Open Compute 計劃開始重新搭建硬件產(chǎn)業(yè)一樣,最近,公司也創(chuàng)造了一個管理人工智能的內(nèi)部平臺,如此一來,就能精準推送你想看的內(nèi)容。而且,公司也希望將這個「機器學習」平臺規(guī)模化。(「機器學習」是一種人工智能類型,能讓計算機在沒有預編程的前提下學習如何運行。)
「我們正試著打造超過 15 億個人工智能代理(AI agents)--為每個使用 Facebook 或公司其他產(chǎn)品的每一個人服務?!剐陆闪⒌臋C器學習應用組負責人 Joaquin Candela 說,「那我們應該怎么做到呢?」
Candela 說,你要從以前的勝利中汲取靈感。Facebook 的基礎架構團隊也是機器學習應用團隊的靈感之源。
「我們傾向?qū)⒅T如存儲、網(wǎng)絡設計以及計算視為理所當然的事情,」他說,「當視頻小組做直播視頻時,人們并沒有意識到這件事的量級。這很愚蠢。而基礎架構小組就是在那個地方傳遞魔力--將不可能變?yōu)榭赡堋N覀冃枰獙θ斯ぶ悄茏鐾瑯拥氖虑椤R残枰獙⑷斯ぶ悄茏兂赡銈冋J為理所當然的工程結(jié)構中的一部分,如此完整的一部分?!?/p>
去年九月,F(xiàn)acebook 成立了機器學習應用團隊(Applied Machine Learning team)。團隊負責運行一個覆蓋全公司的機器學習內(nèi)部平臺,叫做 FBLearner Flow ,這個平臺就相當于人工智能領域的 Open Computer ,不過最大的區(qū)別在于:它并不會依托于開源硬件來提供給世界。公司說,如果沒有 Facebook 手頭數(shù)據(jù),這個平臺本質(zhì)上沒啥用。
FBLearner Flow 結(jié)合了幾個機器學習模型并用于處理幾十億數(shù)據(jù)點,這些數(shù)據(jù)點來自網(wǎng)站15億用戶的活動,并能對數(shù)千件事情進行預測:圖片中有哪位用戶,哪些可能是垃圾信息。FBLearner Flow 模型創(chuàng)造的算法有助于界定什么樣的內(nèi)容出現(xiàn)在你的動態(tài)消息中,以及你會看到什么樣的廣告。
基于以上內(nèi)容,我們會很容易得出結(jié)論:Facebook 使用人工智能會讓公司13,000雇員中的某些人失去工作。「但現(xiàn)實并沒有什么變化,」公司 CTO Mike Schroepfer 說。人工智能恰恰是在幫助公司提升工程師的能力。他說,「我們能做之前無法做到的事情?!?/p>
Applied Machine Learning 主任 Joaquin Qui?onero Candela
在 Schroepfer 看來,F(xiàn)acebook 經(jīng)常能夠發(fā)現(xiàn)那些好機會,即便自己還沒有能力去征服--至少在人類力量的范圍內(nèi)還無法解決??匆幌鹿咀罱l(fā)起的一項新功能,為視覺受損人提供圖片說明(以讓其「看到」圖片)。如果公司雇人手動為上傳到網(wǎng)絡的每張圖片內(nèi)容做標記,成本會非常高,也無法規(guī)?;?,當然也不可能期待用戶自己來做這個事情。但不管對于視覺受損人士,還是對于 Facebook,這些信息都是有用的?,F(xiàn)在通過使用 FBLearner Flow 平臺上的計算機視覺模型,一臺計算機就能自動梳理數(shù)十億張圖片并給照片加上標簽,并實現(xiàn)了較為理想的準確率。
「它正在讓新應用成為可能,特別是規(guī)?;鉀Q問題。」Schroepfer 說。Facebook 使用這種基于機器學習的辦法來翻譯 News Feed 博文;在用戶看到之前監(jiān)測到網(wǎng)站不合適的內(nèi)容;在打造 M 過程中,公司通過人與機器的結(jié)合去打造一個私人助理。