Facebook 并非唯一一家實驗人工智能的大型互聯(lián)網(wǎng)公司。谷歌、亞馬遜、 微軟和 百度都在相關(guān)技術(shù)上注入重資。隨著我們將更多的日常生活托付給數(shù)字王國,這一點將變得越來越明顯:那些建造了我們所依賴(日常信息、社交和多媒體等)的網(wǎng)站的那些人已經(jīng)無法勝任后續(xù)工作了,讓機器登場 。
自上個月起,大約有750 名Facebook 工程師和 40 個不同產(chǎn)品團隊正在使用 FBLearner Flow 平臺。公司希望截至到六月底,會有 1000 名工程師使用這個平臺。Facebook 最終想要建立一個對非工程師人員來說也非常容易使用的機器學(xué)習(xí)工具,盡管距離這一目標(biāo)還很遙遠。
機器學(xué)習(xí)迅速變成最火的人工智能形式,也是人工智能的--隨著新計算技術(shù)出現(xiàn),近期,這個有著幾十年歷史的科幻電影的標(biāo)配歷經(jīng)了一次重生--組成部件。隨著計算機系統(tǒng)越來越大、越來越復(fù)雜,很明顯的是:它已不足以支撐計算機如何詮釋數(shù)據(jù)的硬編規(guī)則(hard-code rules)。依據(jù)圣經(jīng)的勸告去教一個人釣魚--或者在這種情況下,教計算機如何詮釋自己的數(shù)據(jù),要更加容易得多。
計算機學(xué)家使用各樣的工具教計算機學(xué)習(xí)。如今絕大多數(shù)努力集中在「監(jiān)督學(xué)習(xí)」上,研究人員以現(xiàn)有的數(shù)據(jù)集為基礎(chǔ)建立一個機器學(xué)習(xí)算法,用來訓(xùn)練計算機。比如,教計算機識別面部,你最好用不同面部數(shù)據(jù)庫訓(xùn)練它,計算機就能學(xué)會如何分辨不同的人臉。機器學(xué)習(xí)的圣杯是「無監(jiān)督學(xué)習(xí)」,計算機只得到數(shù)據(jù)類,自己建立模型對數(shù)據(jù)進行分類。換言之,不同于直接給計算機學(xué)習(xí)的人臉圖像,計算機得到圖像后要把相似數(shù)據(jù)聚類,從中推導(dǎo)出問題圖片上的圖像是否是人臉。
無監(jiān)督學(xué)習(xí)就是人類學(xué)習(xí)的方式,而且 Facebook 已經(jīng)直言不諱得表明,自己努力教授計算機通識。大部分工作都由Facebook 人工智能研究室(Facebook Artificial Intelligence Research,FAIR)團進行。FAIR成立于 2013 年底,是一個進行基礎(chǔ)研究的地方。它與應(yīng)用機器學(xué)習(xí)團隊相對獨立存在,盡管這里進行的一些研究在 FBLearner Flow 上找到了用武之地。
Facebook 的 CTO Mike Schroepfer
就像 Candela 解釋的那樣,你可以把 AML 團隊視為 FAIR 的商業(yè)化部門。這里的深度科學(xué)慢慢滲入到服務(wù)于十憶用戶的產(chǎn)品中。除了它做不到的時候。Schroepfer 說,在這里,并不是所有的研究都要將深度科學(xué)運用到某個產(chǎn)品中,盡管他警告說,F(xiàn)AIR(有 50 位研究人員)和 AML (雇傭了 100 位研究人員)已經(jīng)自己支付了費用。
比如,在自家翻譯模型的支持下,F(xiàn)acebook 現(xiàn)在每天使用機器學(xué)習(xí)翻譯20億條 News Feed 條目,不再依賴微軟必應(yīng)的翻譯服務(wù)。Facebook 也使用 AML 團隊的平臺,在衛(wèi)星圖像上應(yīng)用計算機視覺模型繪制人口密度地圖,最終確定發(fā)展中國家的哪些地方需要寬帶服務(wù)。而且在視頻添加說明的嘗試已被證明是越來越受歡迎的,因為分享和點贊增加了 15%,瀏覽時間增加了 40%。
這些是 Facebook AML 團隊最新成果中的一部分,但是,他們已經(jīng)在建立機器學(xué)習(xí)算法上花了十年時間:2016 年,他們第一次嘗試在 News Feed 上使用深度學(xué)習(xí)。
「News Feed 是我們第一次為用戶嘗試這項艱難的工作」Schroepfer 說。這是初步的嘗試,Schroepfer 表示,但即使這樣,F(xiàn)acebook 雇傭再多的編輯人員也不能滿足百萬用戶所需的 News Feeds。
從此,這家公司對機器學(xué)習(xí)的使用日趨先進。但是,直到去年六月份Facebook 圖片分享服務(wù) Moment 發(fā)布,公司才真正開始公開討論對機器學(xué)習(xí)的深入研究如何正在影響新產(chǎn)品。Moments 使用了 Facebook 圖像識別模型,能讓用戶創(chuàng)造面向選定組群開放的私人相冊,比如,只對照片中的人公開。
產(chǎn)品發(fā)布時,F(xiàn)acebook 說它的圖像識別模型識別人臉準確率高達 98%,即使不是正對相機的面部圖像。它還表示,模型能在 5 秒內(nèi),從 8 億圖片中識別出某張圖片中的人。
人們 對此感到害怕。本來是想以一種半隱私的方式輕松分享圖片,結(jié)果惹惱了許多用戶。這一功能迫使用戶面對這樣一個不安的事實:Facebook 能從 十億多的用戶中識別出他們,而且速度還快的不正常。Facebook 甚至不能在歐洲發(fā)布這一功能,因為觸及有關(guān)隱私和面部識別技術(shù)的相關(guān)法規(guī)。
對隱私的擔(dān)心顯露出機器學(xué)習(xí)利他主義的陰暗一面。數(shù)據(jù)驅(qū)動下的功能,讓 Facebook 的產(chǎn)品用起來更方便。但是,它們也讓公司得以維系用戶對平臺的持續(xù)使用,這也反過來讓其賣出更多、更有效的廣告。