對(duì)于“機(jī)器學(xué)習(xí)平臺(tái)”,梅漢納是說在基于大腦運(yùn)作方式的模型普及后,那個(gè)將AI帶出上世紀(jì)的寒冬期進(jìn)入近年的綻放時(shí)期的范例的普及。以廣告為例,F(xiàn)acebook需要它的系統(tǒng)做某種沒有人能夠做的事情:即時(shí)且準(zhǔn)確地預(yù)測(cè)有多少人會(huì)點(diǎn)擊給定的廣告。于是坎德拉和他的團(tuán)隊(duì)著手打造一個(gè)基于機(jī)器學(xué)習(xí)程序的新系統(tǒng)。由于該團(tuán)隊(duì)想要將該系統(tǒng)打造成平臺(tái),讓該部門所有的工程師都可以訪問,他們采取了一種讓建模和訓(xùn)練能夠推廣和復(fù)制的建造方式。
打造機(jī)器學(xué)習(xí)系統(tǒng)的一大重要因素是獲得優(yōu)質(zhì)數(shù)據(jù)——越多越好。幸運(yùn)的是,這是Facebook最大的資產(chǎn)之一:當(dāng)你有超過10億人每天使用你的產(chǎn)品,你就可以給你的訓(xùn)練集收集大量的數(shù)據(jù),一旦開始測(cè)試你也可以獲得無數(shù)用戶行為方面的例子。正因?yàn)榇?,廣告團(tuán)隊(duì)能夠加快到每周推出幾個(gè)模型,而不再是每幾周推出一個(gè)新模型。由于要將系統(tǒng)做成平臺(tái)——讓公司內(nèi)部其他的人員也能夠用來開發(fā)他們自己的產(chǎn)品——坎德拉得聯(lián)手?jǐn)?shù)個(gè)團(tuán)隊(duì)來展開工作。這是一個(gè)精細(xì)的分三步走的過程。“你要先專注于性能,再專注于效用,然后專注于打造社區(qū)。”他說道。
坎德拉的廣告團(tuán)隊(duì)證明了機(jī)器學(xué)習(xí)技術(shù)在Facebook的變革性。“我們?cè)陬A(yù)測(cè)點(diǎn)擊、點(diǎn)贊、轉(zhuǎn)換等方面變得極為成功。”他說。將那種模式擴(kuò)展到Facebook平臺(tái)的其它服務(wù)也就成了順理成章的事情。事實(shí)上,F(xiàn)AIR領(lǐng)導(dǎo)者樂昆之前就在呼吁設(shè)立部門來負(fù)責(zé)將AI應(yīng)用到產(chǎn)品當(dāng)中——準(zhǔn)確來說,是在公司內(nèi)部更大范圍地推廣機(jī)器學(xué)習(xí)技術(shù)。“我的確曾呼吁設(shè)立這樣的部門,因?yàn)槟阈枰@樣由優(yōu)秀工程師人才組成的組織專注于可為很多產(chǎn)品部門使用的基礎(chǔ)技術(shù),而不是直接負(fù)責(zé)產(chǎn)品。”樂昆表示。
2015年10月,坎德拉成為新AML團(tuán)隊(duì)的主管(有一段時(shí)間,出于謹(jǐn)慎起見,他保留他在廣告部門的職位,在兩個(gè)職位之間穿梭)。他與FAIR保持緊密的聯(lián)系。FAIR在紐約市、巴黎和門洛帕克均設(shè)有辦事處,在門洛帕克它的研究人員實(shí)際上就在AML工程師的旁邊工作。
AML和FAIR之間的協(xié)作,從一個(gè)給用戶分享的照片提供語音描述的研發(fā)中的產(chǎn)品可見一斑。在過去的幾年里,訓(xùn)練系統(tǒng)識(shí)別場(chǎng)景中的物品或者做出一般性的結(jié)論,如照片是在室內(nèi)還是室外拍的,已經(jīng)成為了標(biāo)準(zhǔn)的AI慣例。但最近,F(xiàn)AIR的科學(xué)家找到方法來訓(xùn)練神經(jīng)網(wǎng)絡(luò)描述圖像中幾乎所有的有趣物體,然后根據(jù)物體的位置和相對(duì)其它物體的位置來判斷照片是關(guān)于什么的——實(shí)際上是通過分析姿勢(shì)來判斷特定照片里人們是在擁抱,還是在騎馬。“我們給AML部門展示了這項(xiàng)技術(shù),”樂昆說,“他們想了想,說,‘在這種情境中,那個(gè)技術(shù)會(huì)很有用。’”最終他們做出了一項(xiàng)可造福盲人或者視覺障礙著的功能原型,用戶指向圖像,就能讓他們的手機(jī)通過語音給他們描述圖像的內(nèi)容。
“我們一直都在溝通,”坎德拉如是說到他的兄弟團(tuán)隊(duì),“總的來說,要從科學(xué)技術(shù)發(fā)展到實(shí)際的項(xiàng)目,你需要粘合劑對(duì)吧?我們就是粘合劑。”
AI的四個(gè)應(yīng)用領(lǐng)域
坎德拉將AI的應(yīng)用分成四個(gè)領(lǐng)域:視覺、語言、語音和攝像效果。他表示,所有的這些東西將會(huì)帶來“內(nèi)容理解引擎。”通過研究如何理解平臺(tái)內(nèi)容的意思,F(xiàn)acebook想要從評(píng)論中檢測(cè)出微妙的意圖,從口語中提取出細(xì)微的東西,鑒別你在視頻中快速出現(xiàn)的朋友的面孔,解讀你的表情,然后將它們反映在你在虛擬現(xiàn)實(shí)場(chǎng)景中的化身。
“我們?cè)谘芯緼I的普遍化。”坎德拉說,“隨著內(nèi)容的爆炸性增長(zhǎng),我們需要提升理解和分析能力。”解決方案就在于打造普遍化的系統(tǒng),使得一個(gè)項(xiàng)目的成功能夠積累起來,讓其它研究相關(guān)項(xiàng)目的團(tuán)隊(duì)能夠受益。坎德拉稱,“如果我能夠打造出可將知識(shí)從一項(xiàng)任務(wù)轉(zhuǎn)移到另一項(xiàng)的算法,那會(huì)很美妙,是吧?”
那種知識(shí)轉(zhuǎn)移能夠大大加快Facebook推出產(chǎn)品的速度。以Instagram為例。自上線以來,該照片分享服務(wù)就以時(shí)間倒序的形式來顯示用戶的照片。但2016年年初,它決定使用算法來按照相關(guān)性將照片排序。坎德拉指出,好消息是,由于AML已經(jīng)在像動(dòng)態(tài)消息(News Feed)這樣的產(chǎn)品中實(shí)施過機(jī)器學(xué)習(xí)技術(shù),“Instagram不必從頭開始做。”他還說,“他們讓一兩個(gè)精通機(jī)器學(xué)習(xí)的工程師聯(lián)系部分其它在運(yùn)行某種內(nèi)容排序應(yīng)用的團(tuán)隊(duì)。然后,你可以直接將工作流程復(fù)制過來,有什么問題就問對(duì)方。”正因?yàn)榇?,Instagram短短幾個(gè)月就能夠?qū)嵤┻@一重大變動(dòng)。