Mehanna所說的“機器學(xué)習(xí)平臺”,是將人工智能從上個世紀的“寒冬”變?yōu)楝F(xiàn)在蓬勃發(fā)展的模仿人類大腦行為的范式應(yīng)用。在廣告領(lǐng)域,F(xiàn)acebook需要的是一個人類工作無法實現(xiàn)的系統(tǒng):對廣告點擊人數(shù)的即時預(yù)測。Candela和他的團隊要基于機器學(xué)習(xí)的方法創(chuàng)造出這個新系統(tǒng)。并且,因為他們想要將這個系統(tǒng)建成一個平臺,他們的模型和訓(xùn)練必須具有一般性和可復(fù)制性。
建立機器學(xué)習(xí)平臺的一個重要因素是高質(zhì)量數(shù)據(jù)的獲取,越多越好。幸運的是,這正是Facebook一項最大的資產(chǎn):當超過十億人每天與Facebook的產(chǎn)品互動時,它可以為他們的訓(xùn)練收集大量數(shù)據(jù),并且當他們開始測試時,會有取之不盡的用戶行為樣本。這使得廣告團隊進展很快,從每幾周推出一個新模型到每周推出一個新模型。另外,因為系統(tǒng)最終會成建成一個平臺,公司內(nèi)部會使用平臺來設(shè)計自己的產(chǎn)品,Candela設(shè)計了一個多團隊同時工作的方法——一個簡潔的三步過程:“首先關(guān)注績效,接著是效用,最后建立一個社區(qū)”。
Candela的廣告團隊已經(jīng)證明了機器學(xué)習(xí)可以為Facebook帶來多大的變革力量。他說:“我們在預(yù)測廣告點擊率上取得了巨大成功,就像是一次大轉(zhuǎn)變。”所以將這個方法擴展到更大的服務(wù)中是很自然的事情。事實上,F(xiàn)AIR的領(lǐng)導(dǎo)LeCun已經(jīng)在爭取建立一個伙伴團隊,將人工智能應(yīng)用在公司產(chǎn)品中,將機器學(xué)習(xí)的方法更廣泛地應(yīng)用在公司運營中。LeCun說:“我正在為此努力,因為我們需要高素質(zhì)的工程師,雖然他們不直接與產(chǎn)品打交道,但產(chǎn)品團隊卻需要他們提供技術(shù)基矗”
2015年10月,Candela成為了新的AML團隊主管(在一段時間內(nèi),他還同時兼任著廣告團隊的負責(zé)人)。他與FAIR團隊保持著密切的聯(lián)系。雖然FAIR在紐約、巴黎和門洛帕克市都有辦公地,但實際上他們的成員就坐在AML工程師旁邊。
他們合作的方式可以用一個正在運行中的產(chǎn)品來說明,該產(chǎn)品是Facebook上對照片進行語音描述功能。過去的5年中,訓(xùn)練系統(tǒng)識別屏幕中的物體并給出一般性結(jié)論(比如照片是在室內(nèi)還是室外拍攝)已經(jīng)成為了人工智能訓(xùn)練的普遍標準。但是最近,F(xiàn)AIR的科學(xué)家們發(fā)現(xiàn)了一個方法,可以訓(xùn)練神經(jīng)網(wǎng)絡(luò)在圖像中變出每一個物體并判斷他們之間的位置和關(guān)系,進而理解整個圖像的含義,比如分析出圖中人們正在擁抱,或者有人正在騎馬。LeCun說:“我們將這個方法展示給AML團隊,他們思考了一會兒,說‘在一種情形下,這項技術(shù)會非常有用’。”于是,一個幫助盲人或視力低下的人“閱讀”圖片的功能原型出現(xiàn)了。Candela談到他的姐妹團隊:“我們一直在交流。更大的挑戰(zhàn)是將科學(xué)技術(shù)轉(zhuǎn)化成產(chǎn)品,這需要粘合劑,而我們就是這個粘合劑。”
Candela將人工智能的應(yīng)用分為四個部分:視覺、語言、談話和照相機特效。他認為這四個部分會產(chǎn)生一個“理解內(nèi)容的機器”。通過研究如何明白內(nèi)容的含義,F(xiàn)acebook可以從評論中、話語的細微變化中探查隱含的意思,在視頻中識別出你朋友一閃而過的面孔,在你真實的會話中解譯你的表達。
Candela說:“我們正在使人工智能一般化。在內(nèi)容激增的今天,我們需要理解和分析內(nèi)容,否則我們貼標簽的能力就會跟不時代了。”而解決方法就在于建立一個普遍性的系統(tǒng),使得一個項目的工作可以為相關(guān)項目的工作提供幫助。他說:“如果我能將其他項目的成果轉(zhuǎn)移來構(gòu)建我自己的算法,豈不是非常棒?” 這樣的轉(zhuǎn)變讓Facebook產(chǎn)品上新的速度飛速提升。拿Instagram舉例:最開始的時候,用戶展示的照片是按照時間順序反向排序的。但是在2016年初,公司決定使用算法將照片按照相關(guān)性來排列。好消息是因為AML已經(jīng)完成了類似于News Feed動態(tài)信息流中的機器學(xué)習(xí)部分,所以“他們不用從抓取數(shù)據(jù)開始做起“,Candela說,“他們有一兩個熟悉機器學(xué)習(xí)的工程師負責(zé)聯(lián)系其他運作排序類應(yīng)用的團隊,所以他們可以直接復(fù)制那些團隊的工作流程,出現(xiàn)問題的時候也可以去詢問他們。”于是,Instagram在幾個月內(nèi)就完成了這個劃時代的轉(zhuǎn)變。