AML團隊一直都在尋找它的神經(jīng)網(wǎng)絡(luò)技術(shù)能夠跟多個其它團隊的技術(shù)相結(jié)合的使用案例,以打造適用于整個Facebook平臺的獨特功能。“我們利用機器學(xué)習(xí)技術(shù)來打造我們的核心功能和取悅我們的用戶。”AML感知團隊首席工程師湯墨·雷范德(Tommer Leyvand)說。(他也曾供職于微軟。)
其中一個案例是最近的一項名為社交推薦的功能。大約一年前,AML的一位工程師和Facebook分享團隊的一位產(chǎn)品經(jīng)理在討論人們叫朋友推薦本地的美食或者服務(wù)時活躍度很高。“問題在于,你要如何將相關(guān)內(nèi)容呈現(xiàn)給用戶呢?”AML自然語言團隊產(chǎn)品經(jīng)理麗塔·阿基諾(Rita Aquino)說道。為此,該共享團隊一直在嘗試匹配推薦請求相關(guān)的特定用語。“鑒于你一天有10億條帖子,那不一定很準(zhǔn)確,不一定可擴展。”阿基諾指出。通過訓(xùn)練神經(jīng)網(wǎng)絡(luò)和用用戶的實時行為測試模型,該團隊能夠檢測出非常細微的語言差別,因而能夠準(zhǔn)確檢測用戶是在問特定區(qū)域哪里有美食,還是問該在哪里買鞋子。那會觸發(fā)請求出現(xiàn)在動態(tài)消息的合適聯(lián)系人上。接下來的一步同樣由機器學(xué)習(xí)驅(qū)動,是判斷出用戶在提供似乎合理的推薦,在用戶的動態(tài)消息中顯示商家的位置或者餐館在地圖上的位置。
阿基諾稱,在她進入Facebook后的一年半里,AI已經(jīng)從鮮少出現(xiàn)在公司的產(chǎn)品當(dāng)中,變成產(chǎn)品從開發(fā)之初就要引入。“人們希望他們所使用的產(chǎn)品變得更加智能。”她說,“團隊們看到像社交推薦這樣的產(chǎn)品,看到我們的代碼,就會說‘我們要如何做這個?’你不必成為機器學(xué)習(xí)專家就能夠為你的團隊帶來這樣的技術(shù)。”以自然語言處理為例,該團隊打造了一個其它團隊也能夠輕松接入的系統(tǒng),該系統(tǒng)名為Deep Text。它有助于驅(qū)動Facebook每天為逾40億帖子使用的翻譯功能背后的機器學(xué)習(xí)技術(shù)。
對于圖像和視頻,AML團隊打造了名為Lumos的機器學(xué)習(xí)視覺平臺。Lumos在馬諾哈爾·帕魯里(Manohar Paluri)當(dāng)初在FAIR做實習(xí)生時打造的,他將該大型機器學(xué)習(xí)視覺平臺稱之為Facebook的視覺皮層——處理和理解Facebook上發(fā)布的所有圖像和視頻的方式。在2014年的一次黑客松中,帕魯里和同事尼基爾·約里(Nikhil Johri)一同在一天半內(nèi)打造出了原型,并給非常興奮的扎克伯格和Facebook首席運營官謝麗爾·桑德伯格(Sheryl Sandberg)展示了他們的成果??驳吕_始在AML工作時,帕魯里便加盟,領(lǐng)導(dǎo)計算機視覺團隊,打造Lumos來幫助Facebook所有的工程師(包括Instagram、Messenger、WhatsApp、Oculus等產(chǎn)品的工程師)利用該視覺皮層。
“有了Lumos,公司任何人都能夠使用來自這些不同的神經(jīng)網(wǎng)絡(luò)的功能,針對他們特定的場景打造模型,看看模型是否奏效。”同時在AML和FAIR任職的帕魯里指出,“然后,他們可以派一個人修正系統(tǒng),對它進行重新訓(xùn)練和推送,完全不需要AML團隊的人參與進來。”
帕魯里快速地給我演示了一下。他打開他筆記本上的Lumos,然后我們開始做一項樣本任務(wù):改進神經(jīng)網(wǎng)絡(luò)識別直升飛機的能力。一個布滿圖片的頁面(不斷滾動下去,共有5000張圖片)出現(xiàn)在屏幕上,滿是直升飛機和直升飛機以外物品的圖片。對于這些數(shù)據(jù)集,F(xiàn)acebook采用的是來自旗下資產(chǎn)公開發(fā)布的圖片。雖然我不是工程師,更不是AI專家,但點擊那些錯誤例子來“訓(xùn)練直升飛機圖像分類器”對我來說也并不困難。
“智能應(yīng)用開發(fā)將快上百倍”
最終,這個“分類”步驟(被稱為監(jiān)督式學(xué)習(xí))可能會被自動化,因為該公司在追求機器學(xué)習(xí)的圣杯:“非監(jiān)督式學(xué)習(xí)”,神經(jīng)網(wǎng)絡(luò)能夠自行判斷那些圖像里面有什么東西。帕魯里說,公司正在取得進展。“我們的目標(biāo)是,未來一年將人工標(biāo)注的數(shù)量減少100倍。”
長期而言,F(xiàn)acebook將會為將視覺皮層和自然語言平臺融合起來,以實現(xiàn)坎德拉所說的普遍性內(nèi)容理解引擎。“毫無疑問,我們將會把它們結(jié)合起來。”帕魯里說。
最終,F(xiàn)acebook希望,它用于其進展的核心原則將會通過期刊論文等形式在公司以外流傳開來,使得它的普遍化做法能夠更大范圍地推廣機器學(xué)習(xí)技術(shù)。“你能夠大大加快智能應(yīng)用開發(fā)速度,而不再需要花費好些年的時間。”梅漢納指出,“想象這對于醫(yī)療、安全、交通等行業(yè)的影響吧。我想,在那些領(lǐng)域打造應(yīng)用未來將要快上百倍以上。”