傳播免費(fèi)的AI技術(shù)——開源
在Facebook目前已經(jīng)開源的AI清單中,既包括軟件,也包括硬件。
先說說它的硬件開源。去年年底,F(xiàn)acebook宣布開源它的AI硬件平臺(tái)Big Sur。Big Sur的設(shè)計(jì)特點(diǎn)是主板易于維修,帶有8個(gè)NVIDIA(英偉達(dá))的Tesla M40 GPU(GPU是用于深度學(xué)習(xí)算法的微處理器,每個(gè)GPU包含數(shù)十個(gè)功耗300瓦的芯片,是專為執(zhí)行復(fù)雜的數(shù)學(xué)和幾何計(jì)算而設(shè)計(jì)的)。Big Sur可以操控計(jì)算機(jī),以類似人腦神經(jīng)網(wǎng)絡(luò)的方式理解及使用數(shù)據(jù)。通過Big Sur,F(xiàn)acebook希望使AI技術(shù)能夠閱讀新聞、回答問題,以及操作游戲,免去人工的介入。開源硬件平臺(tái)的好處不僅在于可以加速AI技術(shù)的發(fā)展,對(duì)Facebook來說,還可以快速在業(yè)界建立自己的硬件標(biāo)準(zhǔn),攤平成本,提高其普及率。
軟件方面,雖然Facebook涉足AI領(lǐng)域沒有幾年的時(shí)間,但短短數(shù)年中其開源項(xiàng)目卻越來越多,從中,我們也可以看到Facebook巨大的實(shí)力和更大的潛力。由于篇幅所限,在此僅舉幾例。
2015年1月,F(xiàn)AIR開源了一系列軟件庫,該軟件庫在 Facebook 被稱作模塊。用它們替代機(jī)器學(xué)習(xí)領(lǐng)域常用的Torch 的默認(rèn)模塊,可在更短時(shí)間內(nèi)訓(xùn)練更大規(guī)模的神經(jīng)網(wǎng)絡(luò)模型。Facebook的模塊一部分可用于訓(xùn)練大型計(jì)算機(jī)視覺系統(tǒng),一部分模塊可以用來訓(xùn)練不同類型數(shù)據(jù)的模型。部分模塊還把大型卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練速度提升了23.5 倍。
2016年6月,F(xiàn)acebook開源基于Torch的深度學(xué)習(xí)框架Torchnet。近年來有關(guān)機(jī)器學(xué)習(xí)的框架層出不窮,比較著名的有Caffe、Theano、Torch等。主流的機(jī)器學(xué)習(xí)框架Torch不能執(zhí)行抽象和公式化(boilerplate)的代碼實(shí)現(xiàn),因此研究人員不得不重復(fù)執(zhí)行一些算法的實(shí)驗(yàn)。Facebook在Torch的基礎(chǔ)上,提供了一種可抽象和公式化邏輯的開源框架Torchnet,可以模塊化編程和代碼重復(fù)使用,從而減少Bug,并直接使用異步數(shù)據(jù)加載和高效多GPU運(yùn)算。Torchnet 是用 Lua 腳本語言寫成的(Lua由標(biāo)準(zhǔn)C編寫而成,幾乎在所有操作系統(tǒng)和平臺(tái)上都可以編譯和運(yùn)行),易于集成安裝于任何架構(gòu)中。它對(duì)于想要訓(xùn)練大規(guī)模深度學(xué)習(xí)系統(tǒng)的機(jī)構(gòu)來說,可以大幅節(jié)省I/O的成本。
2016年8月,F(xiàn)acebook開源文本分類專用工具fastText。fastText是一款快速文本分類器,提供簡(jiǎn)單高效的文本分類和表征學(xué)習(xí)的方法,F(xiàn)acebook稱fastText比其他學(xué)習(xí)方法要快得多,能夠訓(xùn)練模型在使用標(biāo)準(zhǔn)多核CPU的情況下10分鐘內(nèi)處理超過10億個(gè)詞匯,與深度模型對(duì)比,fastText能將訓(xùn)練時(shí)間由數(shù)天縮短到幾秒鐘。此外,通過利用語言的形態(tài)結(jié)構(gòu),fastText可以支持多國語言,包括英語、德語、西班牙語、法語及捷克語。
同樣在8月,F(xiàn)acebook又開源了三款機(jī)器視覺工具——DeepMask 分割構(gòu)架、SharpMask 分割精煉模塊和MultiPathNet 的代碼。人們看一張圖片時(shí),可以將物體識(shí)別到最后一個(gè)像素。FAIR致力于將機(jī)器視覺推進(jìn)到新階段——在像素的層面上理解圖像和物體。FAIR稱,最近正在設(shè)計(jì)能夠識(shí)別和分割圖像中每個(gè)物體的技術(shù),它將帶來很多全新的應(yīng)用,推動(dòng)FAIR進(jìn)步的最主要的新算法是 DeepMask 分割構(gòu)架和SharpMask 分割精煉模塊。它們使FAIR 的機(jī)器視覺系統(tǒng)可以探測(cè)并精確勾畫出圖片中所有物體的輪廓。在識(shí)別過程的最后階段,F(xiàn)AIR使用的是一個(gè)特定的卷積網(wǎng)絡(luò) MultiPathNet,它可以標(biāo)記出每個(gè)物體掩碼(mask)所含有的物體類型(例如人、狗、羊)。Facebook的此次開源是希望它能幫助機(jī)器視覺領(lǐng)域快速發(fā)展。
Facebook的AI主攻方向
今年11月3日,Business Insider發(fā)表了對(duì)Yann LeCun進(jìn)行的專訪,訪問中,LeCun介紹了FAIR的主要任務(wù)是推進(jìn)AI科學(xué)與技術(shù),通過實(shí)驗(yàn)發(fā)展AI技術(shù)在各領(lǐng)域的應(yīng)用,例如計(jì)算機(jī)視覺、對(duì)話系統(tǒng)、虛擬助手、語音識(shí)別、自然語言識(shí)別等等。他也談到了AML的主要方向是將科學(xué)轉(zhuǎn)化為技術(shù),通過構(gòu)建應(yīng)用平臺(tái),將AI服務(wù)變?yōu)楫a(chǎn)品團(tuán)隊(duì)可以使用的東西。
LeCun提到了一個(gè)非常重要的問題,也是Facebook目前面臨的最大問題,時(shí)刻需要解決的問題——就是將最好的內(nèi)容向呈現(xiàn)給每個(gè)用戶。為了解決這個(gè)問題,F(xiàn)acebook必須理解內(nèi)容,理解每個(gè)用戶,然后把內(nèi)容和對(duì)它感興趣的人相連接。只有做到這一點(diǎn),人們才會(huì)選擇Facebook的News Feed。