本文對 23 個深度學習庫進行了排名,衡量的標準有三個:GitHub、Stack Overflow 以及谷歌搜索結果。TensorFlow 憑借最大、最活躍的社區(qū)主導了該領域,排名第一;Keras 是最為流行的深度學習前端,排名第二;Theano 依然實力強大,即使沒有大公司的支持,排名第四;Sonnet 是成長最快的庫,排名第六。
排名
我們排名 23 個用于數(shù)據(jù)科學的深度學習開源庫,排名的衡量標準有 3 個:GitHub、Stack Overflow 活動以及谷歌搜索結果。
上表中給出了每個開源庫的總分值,以及各自在 GitHub、Stack Overflow 以及谷歌搜索上的得分(其中 0 為平均值)。比如,Caffe 在 Github 上的標準評分為 1,deeplearning4j 則接近 0。
結果與討論
排名綜合考慮上述 3 個方面而得出:Github(收藏量與 forks)、Stack Overflow(標簽與問題)、谷歌搜索(全年與每季的增長率)。上述指標通過可用的 API 獲取,所以得出深度學習工具包的完整列表需要一定技巧。計算每個指標的分值有利于我們知道在該方面深度學習庫的排名情況。
TensorFlow 憑借最大、最活躍的社區(qū)主導了該領域
TensorFlow 在三個指標上的分值均為 2+;相比于排名第三的 Caffe,TensorFlow 的 Github forks 幾乎是其 3 倍,Stack Overflow 問題是其 6 倍多。TensorFlow 由谷歌大腦團隊于 2015 年首次開源,之后便一路攀升超越 Theano (4) 和 Torch (8) 而排名第一。盡管 TensorFlow 與運行在 C++引擎上的 Python API 一起分發(fā),本次排名中的若干個庫可把 TensorFlow 用作后端并提供其接口。這其中包括很快將成為核心 TensorFlow 和 Sonnet (6) 一部分的 Keras (2)。TensorFlow 的流行很可能來自于通用深度學習框架、靈活的接口、漂亮的計算圖可視化以及谷歌大量的開發(fā)者與社區(qū)資源之間的整合。
Caffe 已經(jīng)被 Caffe2 取代
由于比其他深度學習庫(包括 TensorFlow 在內(nèi))更高的 Github 分值,Caffe 獲得了排名第三的位置。Caffe 一般認為比 Tensorflow 更專業(yè)化,其開發(fā)聚焦在圖像處理、目標識別和預訓練卷積神經(jīng)網(wǎng)絡上。2017 年 4 月 Facebook 發(fā)布了 Caffe2,并已在所有的庫中排名前半。Caffe2 相較于包含循環(huán)神經(jīng)網(wǎng)絡的 Caffe 更輕量化、模塊化和可擴展。Caffe 與 Caffe2 彼此分離,因此數(shù)據(jù)科學家可繼續(xù)使用 Caffe。但是,一些遷移工具比如 Caffe Translator 能提供使用 Caffe2 的方法以驅動現(xiàn)有 Caffe 模型。
Keras 是最為流行的深度學習前端
Keras (2) 是排名最高的非框架深度學習庫,可被用作 TensorFlow (1)、Theano (4)、MXNet (7)、CNTK (9) 或 deeplearning4j (14) 的前端。Keras 的表現(xiàn)在三個指標上均高于平均值,其流行得益于簡單性和易于上手。在數(shù)據(jù)集上進行深度學習實驗的數(shù)據(jù)科學家尤其喜歡 Keras。隨著 Keras 有了 R 語言接口,Keras 的開發(fā)與流行都將會繼續(xù)下去。
Theano 依然實力強大,即使沒有大公司的支持
新的深度學習框架層出不窮,Theano (4) 是排名中出現(xiàn)最早的庫。Theano 率先使用計算圖,在深度學習與機器學習社區(qū)中流行度不減當年。Theano 本質(zhì)上是一個用于 Python 的數(shù)值計算庫,也可被用于高階的深度學習包裝器,比如 Lasagne (15)。盡管谷歌支持 TensorFlow (1) 和 Keras (2),F(xiàn)acebook 支持 PyTorch (5) 和 Caffe2 (11),MXNet (7) 是亞馬遜云服務官方指定的深度學習框架,CNTK (9) 由微軟設計開發(fā)并為其所用,Theano 依然很流行,盡管沒有得到任何一家大公司的青睞。