2016 年,似乎所有巨頭公司都在做機(jī)器學(xué)習(xí),如果沒有,也是在趕來的路上。所以 2016 或許會因?yàn)?nbsp;“機(jī)器學(xué)習(xí)大熱” 而被載入史冊。2017,這個(gè)熱潮并沒有消退的跡象,前陣子 AlphaGo 的升級版以橫掃千軍的姿態(tài)戰(zhàn)勝幾乎所有中國的圍棋大師,如入無人之境,最后更是以 60 連勝完美收官。人們對于機(jī)器學(xué)習(xí)的熱情再度被點(diǎn)燃起來。
機(jī)器學(xué)習(xí)的熱度如此高,大家也許會需要查找相關(guān)資源進(jìn)行學(xué)習(xí)和研究。本文整理了一份優(yōu)秀的開源的有關(guān)機(jī)器學(xué)習(xí)的框架 、平臺、系統(tǒng)、庫和工具包的列表。
平臺和系統(tǒng)
- TensorFlow — TensorFlow 是谷歌的第二代機(jī)器學(xué)習(xí)系統(tǒng),內(nèi)建深度學(xué)習(xí)的擴(kuò)展支持,任何能夠用計(jì)算流圖形來表達(dá)的計(jì)算,都可以使用 TensorFlow
- PaddlePaddle — 百度研發(fā)的深度學(xué)習(xí)平臺,具有易用,高效,靈活和可伸縮等特點(diǎn),為百度內(nèi)部多項(xiàng)產(chǎn)品提供深度學(xué)習(xí)算法支持
- Apache SINGA — SINGA 是基于大型數(shù)據(jù)集訓(xùn)練,大型深度學(xué)習(xí)模塊的常規(guī)分布式學(xué)習(xí)平臺。SINGA 支持各種流行的深度學(xué)習(xí)模塊
- Scikit Flow — TensorFlow 的簡化接口,模仿 Scikit 學(xué)習(xí),用戶可在預(yù)測分析和數(shù)據(jù)挖掘中使用
- VELES — 分布式深度學(xué)習(xí)應(yīng)用系統(tǒng),用戶只需要提供參數(shù),剩下的都可以交給 VELES。VELES 是三星開發(fā)的另一個(gè) TensorFlow
- SpeeDO — 為通用硬件設(shè)計(jì)的并行深度學(xué)習(xí)系統(tǒng)。SpeeDO 不需要特殊的 I/O 硬件,支持 CPU/GPU 集群,可以很方便地在各種云端環(huán)境上部署,如 AWS、Google GCE、Microsoft Azure 等等
框架
- Torchnet — Facebook 為加快 A.I 研究而開源的深度學(xué)習(xí)框架
- LightGBM — 微軟開源的一個(gè)實(shí)現(xiàn) GBDT 算法的框架,支持高效率的并行訓(xùn)練。旨在解決 GBDT 在海量數(shù)據(jù)遇到的問題,讓 GBDT 可以更好更快地用于工業(yè)實(shí)踐
- Guagua — Hadoop 迭代式計(jì)算框架 Guagua 是 PayPal 的一個(gè)開源機(jī)器學(xué)習(xí)框架 Shifu 的子項(xiàng)目,主要解決模型訓(xùn)練的分布式問題
- Chainer — Chainer 在深度學(xué)習(xí)的理論算法和實(shí)際應(yīng)用之間架起一座橋梁,深度學(xué)習(xí)的靈活框架
- Shifu — 基于 Hadoop 的快速和可伸縮的機(jī)器學(xué)習(xí)框架
- KeystoneML — 用 Scala 編寫的框架,旨在簡化構(gòu)造大規(guī)模、端到端的機(jī)器學(xué)習(xí)管道,基于 Apache Spark 構(gòu)建
- LightNet — 輕量級,多功能,完全基于 Matlab 的深度學(xué)習(xí)框架。目的是為深度學(xué)習(xí)研究提供一個(gè)易于理解、易于使用和高效的計(jì)算平臺
- DeepLearningKit — 針對 iOS、OS X 和 tvOS 的開源深度學(xué)習(xí)框架
- GoLearn — GoLearn 是一款 Go 語言實(shí)現(xiàn)的機(jī)器學(xué)習(xí)框架
- YCML — 使用 Objective-C 編寫的機(jī)器學(xué)習(xí)框架,也支持 Swift
工具包和庫
- DMTK — 微軟開源的分布式機(jī)器學(xué)習(xí)工具包,包括 DMTK 分布式機(jī)器學(xué)習(xí)框架、用于訓(xùn)練主題模型的 LightLDA以及分布式詞向量
- CNTK — 微軟開源的用于語音識別的深度學(xué)習(xí)工具包,借助 GPU 的能力,該工具包的效率相當(dāng)高
- DSSTNE — 亞馬遜開源的深度學(xué)習(xí)工具,能同時(shí)支持兩個(gè)圖形處理器(GPU)參與運(yùn)算,主要用作智能搜索和推薦
- Scikit-learn — Python 的機(jī)器學(xué)習(xí)項(xiàng)目,簡潔、高效的算法庫,提供一系列的監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)的算法,用于數(shù)據(jù)挖掘和數(shù)據(jù)分析。SciKit-learn 幾乎覆蓋了機(jī)器學(xué)習(xí)的所有主流算法
- Deeplearning4j — 為 Java 和 Scala 編寫的首個(gè)商業(yè)級開源分布式深度學(xué)習(xí)庫,為商業(yè)環(huán)境所設(shè)計(jì),以即插即用為目標(biāo),通過更多預(yù)設(shè)的使用,避免太多配置,讓非研究人員也能夠進(jìn)行快速的原型制作