如今,開源已經(jīng)成為創(chuàng)新與技術發(fā)展的核心。在本文中,雷鋒網(wǎng)將介紹 2016 Python 前20大機器學習開源項目。
去年 KDnuggets 評選了前 20 大機器學習開源項目(Python版),今年的評選結果與去年相比,名單中出現(xiàn)了一些新的面孔,有13個新開源項目入圍了這個名單。作者 Prasad Pore 將具體介紹這些開源項目,雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))編譯,未經(jīng)許可不得轉載。
第一名:Scikit-learn
Scikit-learn可以說是一款簡單而高效的數(shù)據(jù)挖掘與分析工具,大家可以免費下載安裝,使用它處理各種數(shù)據(jù),使用時需引入 NumPy, SciPy, and matplotlib這些第三方開源模塊。
提交: 21486 貢獻: 736 Github URL: Scikit-learn
第二名:Tensorflow
Tensorflow是由谷歌大腦與谷歌人工智能實驗室的科研人員研發(fā)而成的,這個系統(tǒng)用于機器學習的研究,可以簡單、快速的實現(xiàn)研究人員的想法。前段時間恰逢Tensorflow一周年,雷鋒網(wǎng)也做過報道和回顧。
提交: 10466 貢獻: 493 Github URL: Tensorflow
第三名:Theano
Theano可以對那些高維數(shù)組數(shù)學表達式進行定義、優(yōu)化與評估。
提交: 24108 貢獻: 263 Github URL: Theano
第四名:Caffe
Caffe是一款具有表達、加速、模塊化思想的深度學習框架,由 Berkeley Vision and Learning Center (BVLC)于社區(qū)志愿者共同開發(fā)維護。
提交: 3801 貢獻: 215 Github URL: Caffe
第五名:Gensim
Gensim是一個免費的Python庫,這個庫可以實現(xiàn)文本的情感傾向判斷,相似文本檢索等功能。
提交: 2702 貢獻: 145 Github URL: Gensim
第六名:Pylearn2
Pylearn2 也是一個機器學習的開源庫,但它是一個基于Theano的庫,所以它有一些Theano的特點,你可以使用數(shù)學表達式來寫Pylearn2插件,Theano會自動對你寫的表達式進行優(yōu)化,按照你的選擇(用CPU或GPU)對這些表達式進行編譯。
提交: 7100 貢獻: 115 Github URL: Pylearn2
第七名:Statsmodels
Statsmodels是一款Python開源工具,可以實現(xiàn)數(shù)據(jù)探究、統(tǒng)計模型評價、性能測試等功能,擴展性能良好,可對各種類型的數(shù)據(jù)進行各種處理,例如描述統(tǒng)計、統(tǒng)計測試、繪圖、結果統(tǒng)計等等。
提交: 8664 貢獻: 108 Github URL: Statsmodels
第八名:Shogun
Shogun是一款機器學習工具,其包含了各種機器學習方法。它可以簡單的實現(xiàn)多種數(shù)據(jù)表示、多種算法的無縫融合。
提交: 15172 貢獻: 105 Github URL: Shogun
第九名:Chainer
Chainer是一個基于Python的開源深度學習框架,它可以讓你以一種靈活、簡單、快速的方式實現(xiàn)多種深度學習模型,包括RNN與各種自編碼。
提交: 6298 貢獻: 84 Github URL: Chainer
第十名:NuPIC
NuPIC是一個基于Hierarchical Temporal Memory理論的開源項目,目前Hierarchical Temporal Memory這個理論中的部分功能已經(jīng)實現(xiàn),并進行了測試與應用,其它部分正在完善中。
提交: 6088 貢獻: 76 Github URL: NuPIC
第十一名:Neon
Neon是一款深度學習第三方庫,在進行高性能計算時它具有簡單易用的特點。
提交: 875 貢獻: 47 Github URL: Neon
第十二名:NiLearn
NiLearn主要用于處理醫(yī)學圖像數(shù)據(jù),具有簡單、快速的特點。它通過調(diào)用scikit-learn進行多元統(tǒng)計分析(例如:預測模型、分類、解碼、關聯(lián)分析)。
提交: 5254 貢獻: 46 Github URL: NiLearn
第十三名:Orange3
Orange3是一款機器學習與數(shù)據(jù)可視化開源工具,可以對數(shù)據(jù)進行各種交互分析。
提交: 6356 貢獻: 40 Github URL: Orange3
第十四名:Pymc
Pymc是一個貝葉斯統(tǒng)計模型(包括馬爾科夫鏈)庫,具有靈活、擴展性能好的特點。
提交: 2701 貢獻: 37 Github URL: Pymc
第十五名:PyBrain:
PyBrain是一個機器學習庫,它的目標是讓算法的實現(xiàn)變的簡單、靈活、高效。同時使得在特定環(huán)境下對算法的測試與比較也變的簡單、靈活、高效。