7. MLlib

由于其速度,Apache Spark 成為一個最流行的大數(shù)據(jù)處理工具。MLlib 是 Spark 的可擴展機器學習庫。它集成了 Hadoop 并可以與 NumPy 和 R 進行交互操作。它包括了許多機器學習算法如分類、回歸、決策樹、推薦、集群、主題建模、功能轉(zhuǎn)換、模型評價、ML 管道架構(gòu)、ML 持久、生存分析、頻繁項集和序列模式挖掘、分布式線性代數(shù)和統(tǒng)計。
8. NuPIC

由 Numenta 公司管理的 NuPIC 是一個基于分層暫時記憶Hierarchical Temporal Memory,HTM理論的開源人工智能項目。從本質(zhì)上講,HTM 試圖創(chuàng)建一個計算機系統(tǒng)來模仿人類大腦皮層。他們的目標是創(chuàng)造一個 “在許多認知任務上接近或者超越人類認知能力” 的機器。
除了開源許可,Numenta 還提供 NuPic 的商業(yè)許可協(xié)議,并且它還提供技術專利的許可證。
9. OpenNN

作為一個為開發(fā)者和科研人員設計的具有高級理解力的人工智能,OpenNN 是一個實現(xiàn)神經(jīng)網(wǎng)絡算法的 c++ 編程庫。它的關鍵特性包括深度的架構(gòu)和快速的性能。其網(wǎng)站上可以查到豐富的文檔,包括一個解釋了神經(jīng)網(wǎng)絡的基本知識的入門教程。OpenNN 的付費支持由一家從事預測分析的西班牙公司 Artelnics 提供。
10. OpenCyc

由 Cycorp 公司開發(fā)的 OpenCyc 提供了對 Cyc 知識庫的訪問和常識推理引擎。它擁有超過 239,000 個條目,大約 2,093,000 個三元組和大約 69,000 owl:這是一種類似于鏈接到外部語義庫的命名空間。它在富領域模型、語義數(shù)據(jù)集成、文本理解、特殊領域的專家系統(tǒng)和游戲 AI 中有著良好的應用。該公司還提供另外兩個版本的 Cyc:一個可免費的用于科研但是不開源,和一個提供給企業(yè)的但是需要付費。
11. Oryx 2

構(gòu)建在 Apache Spark 和 Kafka 之上的 Oryx 2 是一個專門針對大規(guī)模機器學習的應用程序開發(fā)框架。它采用一個獨特的三層 λ 架構(gòu)。開發(fā)者可以使用 Orys 2 創(chuàng)建新的應用程序,另外它還擁有一些預先構(gòu)建的應用程序可以用于常見的大數(shù)據(jù)任務比如協(xié)同過濾、分類、回歸和聚類。大數(shù)據(jù)工具供應商 Cloudera 創(chuàng)造了最初的 Oryx 1 項目并且一直積極參與持續(xù)發(fā)展。
12. PredictionIO

今年的二月,Salesforce 收購了 PredictionIO,接著在七月,它將該平臺和商標貢獻給 Apache 基金會,Apache 基金會將其列為孵育計劃。所以當 Salesforce 利用 PredictionIO 技術來提升它的機器學習能力時,成效將會同步出現(xiàn)在開源版本中。它可以幫助用戶創(chuàng)建帶有機器學習功能的預測引擎,這可用于部署能夠?qū)崟r動態(tài)查詢的 Web 服務。
13. SystemML

最初由 IBM 開發(fā), SystemML 現(xiàn)在是一個 Apache 大數(shù)據(jù)項目。它提供了一個高度可伸縮的平臺,可以實現(xiàn)高等數(shù)學運算,并且它的算法用 R 或一種類似 python 的語法寫成。企業(yè)已經(jīng)在使用它來跟蹤汽車維修客戶服務、規(guī)劃機場交通和連接社會媒體數(shù)據(jù)與銀行客戶。它可以在 Spark 或 Hadoop 上運行。
14. TensorFlow

TensorFlow 是一個谷歌的開源人工智能工具。它提供了一個使用數(shù)據(jù)流圖進行數(shù)值計算的庫。它可以運行在多種不同的有著單或多 CPU 和 GPU 的系統(tǒng),甚至可以在移動設備上運行。它擁有深厚的靈活性、真正的可移植性、自動微分功能,并且支持 Python 和 c++。它的網(wǎng)站擁有十分詳細的教程列表來幫助開發(fā)者和研究人員沉浸于使用或擴展他的功能。