artificial intelligence(AI)是科技研究中最熱門的方向之一。像 IBM、谷歌、微軟、Facebook 和亞馬遜等公司都在研發(fā)上投入大量的資金、或者收購那些在機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、自然語言和圖像處理等領(lǐng)域取得了進(jìn)展的初創(chuàng)公司??紤]到人們對(duì)此感興趣的程度,我們將不會(huì)驚訝于斯坦福的專家在人工智能報(bào)告中得出的結(jié)論:“越來越強(qiáng)大的人工智能應(yīng)用,可能會(huì)對(duì)我們的社會(huì)和經(jīng)濟(jì)產(chǎn)生深遠(yuǎn)的積極影響,這將出現(xiàn)在從現(xiàn)在到 2030 年的時(shí)間段里。”
在最近的一篇文章中,我們概述了 45 個(gè)十分有趣或有前途的人工智能項(xiàng)目。在本文中,我們將聚焦于開源的人工智能工具,詳細(xì)的了解下最著名的 15 個(gè)開源人工智能項(xiàng)目。
以下這些開源人工智能應(yīng)用都處于人工智能研究的最前沿。
1. Caffe

它是由賈揚(yáng)清在加州大學(xué)伯克利分校的讀博時(shí)創(chuàng)造的,Caffe 是一個(gè)基于表達(dá)體系結(jié)構(gòu)和可擴(kuò)展代碼的深度學(xué)習(xí)框架。使它聲名鵲起的是它的速度,這讓它受到研究人員和企業(yè)用戶的歡迎。根據(jù)其網(wǎng)站所言,它可以在一天之內(nèi)只用一個(gè) NVIDIA K40 GPU 處理 6000 萬多個(gè)圖像。它是由伯克利視野和學(xué)習(xí)中心(BVLC)管理的,并且由 NVIDIA 和亞馬遜等公司資助來支持它的發(fā)展。
2. CNTK

它是計(jì)算網(wǎng)絡(luò)工具包Computational Network Toolkit的縮寫,CNTK 是一個(gè)微軟的開源人工智能工具。不論是在單個(gè) CPU、單個(gè) GPU、多個(gè) GPU 或是擁有多個(gè) GPU 的多臺(tái)機(jī)器上它都有優(yōu)異的表現(xiàn)。微軟主要用它做語音識(shí)別的研究,但是它在機(jī)器翻譯、圖像識(shí)別、圖像字幕、文本處理、語言理解和語言建模方面都有著良好的應(yīng)用。
3. Deeplearning4j

Deeplearning4j 是一個(gè) java 虛擬機(jī)(JVM)的開源深度學(xué)習(xí)庫。它運(yùn)行在分布式環(huán)境并且集成在 Hadoop 和 Apache Spark 中。這使它可以配置深度神經(jīng)網(wǎng)絡(luò),并且它與 Java、Scala 和 其他 JVM 語言兼容。
這個(gè)項(xiàng)目是由一個(gè)叫做 Skymind 的商業(yè)公司管理的,它為這個(gè)項(xiàng)目提供支持、培訓(xùn)和一個(gè)企業(yè)的發(fā)行版。
4. DMTK

DMTK 是分布式機(jī)器學(xué)習(xí)工具Distributed Machine Learning Toolkit的縮寫,和 CNTK 一樣,是微軟的開源人工智能工具。作為設(shè)計(jì)用于大數(shù)據(jù)的應(yīng)用程序,它的目標(biāo)是更快的訓(xùn)練人工智能系統(tǒng)。它包括三個(gè)主要組件:DMTK 框架、LightLDA 主題模型算法和分布式(多義)字嵌入算法。為了證明它的速度,微軟聲稱在一個(gè)八集群的機(jī)器上,它能夠“用 100 萬個(gè)主題和 1000 萬個(gè)單詞的詞匯表(總共 10 萬億參數(shù))訓(xùn)練一個(gè)主題模型,在一個(gè)文檔中收集 1000 億個(gè)符號(hào),”。這一成績是別的工具無法比擬的。
5. H20

相比起科研,H2O 更注重將 AI 服務(wù)于企業(yè)用戶,因此 H2O 有著大量的公司客戶,比如第一資本金融公司、思科、Nielsen Catalina、PayPal 和泛美都是它的用戶。它聲稱任何人都可以利用機(jī)器學(xué)習(xí)和預(yù)測分析的力量來解決業(yè)務(wù)難題。它可以用于預(yù)測建模、風(fēng)險(xiǎn)和欺詐分析、保險(xiǎn)分析、廣告技術(shù)、醫(yī)療保健和客戶情報(bào)。
它有兩種開源版本:標(biāo)準(zhǔn)版 H2O 和 Sparking Water 版,它被集成在 Apache Spark 中。也有付費(fèi)的企業(yè)用戶支持。
6. Mahout

它是 Apache 基金會(huì)項(xiàng)目,Mahout 是一個(gè)開源機(jī)器學(xué)習(xí)框架。根據(jù)它的網(wǎng)站所言,它有著三個(gè)主要的特性:一個(gè)構(gòu)建可擴(kuò)展算法的編程環(huán)境、像 Spark 和 H2O 一樣的預(yù)制算法工具和一個(gè)叫 Samsara 的矢量數(shù)學(xué)實(shí)驗(yàn)環(huán)境。使用 Mahout 的公司有 Adobe、埃森哲咨詢公司、Foursquare、英特爾、領(lǐng)英、Twitter、雅虎和其他許多公司。其網(wǎng)站列了出第三方的專業(yè)支持。