H2O被60000多個(gè)數(shù)據(jù)科學(xué)家和7000多家企業(yè)組織所使用,聲稱是“世界上領(lǐng)先的開源機(jī)器學(xué)習(xí)平臺。”由于它的內(nèi)存技術(shù),它提供了極其出色的性能。它還與Hadoop和Spark之類的其他許多開源數(shù)據(jù)分析工具整合起來,支持所有主要的流行數(shù)據(jù)庫,提供收費(fèi)的支持服務(wù)。
除了標(biāo)準(zhǔn)版的H2O外,該公司還提供Sparkling Water,這個(gè)版本整合了Spark和Steam,后者是一種端到端人工智能應(yīng)用引擎。
9. Lumify
Lumify由一家名為Altamira 科技的公司開發(fā),自稱是“開源大數(shù)據(jù)分析和可視化平臺。”它讓用戶易于創(chuàng)建二維或三維圖形,可顯示實(shí)體之間的關(guān)系,或在地圖上覆蓋數(shù)據(jù)。對于有興趣深入了解它的工作原理的那些人來說,官方網(wǎng)站提供了幾個(gè)視頻,顯示了Lumify的實(shí)際運(yùn)行,上面還有一個(gè)演示網(wǎng)站,讓用戶可以上傳自己的數(shù)據(jù),并試用軟件。
10. Drill
Apache Drill讓用戶得以使用SQL查詢用于非關(guān)系型數(shù)據(jù)存儲系統(tǒng)。它支持一系列NoSQL和基于云的數(shù)據(jù)存儲系統(tǒng),包括HBase、MongoDB、MapR-DB、HDFS、MapR-FS、亞馬遜S3、Azure Blob Storage、谷歌云存儲和Swift。它還讓用戶可以使用單一查詢,即可搜索用不同技術(shù)存儲起來的多個(gè)數(shù)據(jù)集。此外,它支持許多流行的商業(yè)智能工具。