然而值得一提的是,Hadoop本身無法實現(xiàn)數(shù)據(jù)分析。它通常是從大數(shù)據(jù)獲取洞察力的整個更龐大解決方案的一部分。
2. Spark
Spark也是Apache旗下的一個項目,它承諾可以迅速處理大數(shù)據(jù)。實際上,它聲稱“在內(nèi)存中運行程序的速度比Hadoop MapReduce快100倍,在磁盤上運行程度的速度快10倍。”由于這種出色性能,它常常用于分析流式數(shù)據(jù)或用于需要交互式分析功能的應(yīng)用軟件中。許多公司經(jīng)常把它與Hadoop或Mesos一起使用,不過它也能獨立運行。最近,它的人氣得到了急劇提升,Syncsort在2016年開展的一項調(diào)查發(fā)現(xiàn),受訪的企業(yè)大數(shù)據(jù)工作人員中近70%對Spark有興趣。
3. Talend
不像前面兩個項目,Talend由一家營利公司管理,而不是由基金會管理。因而,提供收費支付服務(wù)。Talend既提供免費產(chǎn)品,又提供收費產(chǎn)品。它免費的開源解決方案名為Talend Open Studio,下載量已超過了200萬人次。
市場研究公司Gartner最近將Talend評為數(shù)據(jù)集成領(lǐng)域的“領(lǐng)導(dǎo)者”。這家公司聲稱,相比與之競爭的解決方案,它幫助企業(yè)分析大數(shù)據(jù)的速度快五倍,而成本卻只有五分之一。