根據(jù)IDC周一發(fā)布的最新報告,用于大數(shù)據(jù)分析的Hadoop和MapReduce編程框架相關的軟件市場將會從2011年的7700萬美元暴漲至2016年的8.128億美元,年復合增長率為60.2%。
Hadoop是MapReduce框架的開源實現(xiàn),由Apache軟件基金會托管,并擁有眾多支持軟件項目,其中包括Hadoop分布式文件系統(tǒng)(HDFS)和Pig編程語言。
MapReduce和Hadoop依據(jù)分解大量數(shù)據(jù),然后并行分塊處理的原則,可跨大量節(jié)點處理數(shù)據(jù)。它們與行業(yè)流行語“大數(shù)據(jù)”密切相關,該術(shù)語主要指由網(wǎng)站、社交媒體、傳感器和其他來源所產(chǎn)生的數(shù)量越來越龐大的信息,尤指非結(jié)構(gòu)化信息。
總體說來,近些年來,Hadoop已獲得來自商業(yè)分析和數(shù)據(jù)庫廠商的穩(wěn)固支持,這些廠商已開始提供Hadoop產(chǎn)品和服務。
雖然關于Hadoop和MapReduce的使用案例和優(yōu)勢,“已經(jīng)產(chǎn)生了太多夢幻般和大量令人難以忍受的夸張,但毫無疑問的是,它的確提供了相對低成本的方法,可從非常龐大的散亂數(shù)據(jù)中挖掘出可觀的商業(yè)價值來,”IDC分析師CarlOlofson和DanVesset在報告中寫道。
IDC報告認為,Hadoop-MapReduce“生態(tài)系統(tǒng)”的爆發(fā)式增長自是題中應有之義。
今年,“主流IT世界的領導采納者將會從‘概念驗證’轉(zhuǎn)向?qū)嶋H價值,”報告寫道。
然而報告也指出,有資格人才的匱乏將會限制該技術(shù)在未來2到3年間的發(fā)展。
明年我們還會看到“在開源純正派之間將發(fā)生一場爭論,純正派認為Hadoop的內(nèi)核必須純粹基于Apache項目代碼而開發(fā),”IDC稱。然而,大多數(shù)IT組織將會在其Hadoop環(huán)境中使用商用與開源組件相混合的方式。
“開源廠商及其克隆源代碼副本之間也會產(chǎn)生競爭,可能會迫使后者的許可費降低,結(jié)果可能會減少該市場上的軟件收入。”