Hadoop這一備受矚目的技術(shù)隨著大數(shù)據(jù)的發(fā)展愈發(fā)火爆起來(lái),許多廠商以擁有Hadoop或類(lèi)似技術(shù)進(jìn)入大數(shù)據(jù)領(lǐng)域。在剛剛舉辦的Strata+Hadoop World大會(huì)上,這些廠商就發(fā)布了各自的大數(shù)據(jù)產(chǎn)品,并且大多與Hadoop密切相關(guān)。
本文將對(duì)十家主流大數(shù)據(jù)廠商的創(chuàng)新技術(shù)進(jìn)行盤(pán)點(diǎn):
1.Cloudera。
Cloudera是一家專業(yè)從事基于Apache Hadoop的數(shù)據(jù)管理軟件銷(xiāo)售和服務(wù)的公司,它發(fā)布了實(shí)時(shí)查詢開(kāi)源項(xiàng)目Impala 1.0 beta版,比原來(lái)基于MapReduce的Hive SQL查詢速度提升3~90倍。Impala是Google Dremel的模仿,但在SQL功能上青出于藍(lán)勝于藍(lán),而且更加靈活易用。
2.Splunk。
美國(guó)商業(yè)智能軟件提供商Splunk公司發(fā)布了Splunk Hadoop Connect和Splunk App for HadoopOps。前者可提供雙向集成,輕松可靠地完成在Splunk與Hadoop之間遷移數(shù)據(jù),后者可對(duì)端到端Hadoop環(huán)境的健康和性能進(jìn)行實(shí)時(shí)監(jiān)控和分析。
3.EMC。
EMC公司是全球信息存儲(chǔ)及管理產(chǎn)品、服務(wù)和解決方案提供商,其公布EMC Greenplum Chorus開(kāi)源代碼,并與Kaggle合作挖掘大數(shù)據(jù)科學(xué)家的社交平臺(tái)。Kaggle是囊括了55000多名數(shù)據(jù)科學(xué)家的社交平臺(tái),所有Chorus社區(qū)的成員實(shí)現(xiàn)與Kaggle中數(shù)據(jù)專家的對(duì)接。除此以外,Actuate,ADVIZOR Solutions,Alpine Data Labs,Gnip,Informatica,Pentaho,Pervasive,SAS,Syncsor以及Tableau Software都會(huì)將自己的工具與方案與Chorus整合。
4.MapR。
知名商業(yè)Hadoop供應(yīng)商MapR宣布新的大數(shù)據(jù)平臺(tái)MapR M7,為Hadoop與NoSQL提供更為方便、可靠和快速的服務(wù)。通過(guò)MapR M7,大數(shù)據(jù)范圍從批量分析到實(shí)時(shí)數(shù)據(jù)庫(kù)功能能都可以達(dá)到企業(yè)級(jí)標(biāo)準(zhǔn)。技術(shù)上看,MapR M7可以將HBase性能進(jìn)行大幅提升。MapR M7可以簡(jiǎn)化HBase的管理,確保沒(méi)有單獨(dú)進(jìn)程需要監(jiān)控和管理,不用手動(dòng)壓縮與合并,不需要人工數(shù)據(jù)庫(kù)修復(fù)操作,保證不停機(jī)即可實(shí)現(xiàn)維修。
5.SAP。
全球企業(yè)管理軟件與解決方案的提供商SAP公司宣布通過(guò)一個(gè)新的“big data” 捆綁方案將Apache Hadoop整合到實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)環(huán)境中,其基礎(chǔ)是SAP HANA平臺(tái)并結(jié)合SAP Sybase IQ server、SAP Data Integrator software、SAP BusinessObjects business intelligence (BI) solutions,目標(biāo)是為不同來(lái)源的大規(guī)模數(shù)據(jù)集提供了全面的數(shù)據(jù)倉(cāng)庫(kù)解決方案。通過(guò)這些集成方案,HDFS或Hive數(shù)據(jù)庫(kù)中的數(shù)據(jù)可以迅速進(jìn)入SAP HANA或者SAP Sybase IQ,幫助用戶使用現(xiàn)有報(bào)告及分析工具實(shí)現(xiàn)BI。
6.微軟。
微軟宣布在Windows Server及Azure產(chǎn)品中整合Apache Hadoop,可降低企業(yè)部署與管理Hadoop的困難,以便從公司自有系統(tǒng)或云計(jì)算上任何大小的任何數(shù)據(jù)獲得分析洞察,微軟技術(shù)院士David Campbell認(rèn)為,新產(chǎn)品用戶還可以使用Excel、PowerPivot for Excel及Power View等熟悉工具,以便抓取分析用的數(shù)據(jù)。
7.Simba。
Simba公司宣布推出針對(duì)NoSQL的大數(shù)據(jù)驅(qū)動(dòng)程序套件,允許任何基于SQL數(shù)據(jù)庫(kù)分析或報(bào)告工具訪問(wèn)任何的NoSQL數(shù)據(jù)資源,進(jìn)而實(shí)現(xiàn)商業(yè)智能,如ApacheHadoop/Hive,Apache Cassandra,Google BigQuery,MongoDB。
8.Datameer。
Hadoop海量數(shù)據(jù)分析平臺(tái)Datameer宣布推出Datameer Analytic Applications Market和免費(fèi)試用版Datameer 2.1。通過(guò)這一平臺(tái),數(shù)據(jù)科學(xué)家和中小企業(yè)領(lǐng)域?qū)<铱梢詣?chuàng)建、封裝并銷(xiāo)售相關(guān)的分析應(yīng)用程序,以快速滿足不同的用戶大數(shù)據(jù)分析需求;企業(yè)也不用花費(fèi)大量時(shí)間與資源構(gòu)建解析模型,而是通過(guò)這樣的App Market盡快以最小成本獲得Hadoop的應(yīng)用程序和代碼。Datameer應(yīng)用是構(gòu)建在Hadoop上的分析應(yīng)用,其可以對(duì)任何類(lèi)類(lèi)型或數(shù)量的數(shù)據(jù),無(wú)論大小、結(jié)構(gòu)化、半結(jié)構(gòu)化還是非機(jī)構(gòu)化數(shù)據(jù)進(jìn)行處理。
9.Tableau Software。
西雅圖數(shù)據(jù)分析公司Tableau Software宣布與合作伙伴一起提供桌面、企業(yè)端、網(wǎng)絡(luò)和移動(dòng)設(shè)備等方面的視覺(jué)分析整體方案。Tableau Software已經(jīng)構(gòu)建廣泛的生態(tài)系統(tǒng),可以滿足基于Hadooop架構(gòu)的各類(lèi)BI需求。
10.SiSense。
SiSense宣布推出世界上最小的大數(shù)據(jù)分析解決方案SiSense Prism ,旨在滿足中小企業(yè)、創(chuàng)業(yè)企業(yè)的數(shù)據(jù)分析需求。其方案可以在僅有8GB RAM內(nèi)存的筆記本上分析1TB數(shù)據(jù)。不需要龐大的預(yù)算、昂貴的硬件或數(shù)據(jù)倉(cāng)庫(kù),僅需要一小部分投資,SiSense Prism 包含一個(gè)高性能分析數(shù)據(jù)庫(kù),簡(jiǎn)單的數(shù)據(jù)提取(ETL)和基于網(wǎng)絡(luò)的數(shù)據(jù)可視化。
綜上所述,Hadoop的魅力已經(jīng)吸引到眾多IT廠商的目光,以Hadoop為主線的大數(shù)據(jù)產(chǎn)品正在影響著大數(shù)據(jù)市場(chǎng)的發(fā)展,雖然大數(shù)據(jù)不等于Hadoop,但是Hadoop的地位已無(wú)法取代。