新興的大數(shù)據(jù)企業(yè)如雨后春筍般涌現(xiàn)。各大廠商迅速崛起,以"大數(shù)據(jù)即服務(wù)"方案力爭在未來龐大的市場需求依靠自身的創(chuàng)新為客戶創(chuàng)造出獨(dú)特的價(jià)值。
IBM提供BigInsights、BigSheets和BigCloud
僅僅幾年前,IBM開始在其實(shí)驗(yàn)室嘗試使用Hadoop,但是它在去年將相關(guān)產(chǎn)品和 服務(wù)納入到商業(yè)版,甲骨文和微軟在其之后才宣布各自也將積極接受該平臺。IBM在去年5月推出了InfoSphere BigInsights軟件。該軟件包包括Apache Hadoop發(fā)行版、面向MapReduce編程的Pig編程語言、針對IBM的DB2數(shù)據(jù)庫的連接件以及IBM BigSheets,后者是一種基于瀏覽器的、使用電子表格隱喻(spreadsheet-metaphor)的界面,用于探究和分析Hadoop里面的數(shù)據(jù)。
IBM隨后又在10月通過其智慧云企業(yè)(SmartCloud Enterprise)基礎(chǔ)架構(gòu),將BigInsights和BigSheets作為一項(xiàng)服務(wù)來提供。這項(xiàng)服務(wù)分基礎(chǔ)版和企業(yè)版;賣點(diǎn)就是客戶不必購買支持性硬件,也不需要IT專門知識就可以學(xué)習(xí)和試用大數(shù)據(jù)處理和分析功能。據(jù)IBM聲稱,客戶用不了30分鐘就能搭建起Hadoop集群,并將數(shù)據(jù)轉(zhuǎn)移到集群里面,數(shù)據(jù)處理費(fèi)用是每個集群每小時60美分起。
Oracle:數(shù)據(jù)庫+大數(shù)據(jù)機(jī)
Oracle的大數(shù)據(jù)策清晰而直接。NoSQL數(shù)據(jù)庫和Big Data Appliance組合為客戶直接擁有處理非結(jié)構(gòu)化海量數(shù)據(jù)的能力。甲骨文大數(shù)據(jù)機(jī)(Oracle Big Data Appliance)將甲骨文-Sun分布式計(jì)算平臺與Cloudera的Apache Hadoop發(fā)行版、Cloudera管理器管理控制臺、R分析軟件的開源發(fā)行版以及甲骨文NoSQL數(shù)據(jù)庫結(jié)合起來。甲骨文還包括連接件,因而讓數(shù)據(jù)能 夠在大數(shù)據(jù)機(jī)與甲骨文Exadata或傳統(tǒng)的甲骨文數(shù)據(jù)庫部署環(huán)境之間來回傳送。甲骨文為這套綜合的軟硬件"工程一體化系統(tǒng)"提供了一線支持;但是即使出 現(xiàn)棘手的Hadoop難題,甲骨文也可以利用Cloudera的專長,它還可以介紹客戶使用Cloudera的Hadoop培訓(xùn)和咨詢服務(wù)。
大數(shù)據(jù)機(jī)通過全機(jī)架(full-rack)配置,每個機(jī)架配備864GB主內(nèi)存、216個處理器核心、648TB原始磁盤存儲容量,以及節(jié)點(diǎn)之間每秒40千兆的InifiniBand內(nèi)部連接。軟硬件總計(jì)售價(jià)將達(dá)到45萬美元,每年收取12%的軟硬件支持費(fèi)。這個價(jià)格頗具競爭力,相當(dāng)于每TB不到700美元。
微軟:面對開放的懸疑
微軟在去年推出了基于Azure云平臺的測試版Hadoop服務(wù),今年它承諾會推出與Windows兼容的基于Hadoop的大數(shù)據(jù)解決方案(Big Data Solution),這是微軟SQL Server 2012版本的一部分。微軟宣布推出了兩個基于Hadoop的大數(shù)據(jù)處理的社區(qū)技術(shù)預(yù)覽版連接器組件,一個用于SQL Server,另一個用于SQL Server并行數(shù)據(jù)倉庫(PDW)。該連接器是一個部署在Linux環(huán)境中的命令行工具。
SQL Server Hadoop連接器在微軟大數(shù)據(jù)之路上最重要的一步。但由于Hadoop、Linux和Sqoop都是開源技術(shù),這意味著微軟要對開源世界大規(guī)模地敞開胸懷,這一點(diǎn)值得用戶關(guān)注。另外,微軟還宣布將推出LINQ Pack、LINQ to HPC、Project"Daytona"以及Excel DataScope,這些產(chǎn)品都將專為研究人員和業(yè)務(wù)分析師打造,用以在Windows Azure上做大數(shù)據(jù)分析。
EMC:單一的數(shù)據(jù)分析平臺
Greenplum在大數(shù)據(jù)方面有43000萬美元營收,目前由EMC公司所有。EMC Greenplum統(tǒng)一分析平臺(UAP)是一款單一軟件平臺,數(shù)據(jù)團(tuán)隊(duì)和分析團(tuán)隊(duì)可以在該平臺上無縫地共享信息、協(xié)作分析,沒必要在不同的孤島上工作, 或者在不同的孤島之間轉(zhuǎn)移數(shù)據(jù)。正因?yàn)槿绱?,UAP包括ECM Greenplum關(guān)系數(shù)據(jù)庫、EMC Greenplum HD Hadoop發(fā)行版和EMC Greenplum Chorus,而后者是一種協(xié)作式、類似社交網(wǎng)絡(luò)的界面,可供數(shù)據(jù)分析團(tuán)隊(duì)處理,無論團(tuán)隊(duì)成員是有博士頭銜的數(shù)據(jù)科學(xué)家、數(shù)據(jù)集成專家和商業(yè)智能分析員, 還是數(shù)據(jù)庫管理員和業(yè)務(wù)部門的用戶及管理人員。
EMC為大數(shù)據(jù)開發(fā)的硬件是模塊化的EMC數(shù)據(jù)計(jì)算設(shè)備(DCA),它能夠在一個設(shè)備里面運(yùn)行并擴(kuò)展Greenplum關(guān)系數(shù)據(jù)庫和 Greenplum HD節(jié)點(diǎn)。DCA提供了一個共享的指揮中心(Command Center)界面,讓管理員可以監(jiān)控、管理和配置Greenplum數(shù)據(jù)庫和Hadoop系統(tǒng)性能及容量。UAP軟件將數(shù)據(jù)訪問、管理和工作流統(tǒng)一起 來,并與其他數(shù)據(jù)源和數(shù)據(jù)處理方法聯(lián)系起來;隨著Hadoop平臺日趨成熟,預(yù)計(jì)分析功能會急劇增加。