
為了緩解用戶(hù)在使用開(kāi)源Apache Hadoop分布式計(jì)算平臺(tái)時(shí)所遇到的技術(shù)復(fù)雜性的問(wèn)題。Hadoop將在新版本中進(jìn)行改善。
Hadoop分布式計(jì)算平臺(tái)已成為海量數(shù)據(jù)分析的代名詞,Hadoop可為用戶(hù)帶來(lái)更多便利。Hortonworks的公司的CEO Eric Baldeschwieler說(shuō)到。(Hortonworks是Yahoo與硅谷風(fēng)投公司Benchmark Capital合資組建一家名公司)
“Hadoop的升級(jí)將會(huì)帶來(lái)很多改善,例如高可用性以及安裝和數(shù)據(jù)管理功能的改進(jìn)。Beta版(Hadoop 0.23)將于今年晚些時(shí)候發(fā)布,0.23版在可用性、性能和可擴(kuò)展性方面進(jìn)行了改進(jìn)。Hadoop 0.23版的目標(biāo)將是非常大的客戶(hù),如Yahoo、Facebook。而穩(wěn)定版可能要等到2012年?!盉aldeschwieler說(shuō)到。
Baldeschwieler表示“我們工作的重點(diǎn)是要增加檢測(cè)、分布式以及管理的工具,使用戶(hù)更容易的使用Hadoop?,F(xiàn)在問(wèn)題是需要一個(gè)有相當(dāng)豐富經(jīng)驗(yàn)的人來(lái)安裝并使用它?!?/FONT>
此外,Hadoop 0.23計(jì)劃采用新的HCatalog數(shù)據(jù)管理軟件層,可以讓用戶(hù)將數(shù)據(jù)存儲(chǔ)在一個(gè)相對(duì)傳統(tǒng)風(fēng)格的表中,并且用戶(hù)能夠透明的移動(dòng)工具間的數(shù)據(jù)。另外Hadoop 0.23還完善了Hadoop MapReduce編程模型。目前,Hadoop上的Pig和Hive可供用戶(hù)使用,Pig和Hive都擁有自己的專(zhuān)業(yè)數(shù)據(jù)存儲(chǔ)。
Apache已經(jīng)確認(rèn)將對(duì)Hadoop高可用性、數(shù)據(jù)管理等方面做出完善。但Apache還不能給出明確的時(shí)間和與之對(duì)應(yīng)的版本。Hadoop到目前為止也還沒(méi)有1.0版本代號(hào)的產(chǎn)品推出。Baldeschwieler表示隨著Hadoop的完善,將來(lái)推出的版本將會(huì)直接被命名為1.0或2.0。