Microsoft在最新發(fā)布的SQL Server 2012中,更新了基于Microsoft Azure之上的Hadoop。在上周Microsoft發(fā)布最新版本SQL Server的同時,Microsoft同時宣布其基于Windows Azure之上的Hadoop大數(shù)據(jù)服務(wù)第二個預(yù)覽版。Micrsoft在SQL Server 2012中的許多新功能和新服務(wù)都是基于Microsoft客戶的,這些客戶專注于混合的IT環(huán)境,并將傳統(tǒng)數(shù)據(jù)中心部署在私有云和公共云的環(huán)境之中。
Microsoft的Hadoop版本目前發(fā)展到“客戶技術(shù)預(yù)覽版”的階段。這意味著Microsoft在接受客戶群體的評價,預(yù)計正式版會在2012年中期推出。Microsoft的Hadoop基于Windows Server平臺或Microsoft云平臺Azure之上。
在此次推出的2.0版本之中,產(chǎn)品核心包括MapReduce、HDFS、以及Hadoop組件Pig和Hive。Microsoft的目標(biāo)是兼容所有的Hadoop組件。Hadoop生態(tài)系統(tǒng)中的Zookeeper、HBase、HCatalog和Mahout等組件也會被附加到Microsoft的Hadoop版本之中。
展望未來,Microsoft對Hadoop兼容性的承諾意味著,流數(shù)據(jù)解決方案StreamInsight以及Azure Tables會作為Hadoop環(huán)境的一部分與Microsoft分布式HBase作為核心產(chǎn)品推出。同時現(xiàn)今的流數(shù)據(jù)解決方案(如Yahoo S4)將會與Microsoft相兼容。
Microsoft還為SQL Server、SQL Azure應(yīng)用程序以及數(shù)據(jù)庫開發(fā)推出了一套新的通用工具。同時還推出了基于Web的可視化工具PowerView。你也許曾聽說過這個名為Crescent的項目,這是相當(dāng)強(qiáng)大的自服務(wù)BI工具包,允許用戶創(chuàng)建企業(yè)級的BI報告。
來自Microsoft SQL Server團(tuán)隊博客的介紹,在Microsoft最初的第一版到現(xiàn)今第二預(yù)覽版,基于Azure之上的Hadoop的服務(wù)能力和可靠性已經(jīng)提高了兩倍。同時基于Azure之上的Hadoop分布式文件系統(tǒng)還具備災(zāi)難恢復(fù)的功能。新版還允許包括與Office Sharepoint的數(shù)據(jù)相連?;贏zure之上的Hadoop還可與開源的Hadoop項目Mahout等共同工作。(Terminator/編譯)