針對幾個行業(yè),IBM給出了具體的大數(shù)據(jù)應(yīng)用場景和解決方案,包括制造業(yè)、金融和電信等大型傳統(tǒng)行業(yè)。IBM的大數(shù)據(jù)戰(zhàn)略非常清晰,一步一個腳印走的很堅實(shí),其前景將被看好。
英特爾憑Hadoop向大數(shù)據(jù)靠攏
雖然Hadoop并不是大數(shù)據(jù)代名詞,但當(dāng)提到大數(shù)據(jù)生態(tài)系統(tǒng)的時候,人們還是會首先想到Apache Hadoop。同大數(shù)據(jù)類似,Hadoop是一整套技術(shù)與產(chǎn)品的組合,來源于Apache軟件基金會的開源項(xiàng)目,可以為企業(yè)提供一個可靠的、可擴(kuò)展的分布式計算環(huán)境。它包括了MapReduce計算框架、HDFS存儲系統(tǒng)、HBase數(shù)據(jù)庫以及Hive等工具,能夠?qū)Ψ墙Y(jié)構(gòu)化數(shù)據(jù)進(jìn)行有效的操作與處理。這也是Hadoop在大數(shù)據(jù)時代獨(dú)領(lǐng)風(fēng)騷的重要原因,因此許多廠商都希望通過Hadoop來抓住大數(shù)據(jù)所帶來的機(jī)遇。
在今年的七月份,英特爾公司對外發(fā)布了自己的Hadoop商業(yè)發(fā)行版(Apache Hadoop Distribution),也是這幾家大型廠商中唯一擁有自身發(fā)行版Hadoop的一家。靠硬件芯片起家的英特爾為何要走這條路?
英特爾實(shí)際上已經(jīng)看到企業(yè)用戶對于大數(shù)據(jù)的需求在不斷增長,特別是在中國。目前國內(nèi)的Hadoop應(yīng)用大多數(shù)集中在互聯(lián)網(wǎng)行業(yè),傳統(tǒng)行業(yè)沒有專門的技術(shù)團(tuán)隊(duì)可以擔(dān)負(fù)起維護(hù)開源Hadoop集群的重任。除Oracle、IBM這樣的廠商會提供一些異常昂貴的Hadoop服務(wù)之外,像Cloudera、Hortonworks這樣的頂級Hadoop提供商在國內(nèi)的投入力度卻非常小。這雖然讓人有些意外,但國內(nèi)用戶的確是需要一個“靠譜的”Hadoop解決方案,來切實(shí)解決大數(shù)據(jù)問題。英特爾的Hadoop發(fā)行版恰好能解決這一問題。
英特爾Hadoop發(fā)行版包含了所有的分析、集成以及開發(fā)組件,并對不同組合之間進(jìn)行了更加深入的優(yōu)化。此外,還添加了英特爾Hadoop管理器(Hadoop Manager),從安裝、部署到配置與監(jiān)控,可以提供對平臺的全方位管理。目前英特爾已經(jīng)開放了免費(fèi)下載,隨著推廣力度的不斷加大,相信英特爾的Hadoop還是能很輕松地在國內(nèi)大數(shù)據(jù)市場分一杯羹。
微軟大數(shù)據(jù)戰(zhàn)略依然延續(xù)“端到端”
對于微軟企業(yè)級部門來說,今年是非常重要的一年。大面積的產(chǎn)品更新以及在云計算業(yè)務(wù)方面的進(jìn)展,讓微軟在2012年吸引了大量關(guān)注的目光,當(dāng)然大數(shù)據(jù)就是其中之一。微軟在今年上半年正式發(fā)布了SQL Server 2012數(shù)據(jù)庫平臺,并添加了Hadoop的相關(guān)服務(wù),逐漸將數(shù)據(jù)業(yè)務(wù)延伸到非結(jié)構(gòu)化數(shù)據(jù)領(lǐng)域。而伴隨Windows Azure Marketplace和SharePoint等工具的推出,微軟已經(jīng)具備了打造端到端的大數(shù)據(jù)平臺的能力。
微軟的大數(shù)據(jù)解決方案涵蓋了管理、擴(kuò)展和洞察三個層面,從各個角度來把握大數(shù)據(jù)生命周期。其中數(shù)據(jù)管理層將對所有類型的數(shù)據(jù)進(jìn)行搜集和管理,包括結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化和流數(shù)據(jù);數(shù)據(jù)擴(kuò)展層主要實(shí)現(xiàn)數(shù)據(jù)發(fā)現(xiàn)的功能,通過多種類型、多種數(shù)據(jù)源的互連實(shí)現(xiàn)對數(shù)據(jù)集的豐富;洞察力層主要面向應(yīng)用,通過數(shù)據(jù)挖掘以及多種數(shù)據(jù)展現(xiàn)工具,實(shí)現(xiàn)任何用戶對任何位置的任何數(shù)據(jù)洞察。
微軟對大數(shù)據(jù)生命周期的三個層面都投入了大量的研發(fā)力度:SQL Server 2012數(shù)據(jù)庫和并行數(shù)據(jù)倉庫(Parallel Data Warehouse)將作為結(jié)構(gòu)化數(shù)據(jù)的處理平臺。針對非結(jié)構(gòu)化數(shù)據(jù),微軟也將推出全新的Hadoop服務(wù)HDInsight,該產(chǎn)品包括公有云(Windows Azure)和私有云(Windows Server)兩個版本,提供企業(yè)級的Hadoop服務(wù)。
另外,最新發(fā)布的Windows Azure Marketplace將實(shí)現(xiàn)大數(shù)據(jù)的共享,通過開放數(shù)據(jù)協(xié)議(OData)展現(xiàn)數(shù)百種來自微軟和第三方的應(yīng)用程序和數(shù)據(jù)挖掘算法。用戶還可以使用最熟悉的工具從結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中獲得可執(zhí)行的洞察力,包括SQL Server分析服務(wù)(SSAS)的PowerPivot和Power View,通過連接器就可以對Hadoop分布式文件系統(tǒng)中的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分析與展現(xiàn)。