如果你關心目前服務器行業(yè)的發(fā)展,會發(fā)現(xiàn)許多廠商和用戶都在圍繞一個重要的概念——大數(shù)據(jù)。和之前幾年談云計算時的火爆程度一樣,如今許多廠商對于大數(shù)據(jù)也提出了自己的觀點和認識。根據(jù)最新的IDC數(shù)據(jù)顯示,截至今年6月,國內電信行業(yè)已經(jīng)擁有3.9億用戶,而國內網(wǎng)民的數(shù)量已經(jīng)增長到了5.3億。從長遠發(fā)展來說,預計到2020年,全球數(shù)據(jù)增長將達到35.2ZB,這將是一個非??植赖臄?shù)字。而在這些數(shù)字背后,則蘊含了太多重要的信息。所謂大數(shù)據(jù)不僅僅是依賴于這些數(shù)據(jù),還要通過分析了解數(shù)據(jù)背后的內容,而作為數(shù)據(jù)的主要存儲方式,Hadoop應運而生了。
如今談到Hadoop,更多的人認為它依然是一款開源的軟件,就跟我們使用的Linux一樣。正如在Linux中也分為RadHat、SUSE等諸多版本一樣,如今像英特爾、微軟等行業(yè)巨頭廠商也在推廣自家的Hadoop。如何正確認識開源軟件與收費軟件的關系,IDC中國企業(yè)級系統(tǒng)與軟件研究部高級研究經(jīng)理周震剛先生給了我們一個很好的比喻——就好比我們都知道水是免費的,但還是有人會購買礦泉水、純凈水一樣。對于收費軟件的好處,除了可以減少用戶在最初部署時候遇到的一系列調配難題之外,其售后的支持和服務也是用戶所看重的部分。
事實上,任何軟件的開發(fā)都不能脫離硬件而單獨存在,如何為用戶提供更好的硬件也是實現(xiàn)Hadoop應用的前提條件。英特爾作為全球領先的IT公司,在行業(yè)規(guī)范及新技術普及方面一直引領著時代的潮流。今年3月發(fā)布的至強E5-2600作為至強5600的升級產(chǎn)品,在整體的表現(xiàn)上實現(xiàn)了飛躍,這也正好印證了英特爾一直堅持的摩爾定律,同時也為Hadoop的出現(xiàn)打下了堅實的物質基礎。
在談到至強E5-2600的時候,核心數(shù)量的增加為用戶提供了基礎的硬件保障,從6核心提升到8核心所帶來的性能增加是不言而喻的。而在多核心互聯(lián)方面也有頗多改進,從CPU溝通內部來說是QPI通道由1條增加到的2條,而在于內存的外部聯(lián)通方面,無論是4通道DDR3的出現(xiàn)或者是PCI-E 3.0的增加都提供了足夠的帶寬,再加上整合高級256位 AVX指令集、DDIO等功能使得至強E5-2600相比上一代有了明顯的進步。
通過實際用戶的現(xiàn)身說法或許是我們了解至強E5-2600品質的最佳途徑。中國石油東方地球物理公司研究院處理中心總工程師賴能和先生在談到新至強E5處理器的時候曾表示相比上一代的產(chǎn)品提供了5-8倍的性能提升。而同樣大規(guī)模使用至強E5-2600搭建數(shù)據(jù)中心的中國傳媒大學高性能計算中心主任魯永泉老師則表示:新一代的至強E5平臺在虛擬桌面通過Hyper-V共享服務器上的GPU時可以實現(xiàn)20%的性能提升,而且在維護方面還可以節(jié)約20%的時間和精力,同時至強E5的節(jié)能優(yōu)化也可以大量節(jié)省數(shù)據(jù)中心的冷卻成本。
總體說來,至強E5-2600系列處理器的出現(xiàn)對于原有的產(chǎn)品提供了非常大的提升,也為當下的Hadoop應用提供了良好的硬件平臺。而在今年7月,英特爾更是推出了自家的Hadoop發(fā)行版,相比目前廣泛的開源Hadoop來說,英特爾本次的發(fā)行版主要針對有需求但是沒有自主研發(fā)實力的企業(yè)而提供,為它們實現(xiàn)了更好的易用性,提供了長期穩(wěn)定性的保障。
正如我們剛才提到的,英特爾Hadoop發(fā)行版主要在以下四個方面提供了更好的支持——性能、功能、管理和穩(wěn)定性。首先我們來說性能:今年英特爾發(fā)布了全新一代的服務器平臺Romely,也推出了最新基于SandyBridge-EP架構的至強E5-2600系列處理器,可以進一步幫助企業(yè)提升效率,有效降低運營成本。同時,作為英特爾自家的軟件和硬件,在部署及運行的時候可以最大限度的降低兼容風險,提升平臺利用率。
同時,對于英特爾Hadoop發(fā)行版來說,相比于開源Hadoop最大的不同就是提供了針對HDPS數(shù)據(jù)節(jié)點的高級均衡算法。在以往的Hadoop軟件中,都是采用簡單均衡算法,如果服務器的性能不夠或者配置較低的話,不但不會達到良好的運行效果,反而適得其反降低服務器的整體運行效率。而應用了英特爾Hadoop發(fā)行版不僅僅提高的任務的擴展性,還可以應用于不同的計算集群,同時它所提供的雙機熱備和雙向復制、容災功能更為用戶提供了有效的數(shù)據(jù)保障。