說(shuō)過(guò)了性能,我們?cè)賮?lái)看看功能上的優(yōu)勢(shì)。英特爾Hadoop發(fā)行版一個(gè)重要的內(nèi)容就是可以提供基于HBase數(shù)據(jù)大表的建立,同時(shí)結(jié)合分布式函數(shù)計(jì)算,使得運(yùn)算效能得到多倍提升。
這里我們先來(lái)解釋一下什么叫做HBase。所謂HBase就是Hadoop Database,它是一種高可靠性、高性能、面向列、可伸縮的分布式存儲(chǔ)系統(tǒng),而它的出現(xiàn)則可以幫助用搭建大規(guī)模結(jié)構(gòu)化存儲(chǔ)集群。
在以往我們的使用中,HBase利用Hadoop HDFS作為其文件存儲(chǔ)系統(tǒng),利用Hadoop MapReduce來(lái)處理HBase中的海量數(shù)據(jù),利用Zookeeper作為對(duì)應(yīng)。結(jié)合上圖來(lái)看,Hadoop EcoSystem中的各層系統(tǒng),其中HBase位于結(jié)構(gòu)化存儲(chǔ)層,Hadoop HDFS為HBase提供了高可靠性的底層存儲(chǔ)支持,Hadoop MapReduce為HBase提供了高性能的計(jì)算能力,Zookeeper為HBase提供了穩(wěn)定服務(wù)和failover機(jī)制。
但是在HBase使用的過(guò)程中,由于使用數(shù)據(jù)的用戶數(shù)量及數(shù)據(jù)分布的不均衡,經(jīng)常會(huì)出現(xiàn)系統(tǒng)根據(jù)服務(wù)器Region數(shù)量進(jìn)行負(fù)載均衡,從而增加系統(tǒng)負(fù)擔(dān),導(dǎo)致系統(tǒng)變慢的問(wèn)題。但是在英特爾Hadoop發(fā)行版當(dāng)中,則可以智能的根據(jù)數(shù)據(jù)的局部性、分析服務(wù)器的Region數(shù)量的自動(dòng)進(jìn)行均衡設(shè)置,同時(shí)還可以實(shí)現(xiàn)跨數(shù)據(jù)中心的應(yīng)用部署,解決運(yùn)行速度的問(wèn)題。從這一點(diǎn)來(lái)說(shuō),英特爾Hadoop發(fā)行版在功能上相比普通的開源軟件更為強(qiáng)大,同時(shí)也降低了用戶在應(yīng)用中可以面對(duì)的風(fēng)險(xiǎn)和出現(xiàn)的問(wèn)題,進(jìn)一步提升了企業(yè)的運(yùn)行效率。
作為英特爾開發(fā)的特定收費(fèi)版本,Hadoop發(fā)行版必然有著完善的管理界面,這也是與開源版本一個(gè)比較大的區(qū)別。在這里,英特爾特別為用戶設(shè)置了一個(gè)可以通過(guò)瀏覽器進(jìn)行管理的頁(yè)面,提供了集群安裝和管理,這也是它的亮點(diǎn)所在。當(dāng)系統(tǒng)遭遇故障的時(shí)候,軟件還可以自行報(bào)警,將故障郵件發(fā)送到預(yù)先設(shè)定好的管理員郵箱當(dāng)中,第一時(shí)間完成報(bào)告。
說(shuō)了太多Hadoop應(yīng)用的好處,下面我們可以來(lái)看一個(gè)具體的應(yīng)用案例。來(lái)自美國(guó)國(guó)際綠色計(jì)算大會(huì)的消息,著名的國(guó)外社交網(wǎng)站FaceBook目前正在使用至強(qiáng)處理器組建自己的Hadoop開源服務(wù)器集群,這些集群已經(jīng)在俄勒岡州Prineville的數(shù)據(jù)中心投入使用,同時(shí)當(dāng)英特爾發(fā)布最新架構(gòu)的至強(qiáng)E5-2600處理器之后,數(shù)據(jù)中心也將隨之進(jìn)行大規(guī)模的升級(jí)。
如今,英特爾已經(jīng)不再僅僅滿足于從硬件層面支持大數(shù)據(jù)特別是Hadoop應(yīng)用的普及,最新推出的Hadoop發(fā)行版更是為用戶提供了一個(gè)最佳的選擇。從前期的準(zhǔn)備到后期的維護(hù),英特爾提供了完善的技術(shù)支持,對(duì)于那些想使用Hadoop又沒(méi)有能力完成開源軟件編譯的用戶來(lái)說(shuō)提供了最大的方便,同時(shí)英特爾Hadoop發(fā)行版所完善了HBase的諸多功能,在數(shù)據(jù)安全和冗余方面提供了更多的保障,而在應(yīng)用層面了強(qiáng)化了用戶體驗(yàn),瀏覽器界面更為友好。
開源軟件雖然具備了免費(fèi)的特質(zhì),但是較高的技術(shù)門檻也阻擋了許多切實(shí)需要的用戶。對(duì)于國(guó)內(nèi)的大部分中小企業(yè)來(lái)說(shuō),Hadoop的應(yīng)用已經(jīng)是大勢(shì)所趨,但受限于技術(shù)能力和規(guī)模限制,很少有企業(yè)具備獨(dú)立研發(fā)的能力。而從實(shí)際應(yīng)用來(lái)說(shuō),英特爾Hadoop發(fā)行版就為這些中小企業(yè)提供了一個(gè)最佳的解決方案,不僅避免了它們?cè)陂_發(fā)上的難度,更提供了完善的指導(dǎo)和售后服務(wù),解決了技術(shù)應(yīng)用上的瓶頸。