與此同時(shí),IBM公司對(duì)ApacheHadoop發(fā)布版BigInsights采用分析型戰(zhàn)略,以保持其廣泛的銷售商業(yè)智能和先進(jìn)的分析工具一致。IBM公司提供不同的附加價(jià)值與企業(yè)級(jí)功能模塊,這是BigInsights的一部分,其中包括獨(dú)立的分析師和數(shù)據(jù)科學(xué)家模塊。其分析模塊提供了聯(lián)合SQL訪問(wèn)Hadoop和其他大數(shù)據(jù)源的SQL。BigSheets是分析師模塊的一部分,允許用戶瀏覽,轉(zhuǎn)換和存儲(chǔ)在Hadoop的大數(shù)據(jù)集,使用直觀的電子表格的界面實(shí)現(xiàn)可視化。BigInsights數(shù)據(jù)科學(xué)家模塊包括一個(gè)R語(yǔ)言版本,文本分析,SystemML機(jī)器學(xué)習(xí)庫(kù)。
而其云平臺(tái)是亞馬遜AWS的主要電子名片,它也提供了用于監(jiān)控和管理集群工具,使其成為應(yīng)用和集群互操作性Hadoop的服務(wù)的一部分。
亞馬遜電子病歷收集用于跟蹤進(jìn)度和衡量集群的健康指標(biāo)。集群健康指標(biāo)可以通過(guò)命令行界面,軟件開(kāi)發(fā)工具包或API來(lái)訪問(wèn),并且可以通過(guò)電子病歷的管理控制臺(tái)來(lái)查看。此外,亞馬遜的CloudWatch的監(jiān)控服務(wù)可以一起使用,其實(shí)施了Apache神經(jīng)節(jié)性能監(jiān)控組件的檢查集群,并設(shè)置了這些指標(biāo)觸發(fā)的事件警報(bào)。
底線:選擇一個(gè)供應(yīng)商,提供作為其企業(yè)訂閱的一部分增值組件可能意味著致力于一個(gè)長(zhǎng)期的合作關(guān)系。尤其是這些組件是與其標(biāo)準(zhǔn)協(xié)議棧緊密集成的。如果你擔(dān)心廠商鎖定,請(qǐng)考慮參與OPDi的廠商。
3.Hadoop供應(yīng)商產(chǎn)品的安全和保護(hù)
盡管擴(kuò)大了使用開(kāi)源軟件的企業(yè)級(jí)應(yīng)用,但人們對(duì)其生產(chǎn)使用的安全和保護(hù)方面仍然存在著懷疑,Hadoop的一些廠商已經(jīng)采取措施來(lái)減輕一些這方面的焦慮。
例如,Hortonworks已經(jīng)與其他供應(yīng)商和客戶聯(lián)手推出針對(duì)Hadoop的數(shù)據(jù)治理計(jì)劃,最初的重點(diǎn)是阿特拉斯管理共享元數(shù)據(jù)的新的Apache項(xiàng)目、數(shù)據(jù)分類、審計(jì)、安全和策略管理數(shù)據(jù)保護(hù)。它還致力于整合阿特拉斯與Ranger,一個(gè)用于執(zhí)行數(shù)據(jù)訪問(wèn)策略的開(kāi)放源碼的安全工具Cloudera提供工具,讓用戶能夠管理數(shù)據(jù)安全和CDH平臺(tái)治理,支持一個(gè)組織的需要,滿足法律和法規(guī)要求。
此外,Cloudera,Hortonworks,MAPR和IBM都提供數(shù)據(jù)加密的功能。其中Hortonworks和Cloudera支持靜止數(shù)據(jù)加密。MAPR提供集群內(nèi)部的數(shù)據(jù)傳輸加密功能,IBM公司提供的InfoSphereGuardium產(chǎn)品,可以執(zhí)行數(shù)據(jù)隱私以及提供加密和保密數(shù)據(jù)屏蔽。
底線:Hadoop供應(yīng)商提供不同的身份驗(yàn)證方法,其中包括基于角色的訪問(wèn)控制、安全策略管理、數(shù)據(jù)加密。仔細(xì)指定你的安全和保護(hù)要求,以及審查每個(gè)供應(yīng)商如何解決這些需求的辦法。
4.為頂級(jí)的Hadoop發(fā)行版支持訂閱
開(kāi)源軟件模型的基本價(jià)值主張是系統(tǒng)部署的捆綁和簡(jiǎn)化,支持和服務(wù)。部署Hadoop需要下載的一種替代源代碼來(lái)自開(kāi)放源代碼庫(kù)中的每個(gè)組件,然后構(gòu)建和所有部件集成在一起。這需要技巧和努力,而且很可能是一個(gè)反復(fù)的過(guò)程。開(kāi)源廠商已經(jīng)進(jìn)行了很大的改進(jìn),提供預(yù)先配置的發(fā)布版,并維護(hù)了最新的整合堆棧。
Hadoop發(fā)行版產(chǎn)品哪個(gè)最能滿足組織的需求?
供應(yīng)商的區(qū)別在很大程度上是他們的支持模式。Hortonworks公司提供幾種模式,其企業(yè)版提供全天候支持和更短的響應(yīng)時(shí)間,這取決于問(wèn)題的嚴(yán)重程度。Cloudera的提供與企業(yè)許可證持有者一小時(shí)和全天候支持選項(xiàng)的支持訂閱。它還提供了Flex或數(shù)據(jù)中心版的許可證,其中包括一個(gè)為組織提供關(guān)鍵問(wèn)題的高級(jí)支持的15分鐘的響應(yīng)時(shí)間。
所有AWS賬戶包括基本的支持,提供全天候的客戶服務(wù),獲得了社區(qū)論壇和文檔,以及訪問(wèn)AWS值得信賴的顧問(wèn)應(yīng)用。開(kāi)發(fā)者支持包括對(duì)于嚴(yán)重的問(wèn)題的一小時(shí)響應(yīng),對(duì)于大多數(shù)問(wèn)題,則提供12或24小時(shí)的響應(yīng)時(shí)間。企業(yè)級(jí)支持提供全天候電子郵件訪問(wèn)云支持工程師,以及根據(jù)嚴(yán)重程度縮短響應(yīng)時(shí)間。企業(yè)級(jí)對(duì)于關(guān)鍵問(wèn)題的支持增加了不到15分鐘的響應(yīng)時(shí)間,以及專門的技術(shù)客戶經(jīng)理服務(wù),再加上額外的啟動(dòng)和運(yùn)行支持的好處。
MAPR提供高級(jí)支持服務(wù),增加了Web和電子郵件支持,自定義門戶,培訓(xùn),緊急的缺陷修復(fù),后續(xù)的太陽(yáng)支持和全天候電話支持的優(yōu)先問(wèn)題。該公司的高級(jí)支持增加了門票和接觸支持單點(diǎn)的優(yōu)先級(jí)隊(duì)列,并提供現(xiàn)場(chǎng)或遠(yuǎn)程專用支持選項(xiàng)IBM提供支持的組織購(gòu)買授權(quán)的組件,也被稱為價(jià)值添加模塊,擴(kuò)展其開(kāi)放平臺(tái)的ApacheHadoop。
底線:如果支持服務(wù)是來(lái)自供應(yīng)商的附加價(jià)值的來(lái)源,則不同支持訂閱的成本應(yīng)與顧客期望相一致。訂閱提供一小時(shí)甚至15分鐘的響應(yīng)時(shí)間,而在基于網(wǎng)絡(luò)的界面的業(yè)務(wù)時(shí)間方面,專門的支持人員將花費(fèi)了超過(guò)24小時(shí)的響應(yīng)時(shí)間。