“要計(jì)算現(xiàn)實(shí)狀況中的“模擬”幾乎是不可能完成的任務(wù),就算在非常高級(jí)的平行云系統(tǒng)中也不行。”他說。因此,ONC正在與IBM合作構(gòu)建一個(gè)內(nèi)部云加過來處理流程和分析工作。
新興的管理服務(wù)供應(yīng)商——例如Altiscale, BitYota, Qubole, Treasure Data和Rackspace’sObjectRocket附屬公司等——稱他們通過以低于云平臺(tái)供應(yīng)商的價(jià)格接管部署和管理任務(wù),能夠?yàn)橛脩羝髽I(yè)將大數(shù)據(jù)云裝置做的更方便、更劃算。
美國(guó)的Sellpoints公司是一個(gè)線上營(yíng)銷和分析服務(wù)供應(yīng)商,使用Hadoop和Spark的流程工具迅速構(gòu)建查詢表格,查詢數(shù)據(jù)量達(dá)到TB用戶網(wǎng)頁活躍度數(shù)據(jù),BennyBlum如此說,他是Sellpoint公司業(yè)績(jī)營(yíng)銷和分析的副總裁。
Hadoop實(shí)用工具
Blum的公司首先將其自身的Hadoop系統(tǒng)應(yīng)用到了亞馬遜彈性計(jì)算云(或EC2)平臺(tái)上。但是現(xiàn)在該公司已經(jīng)換成了Altiscal的Hadoop作為服務(wù)供應(yīng)。這一服務(wù)也在亞馬遜云上運(yùn)行,但是Blum表示將Hadoop的構(gòu)造和管理下線為Sellpoints帶來了紅利。“Altiscale為我們管理了基礎(chǔ)設(shè)施,這樣我們就不必為維護(hù)集群而付運(yùn)營(yíng)費(fèi)了。”
但是至少迄今為止,該類服務(wù)的用戶基本都是這些新興企業(yè)自身。大多是服務(wù)供應(yīng)商的顧客基礎(chǔ)還維持在一位數(shù)或兩位數(shù)。
RickSherman是AthenaIT解決方案這一美國(guó)咨詢公司的創(chuàng)始人,他認(rèn)為有理由相信基于云端的Hadoop服務(wù)尤其能夠在更廣闊的基礎(chǔ)上運(yùn)行。“人們?cè)谑褂米越o自足的Hadoop時(shí)遇到了一堵墻,”他說。“這在時(shí)間和技巧上都需要付出很多。我認(rèn)為最終Hadoop作為服務(wù)會(huì)比公司內(nèi)部Hadoop更具吸引力。”
然而有些企業(yè)還完全沒有準(zhǔn)備好接受公有云中的Hadoop,而且近期內(nèi)也不會(huì)準(zhǔn)備好接受。這就是Ayad Shammout所面臨的問題,他是美國(guó)Beth Israel Deaconess醫(yī)學(xué)中心(BIDMC)的數(shù)據(jù)平臺(tái)和商務(wù)智能主管。去年他還是位獨(dú)立咨詢師的時(shí)候,就與另一位咨詢師合作,為BIDMC做了一個(gè)大數(shù)據(jù)和云計(jì)算定義證明項(xiàng)目。為了降低SQL服務(wù)器數(shù)據(jù)庫上的存儲(chǔ)量和流程需求,他們使用了Azure HDInsight,Microsoft的基于云端的Hadoop發(fā)行,用以卸載應(yīng)用審計(jì)日志的存檔文件,這些日志用于微軟的Azure云管理報(bào)告。
Shammout表示示范項(xiàng)目展示出了在云端云頂Hadoop應(yīng)用的潛力。他還認(rèn)為像BIDMC這種衛(wèi)生保健型供應(yīng)商最終能夠?qū)⑵鋵?shí)現(xiàn)。但是在未來幾年之內(nèi),美國(guó)的聯(lián)邦健康保險(xiǎn)可移植性法案和問責(zé)制法案還阻礙著生產(chǎn)的展開。
“如果三四年前我跟你談?wù)撛贫?,我?huì)說‘這不會(huì)發(fā)生的。’”Shammout說道。“現(xiàn)在我認(rèn)為云端會(huì)在某些部門實(shí)現(xiàn)應(yīng)用。我的期望是再過三四年,云數(shù)據(jù)隱私就不成問題了。”