“大數(shù)據(jù)”這個(gè)提法通常指的是數(shù)量、速度和種類都會(huì)急劇倍增的數(shù)據(jù)。根據(jù)Enterprise Strategy機(jī)構(gòu)最新研究,大數(shù)據(jù)分析平臺(tái)正在模仿這種定義:供應(yīng)商產(chǎn)品發(fā)布數(shù)量在增長(zhǎng),產(chǎn)品增強(qiáng)功能迅速翻倍,現(xiàn)在有多種部署選擇支持。
Julie Lockner是ESG的一位高級(jí)分析師,也是《穩(wěn)固的大數(shù)據(jù)分析平臺(tái)》一書的作者,她說(shuō)企業(yè)在考慮他們?nèi)绾伟汛髷?shù)據(jù)技術(shù)整合到他們的架構(gòu)中尤其是當(dāng)它變得價(jià)格可負(fù)擔(dān),并且可擴(kuò)展時(shí)。
部分苦惱源自于大數(shù)據(jù)技術(shù)和術(shù)語(yǔ)的流動(dòng)性,這帶來(lái)了市場(chǎng)混亂的糾結(jié)。Lockner把她的研究命名為“市場(chǎng)前景報(bào)告101”,她相信這種糾結(jié)可以通過(guò)內(nèi)部評(píng)估和培訓(xùn)來(lái)?yè)崞健?/p>
這么做意味著從頭開始,也就是從定義開始。
大數(shù)據(jù)有很多選擇
根據(jù)ESG的報(bào)告:“大數(shù)據(jù)分析項(xiàng)目如雨后春筍般冒了出來(lái),有的甚至還沒(méi)有理解清楚大數(shù)據(jù)真正的含義就開始做了。”
根據(jù)個(gè)人對(duì)這一定義理解的差異,這一術(shù)語(yǔ)的含義有可能擴(kuò)大或者縮小。事實(shí)上,它的定義已經(jīng)變得很寬泛了,ESG給出了他們自己的解釋:“超出正常處理能力邊界和大小的數(shù)據(jù)集,迫使你采取非傳統(tǒng)的方法。”
Lockner表示,問(wèn)題是數(shù)據(jù)量將會(huì)發(fā)展到TB級(jí),當(dāng)前系統(tǒng)上會(huì)開始出現(xiàn)“應(yīng)力性骨折”,常規(guī)用途的技術(shù)在大數(shù)據(jù)以及大數(shù)據(jù)分析面前將不能保證成本高效的方法。那才是企業(yè)應(yīng)該考慮擴(kuò)展他們數(shù)據(jù)中心的時(shí)候。此前,許多大型跨國(guó)公司都在做這樣的項(xiàng)目,但現(xiàn)在有更多可以支付得起的選擇。不管是預(yù)算,還是技能集。”
目前,企業(yè)都使用了大量大數(shù)據(jù)部署方案,有定制開發(fā)的方法,大規(guī)模并行處理數(shù)據(jù)庫(kù),云計(jì)算服務(wù)或者一些可用工具的組合。開源Apache Hadoop項(xiàng)目的加入更激起了持續(xù)增長(zhǎng)的興趣,該開源項(xiàng)目支持大數(shù)據(jù)集分布式處理。
Lockner評(píng)價(jià)說(shuō):“我不記得自HTML誕生之后還有另外哪一種技術(shù)可以產(chǎn)生這么大的影響了。”
像IBM和EMC這樣的供應(yīng)商都想搞清楚如何把Hadoop整合到他們產(chǎn)品服務(wù)中。例如,在1月9日甲骨文推出了大數(shù)據(jù)機(jī),它包含了與Hadoop經(jīng)銷商Cloudera的合作伙伴關(guān)系?,F(xiàn)在的情況是,如果哪家廠商談大數(shù)據(jù)時(shí)沒(méi)有提到Hadoop,你就都不好意思發(fā)布新的產(chǎn)品。
盡管Lockner看到了Hadoop的許多許諾,并且相信今后它將在大部分企業(yè)數(shù)據(jù)中心中存在,但她的研究表明它仍然是一種新興技術(shù),應(yīng)該被用于特定的場(chǎng)景。
大數(shù)據(jù)開始了
企業(yè)要探索在大數(shù)據(jù)分析平臺(tái)上進(jìn)行投資,需要審查供應(yīng)商對(duì)大數(shù)據(jù)的定義,并了解他們的產(chǎn)品與大數(shù)據(jù)的相關(guān)性,這是一個(gè)很好的開始點(diǎn)。Lockner說(shuō):“當(dāng)你與供應(yīng)商交流時(shí),要弄清楚他們產(chǎn)品定位以及能解決的問(wèn)題是什么?”
例如,EMC公司有多款大數(shù)據(jù)產(chǎn)品,比如Greenplum數(shù)據(jù)庫(kù)軟件,Greenplum數(shù)據(jù)計(jì)算設(shè)備和Isilon。這三款產(chǎn)品處理的都是不同類型問(wèn)題。Lockner說(shuō):“你必須真正把洋蔥層層剝開,并做一些功課。”
首先,Lockner推薦客戶依靠他們有良好關(guān)系的供應(yīng)商,要求查看他們大數(shù)據(jù)分析平臺(tái)的演示。這些都是免費(fèi)信息。因?yàn)檫@個(gè)企業(yè)中的人們會(huì)盡力理解他們想做的事,他們應(yīng)該可以對(duì)供應(yīng)商施加壓力。
她推薦客戶也要學(xué)習(xí)針對(duì)他們業(yè)界其它廠商的案例使用情況。這種信息可以幫助看清楚哪些供應(yīng)商是真正的意見領(lǐng)袖,哪些不是。
企業(yè)應(yīng)該依靠他們內(nèi)部的IT部門和他們更有技術(shù)悟性的員工,來(lái)幫助做一些功課。Lockner說(shuō):“通常情況下,一些實(shí)驗(yàn)室項(xiàng)目之類的會(huì)研究新技術(shù),而且如果企業(yè)可以找到那些專家組并與他們集思廣益討論如何做的話,那是一個(gè)相當(dāng)不錯(cuò)的開始。”
但是要真正剝離這些層次,企業(yè)應(yīng)該判斷什么是真正的需求,供應(yīng)商的產(chǎn)品如何能滿足這些需求。據(jù)該報(bào)告認(rèn)為,這意味著要估量清楚內(nèi)部可用技能,數(shù)據(jù)將從哪里來(lái),分析行為需要多快完成,哪些內(nèi)容需要與新平臺(tái)整合。Lockner表示:“理解業(yè)務(wù)需求比擁有出色的技術(shù)更重要。”