【中云網(wǎng) 譯文】分析師認(rèn)為:大數(shù)據(jù)是用于戰(zhàn)略決策的工具,而非一項(xiàng)僅用于技術(shù)性搜索的普通技術(shù)。
很少有技術(shù)行業(yè)的俏皮話能像“大數(shù)據(jù)”這般頻繁見諸于眾,但是盡管大數(shù)據(jù)炒作依然蓬勃不息,它依然穩(wěn)步邁向現(xiàn)實(shí)的成功之路上,傳統(tǒng)企業(yè)也能發(fā)展大數(shù)據(jù)戰(zhàn)略。一些IDC分析師堅(jiān)持此觀點(diǎn)。
“我們當(dāng)前所處的時(shí)代確實(shí)存在太多的炒作泡沫,太多不切實(shí)際的許諾”,IDC分析師Dan Vesset在3月13日波士頓舉辦的2013研究機(jī)構(gòu)指導(dǎo)會(huì)議中的圓桌討論環(huán)節(jié)承認(rèn),“問(wèn)題是何為真實(shí)?短期內(nèi)企業(yè)又該且必須做些什么?”
根據(jù)Vesset的介紹,IDG新聞服務(wù)中心的母公司國(guó)際數(shù)據(jù)集團(tuán)所屬的IDC公司,將大數(shù)據(jù)定義為“以各種各樣的信息源中存有的龐大數(shù)據(jù)量為來(lái)源,能產(chǎn)生新經(jīng)濟(jì)價(jià)值的信息驅(qū)動(dòng)型戰(zhàn)略決策制定工具”。
第一點(diǎn)非常關(guān)鍵,Vesset強(qiáng)調(diào)。
“我們可以安裝所有的技術(shù)但事情的關(guān)鍵在于如何提高決策水平”Vesset指出,“我們可以部署全球最卓越的Hadoop系統(tǒng),但問(wèn)題不會(huì)就此解決”,在談到當(dāng)前流行的大數(shù)據(jù)運(yùn)動(dòng)的代名詞--開源數(shù)據(jù)進(jìn)程架構(gòu)時(shí),他補(bǔ)充道。
根據(jù)某網(wǎng)站內(nèi)容,司機(jī)插入到汽車診斷端口上的設(shè)備驅(qū)動(dòng)程序可以階段性地獲取數(shù)據(jù)。該程序可以追蹤司機(jī)猛踩剎車的頻率、深夜開車及其他可能的危險(xiǎn)駕駛習(xí)慣。如果數(shù)據(jù)顯示司機(jī)正在安全駕駛,他們可以享受顯著的保費(fèi)折扣優(yōu)惠。
同時(shí),根據(jù)Vesset的觀點(diǎn),企業(yè)想成功實(shí)施他們的大數(shù)據(jù)計(jì)劃依然面臨著一連串的挑戰(zhàn),如面臨哪些數(shù)據(jù)該存儲(chǔ)、哪些數(shù)據(jù)又該拋棄的兩難境地,掌握所需技術(shù)的成本,以及具備關(guān)必要技能的IT專業(yè)人才的空缺等。
最后一個(gè)挑戰(zhàn)很有可能在可預(yù)見的一段時(shí)間內(nèi)成為最嚴(yán)重的問(wèn)題,Versace預(yù)計(jì),“基因池現(xiàn)在越來(lái)越淺。”
伴隨大數(shù)據(jù)而來(lái)的還有一些錯(cuò)誤的觀念,Vesset坦承。比如“不是什么大數(shù)據(jù)都跟社交媒體相關(guān)”,他表示,“這對(duì)大數(shù)據(jù)而言是一個(gè)很大的謬論,大數(shù)據(jù)是有關(guān)點(diǎn)擊流分析的工具。”
鑒于Hadoop面向大批量分批處理,也不針對(duì)實(shí)時(shí)監(jiān)控,就像當(dāng)火車運(yùn)載貨物時(shí),鐵路公司會(huì)追蹤某些特定零部件的性能那樣,因而不能視作唯一的解決方案。
Vesset表示,IDC估計(jì)10%~12%的北美機(jī)構(gòu)已經(jīng)在以某種形式“使用”Hadoop系統(tǒng)。
該分析公司已為大數(shù)據(jù)制定了一個(gè)“成熟度模型”,Vesset和Versace在演講中這樣描述。模型橫跨五大目標(biāo)領(lǐng)域:數(shù)據(jù)、人群、流程、技術(shù)和內(nèi)容;同時(shí)也設(shè)定了部署大數(shù)據(jù)的五個(gè)階段:臨時(shí)性部署,機(jī)遇性部署,可重復(fù)性部署,可管理性部署,已優(yōu)化的部署。
分析師介紹,企業(yè)開始大數(shù)據(jù)的第一步是確認(rèn)用新方法來(lái)充分利用現(xiàn)有技術(shù)和數(shù)據(jù)的機(jī)會(huì),評(píng)估公共云與開源選項(xiàng),并開始嘗試實(shí)驗(yàn)概念型訓(xùn)練和原型操作。
他們認(rèn)為,在接下來(lái)的一至兩年,這些企業(yè)應(yīng)當(dāng)著眼于利用大數(shù)據(jù)項(xiàng)目的早期成果來(lái)證明更大努力所需的資金。在同一時(shí)期,向那些已經(jīng)在大數(shù)據(jù)項(xiàng)目中勝出的商業(yè)部門尋求贊助也是明智的選擇。
那些被視作大數(shù)據(jù)的80%的數(shù)據(jù)都是非結(jié)構(gòu)化或半結(jié)構(gòu)化信息,IDC分析師David Schubmehl本周三(3月13日)在另一個(gè)演講中指出,這些數(shù)據(jù)的來(lái)源廣泛,從來(lái)自點(diǎn)擊流的任意數(shù)據(jù),到專利記錄、研究成果甚至視頻等等。
這種多樣性將導(dǎo)致新技術(shù)的產(chǎn)生,它被IDC稱作是統(tǒng)一的信息訪問(wèn)技術(shù),證明產(chǎn)品就是Oracle公司的Endeca與IBM推出的Vivisimo,也有專門的生產(chǎn)廠商如Attivio。
在同一個(gè)演講中,IDC分析師Carl Olofson警告,隨著如圖片和內(nèi)存數(shù)據(jù)庫(kù)平臺(tái)等技術(shù)的日益突出,大數(shù)據(jù)的挑戰(zhàn)也會(huì)持續(xù)影響到數(shù)據(jù)庫(kù)行業(yè)。
隨著性能的拓展,傳統(tǒng)的關(guān)聯(lián)數(shù)據(jù)庫(kù)也會(huì)有所改變。當(dāng)提到關(guān)聯(lián)模型之父時(shí),Olofson調(diào)侃“到那時(shí)候Ted Codd也許會(huì)認(rèn)不出這些”。
來(lái)源:www.techworld.com
作者:Chris Kanaracus