IDC:互聯(lián)網(wǎng)擁抱大數(shù)據(jù),數(shù)據(jù)即服務(wù)(DaaS)時代到來 信息來源:IDC中國 日期:2012-05-24 北京,2012年5月24日-- IDC近日發(fā)布研究報告《中國互聯(lián)網(wǎng)市場洞見:互聯(lián)網(wǎng)大數(shù)據(jù)技術(shù)創(chuàng)新研究,2012》,對中國互聯(lián)網(wǎng)行業(yè)圍繞大數(shù)據(jù)的技術(shù)創(chuàng)新進行了專題研究。報告指出,大數(shù)據(jù)正在引領(lǐng)中國互聯(lián)網(wǎng)行業(yè) 新一輪的技術(shù)浪潮,截至2011年底,中國互聯(lián)網(wǎng)行業(yè)持有的數(shù)據(jù)總量已達到1.9EB。IDC預(yù)計,這一規(guī)模到2015年將增長到8.2EB以上。IDC 將大數(shù)據(jù)視為一個融合的體系:具備大規(guī)模的體量、多樣化的種類的數(shù)據(jù)集以及對這種數(shù)據(jù)集進行高速采集、處理與分析以提取價值的技術(shù)架構(gòu)與技術(shù)過程。
互聯(lián)網(wǎng)行業(yè)正在擁抱 大數(shù)據(jù)時代。在這背后,有三個關(guān)鍵的驅(qū)動因素:首先,網(wǎng)絡(luò)技術(shù)的升級和終端設(shè)備的爆發(fā),使今天的用戶能夠使用多種設(shè)備、從不同位置、通過多種手段來接入互聯(lián)網(wǎng),并在這一過程中不斷創(chuàng)造新內(nèi) 容;其次,越來越豐富的在線應(yīng)用與服務(wù),尤其是社會化媒體業(yè)務(wù),在不斷激勵用戶創(chuàng)造和分享數(shù)據(jù),并帶動圖片、視頻等非結(jié)構(gòu)化數(shù)據(jù)的迅速增長;第三,作為一個高滲透力的行業(yè),互聯(lián)網(wǎng)正在同各 個垂直行業(yè)發(fā)生深度的融合,伴隨著這一過程,傳統(tǒng)垂直行業(yè)中原本隱藏于線下的孤島數(shù)據(jù),正在源源不斷地注入在線世界。
IDC中國負責互聯(lián)網(wǎng)與新媒體研究的高級分析師周林表示:“從數(shù)據(jù) 的角度解讀互聯(lián)網(wǎng),各類業(yè)務(wù)的本質(zhì)都是對數(shù)據(jù)資產(chǎn)的采集、整理、加工和變現(xiàn)的過程。因此,大數(shù)據(jù)將成為未來互聯(lián)網(wǎng)經(jīng)濟的石油??吸引用戶貢獻數(shù)據(jù)的能力、持有大型數(shù)據(jù)的能力,以及將大數(shù)據(jù)集 通過分析轉(zhuǎn)化為業(yè)務(wù)價值的能力,將構(gòu)成互聯(lián)網(wǎng)企業(yè)的核心競爭力。同其他行業(yè)相比,互聯(lián)網(wǎng)的數(shù)據(jù)循環(huán)更快,形式更多樣,變化也更為敏捷?;ヂ?lián)網(wǎng)公司必須建立起更為強健和高效的基礎(chǔ)架構(gòu),來從 浩瀚的數(shù)據(jù)中發(fā)掘價值。這決定了互聯(lián)網(wǎng)成為大數(shù)據(jù)技術(shù)創(chuàng)新的前沿。”
作為數(shù)據(jù)運營組織,互聯(lián)網(wǎng)公司正在從大數(shù)據(jù)的存儲、處理與應(yīng)用等各個環(huán)節(jié)推進技術(shù)的創(chuàng)新,這種創(chuàng)新可以從空間和時 間兩個維度進行透視:
1. 從空間維度出發(fā),以非關(guān)系數(shù)據(jù)庫、分布式計算架構(gòu)等為代表,互聯(lián)網(wǎng)公司正在不斷提升數(shù)據(jù)處理的體量,尤其是強化對日益增加的非結(jié)構(gòu)化數(shù)據(jù)的駕馭能力。分布式架構(gòu)還讓互聯(lián)網(wǎng)公司 能夠利用大量相對廉價的服務(wù)器與存儲設(shè)備來應(yīng)對大數(shù)據(jù)集,并靈活地進行彈性部署。這意味著互聯(lián)網(wǎng)行業(yè)正在步入數(shù)據(jù)處理的規(guī)模經(jīng)濟時代,在大數(shù)據(jù)潮流中走在前面的互聯(lián)網(wǎng)公司,能夠贏得明顯的 數(shù)據(jù)成本優(yōu)勢。
2. 從時間維度出發(fā),流式處理、實時計算、內(nèi)存計算等技術(shù)的涌現(xiàn),體現(xiàn)了數(shù)據(jù)處理高度實時化的新趨勢。MapReduce等模型盡管能夠以優(yōu)異的性能完成數(shù)據(jù)的塊式處理,但面對許多在線業(yè)務(wù) 每秒上萬次的動態(tài)并發(fā)查詢,仍然表現(xiàn)得力不從心;而流式計算等架構(gòu)則能夠更好地應(yīng)對這種業(yè)務(wù)場景,將大數(shù)據(jù)的處理進一步推向?qū)崟r。
IDC認為,今后這兩個方向?qū)⑦M一步相互融合,在數(shù)分鐘甚至幾十秒內(nèi),完成TB級乃至PB 級數(shù)據(jù)集的計算,并從中提取富含商業(yè)價值的結(jié)論,將成為互聯(lián)網(wǎng)行業(yè)的新常態(tài)。
大數(shù)據(jù)技術(shù)的演化正在深刻地影響今天的在線業(yè)務(wù)。隨著對大數(shù)據(jù)集分析能力的提升,互聯(lián)網(wǎng)企業(yè)能夠從海量 數(shù)據(jù)中挖掘出用戶的行為習(xí)慣與興趣偏好,反向輸送給業(yè)務(wù)層。這種趨勢既能支持更精準的社會化營銷與廣告投放,直接增加互聯(lián)網(wǎng)公司的收入;同時也能提升在線業(yè)務(wù)的交互體驗,增強用戶的粘性, 降低用戶的召回成本,帶來間接但更持久的價值。
周林最后總結(jié)到:“互聯(lián)網(wǎng)行業(yè)在大數(shù)據(jù)技術(shù)浪潮中的異軍突起,也將為整個信息技術(shù)產(chǎn)業(yè)帶來新的機遇。一方面,大數(shù)據(jù)會催生對IT產(chǎn)品與解 決方案更多的需求,將涵蓋從硬件、軟件到信息服務(wù)等多個層面;另一方面,越來越多的互聯(lián)網(wǎng)公司正在通過云交付的模式,將自身對于大數(shù)據(jù)集的存儲、計算與分析能力開放給第三方,使得數(shù)據(jù)即服 務(wù)(Data as a Service)成為影響產(chǎn)業(yè)格局的新一代業(yè)務(wù)模式。”