大數據的應用前景之廣大已經毋庸置疑。企業(yè)CEO、CIO在討論商業(yè)策略、IT模式創(chuàng)新時幾乎言必談大數據。Gartner發(fā)布的《Big Data Drives Rapid Changes in Infrastructure and 2 Billion in IT Spending Through 2016》(《大數據驅動基礎架構的快速變化,2016年相關IT支出將達2320億美元》)報告指出,2013年大數據帶動的IT支出有望達到340億美元;到2016年,全球在大數據方面的總支出將達到2320億美元。Gartner強調,大數據分析工具在2014年將被視為一種必要投資。
本文作者:甲骨文公司副總裁兼大中華區(qū)技術總經理 喻思成
如何充分利用大數據,挖掘大數據的商業(yè)價值,從而提升企業(yè)的競爭力,已經成為企業(yè)關注的一個焦點。這也是甲骨文公司努力的方向。
全面解決方案才能奏效
當前,越來越多企業(yè)將大數據的分析結果作為其判斷未來發(fā)展的依據。同時,傳統(tǒng)的商業(yè)預測邏輯正日益被新的大數據預測所取代。但是,我們要謹慎管理大家對大數據的期望值,因為海量數據只有在得到有效治理的前提下才能進一步發(fā)展其業(yè)務價值。
最廣為人知的大數據定義是Gartner給出的大數據的3V特性:巨大的數據量(Volume)、數據的快速處理(Velocity)、多變的數據結構和類型(Variety)。根據這一定義,大家首先想到的是IT系統(tǒng)中一直難以處理卻又不容忽視的非結構化數據。也就是說,大數據不僅要處理好交易型數據的分析,還把社交媒體、電子商務、決策支持等信息都融入進來?,F在,分布式處理技術Hadoop和NoSQL已經能對非結構化數據進行存儲、處理、分析和挖掘,但未能為滿足客戶的大數據需求提供一個全面的解決方案。
事實上,普遍意義上的大數據范圍更加廣泛,任何涉及海量數據及多數據源的復雜計算,均屬大數據范疇,而不僅局限于非結構化數據。因此,諸如電信運營商所擁有的巨量用戶的各類詳細數據、手機開關機信息、手機在網注冊信息、手機通話計費信息、手機上網詳細日志信息、用戶漫游信息、用戶訂閱服務信息和用戶基礎服務信息等,均可劃歸為大數據。
與幾年前興起的云計算相比,大數據實現其業(yè)務價值所要走的路或許更為長遠。但是企業(yè)用戶已經迫不及待,越來越多企業(yè)高層傾向于將大數據分析結果作為其商業(yè)決策的重要依據。在這種背景下,我們必須找到一種全面的大數據解決方案,不僅要解決非結構化數據的處理問題,還要將功能擴展到海量數據的存儲、大數據的分布式采集和交換、海量數據的實時快速訪問、統(tǒng)計分析與挖掘和商務智能分析等。
典型的大數據解決方案應該是具有多種能力的平臺化解決方案,這些能力包括結構化數據的存儲、計算、分析和挖掘,多結構化數據的存儲、加工和處理,以及大數據的商務智能分析。這種解決方案在技術應具有以下四個特性:軟硬集成化的大數據處理、全結構化數據處理的能力、大規(guī)模內存計算的能力、超高網絡速度的訪問。