與信息時代一起誕生的數(shù)據(jù),首次成為變革的主角,并敲開了一扇價值數(shù)百億的財富之門。業(yè)界將之命名為“大數(shù)據(jù)”。大數(shù)據(jù)的價值從何而來?人們又該如何從中掘金?中國市場的機會又當如何把握?為解讀上述問題,本報記者采訪了多位業(yè)界專家和證券分析人士,推出“大數(shù)據(jù)”系列解讀文章,試圖從商業(yè)價值、贏利模式的角度對之進行剖析,并尋找中國市場上大數(shù)據(jù)的商業(yè)機會。
本報記者 原詩萌
1997年,當時的國際象棋冠軍斯帕羅夫以1勝2負3平的成績輸給IBM的“深藍II”電腦。2012年2月,類似的一幕“人機大戰(zhàn)”再度上演,這一次,是IBM的“沃森”電腦在“Jeopardy!”(危險邊緣)智力競賽節(jié)目中擊敗了兩位冠軍選手詹寧斯和魯特。
如果說,深藍II擊敗斯帕羅夫意味著計算機在某領(lǐng)域?qū)θ祟愡壿嬐评砟芰Φ某剑敲次稚膭倮麆t代表著計算機理解能力的新飛躍在問答節(jié)目中,沃森必須要準確理解人類語言的意義,才能給出正確的答案。
在今天這樣一個數(shù)據(jù)暴漲的時代,沃森的分析和理解能力無疑具有更大的價值目前,美國第三大銀行花旗集團已成為沃森的首位金融領(lǐng)域客戶。沃森通過閱讀年報、招股說明書、貸款績效、收益質(zhì)量并進行思考,幫助花旗集團進行證券組合投資的風險管理。
沃森對海量信息進行分析處理、發(fā)掘價值并作出預(yù)測的能力,正是當前備受市場追捧的“大數(shù)據(jù)”技術(shù)。據(jù)分析機構(gòu)Wikibon最近發(fā)布的一份報告稱,大數(shù)據(jù)市場正處在井噴式增長的前夕,未來五年全球大數(shù)據(jù)市場價值將高達500億美元。
新的革命
社交網(wǎng)站Facebook每天產(chǎn)生32億條消息,3億張照片,每周新增圖片總量達60TB。而提供云計算服務(wù)的亞馬遜EC2,目前的服務(wù)器數(shù)量已達45萬臺。
“新聞報道、實時評論、廣告宣傳、元數(shù)據(jù)、冗余備份……除了由人產(chǎn)生的數(shù)據(jù),更大一部分數(shù)據(jù)從物理世界而來。”中國科學院軟件研究所總體部副主任武延軍如此解釋數(shù)據(jù)暴漲的原因。
在Web 1.0時代,Web內(nèi)容主要由網(wǎng)站提供;Web 2.0時代,則由用戶參與Web內(nèi)容來貢獻。在武延軍看來,我們現(xiàn)在正邁向Web 3.0時代,其特征是人、機、物共同參與Web內(nèi)容的貢獻,使Web形成對真實世界的全面映射。
“人、機、物融合的大數(shù)據(jù)將推動Web進入嶄新的Web 3.0時代。”武延軍說。
數(shù)據(jù)暴漲的背后,是人們對于數(shù)據(jù)價值的需求。業(yè)界將大數(shù)據(jù)的特點總結(jié)為四個“V”,即多樣性(Variety)、體量(Volume)、速度(Velocity)和價值(Value),其中后兩個特征,正反映出了人們對于更高效地處理數(shù)據(jù),并獲取價值的需求。
“大數(shù)據(jù)概念現(xiàn)在之所以這么熱,就是因為現(xiàn)有的數(shù)據(jù)庫、商業(yè)智能等工具,已經(jīng)很難應(yīng)對大數(shù)據(jù)的規(guī)模和復(fù)雜性了。”致力于提供大數(shù)據(jù)技術(shù)解決方案的北京拓爾思信息技術(shù)有限公司總裁施水才說。
如何改變世界
為何現(xiàn)在人們?nèi)绱藷嶂杂趯Υ髷?shù)據(jù)的分析和整理?它究竟有多重要呢?
索尼公司前首席執(zhí)行官出井伸之的一番話,或許可以解開這一疑問。他在談到索尼衰落的原因時曾說,新一代基于互聯(lián)網(wǎng)基因的企業(yè)的核心能力,是利用新模式和新技術(shù),更貼近消費者,更深刻理解需求,高效分析信息并作出判斷,而像索尼這樣傳統(tǒng)的產(chǎn)品公司,則日漸淪為上述新興平臺級公司的附庸。
一個正面的例子則來自紙業(yè)公司恒安國際。在一次免費派發(fā)自己的產(chǎn)品嬰兒用紙尿褲時,正是由于成功應(yīng)用了大數(shù)據(jù)技術(shù),恒安國際成功地找到了自己潛在的客戶,即那些準備生小孩的女性,從而提升了自己的品牌和銷量。
麥肯錫公司在2011年10月的一篇《你準備好迎接大數(shù)據(jù)時代了嗎》中指出,最新的學術(shù)研究表明,利用數(shù)據(jù)和商業(yè)分析來指導決策的企業(yè),比沒有這樣做的企業(yè)的勞動生產(chǎn)率更高,凈資產(chǎn)收益率也更高。
這篇文章甚至斷言,未來大數(shù)據(jù)完全能夠成為企業(yè)的新興資產(chǎn),形成競爭力的重要基礎(chǔ),正如強大的品牌一樣。
國金證券TMT行業(yè)分析師趙國棟是大數(shù)據(jù)技術(shù)的積極推動者。迄今他和團隊已經(jīng)寫了三篇相關(guān)研究報告。他向《中國科學報》記者指出,這一輪大數(shù)據(jù)的變革,事關(guān)企業(yè)的命運。“時代變了,判斷企業(yè)價值的標準、判斷軟件價值的標準也變了。”
北京時代計世資訊有限公司首席分析師丁震也對《中國科學報》記者表示,在過去,數(shù)據(jù)只是公司的內(nèi)部資產(chǎn),而現(xiàn)在,數(shù)據(jù)則成為公司更核心的戰(zhàn)略資源,公司希望能夠用數(shù)據(jù)去推動業(yè)務(wù)發(fā)展,并作為市場競爭中的武器。
資深開源專家Doc Searls在新書《意圖性經(jīng)濟》中指出,比起等待賣家來瞎猜我們想要什么,我們可以主動將自己的意圖告知市場,形成新的平衡。那些積極響應(yīng)我們意圖的公司,可以花更少的廣告費,獲得更多利潤和忠誠的客戶。
巨大的潛力
擁有如此巨大“能量”的大數(shù)據(jù),也引發(fā)了資本市場的競逐。10gen是一家從事海量數(shù)據(jù)處理的初創(chuàng)公司,今年5月,這家公司獲得了4200萬美元的投資,目前估值已超過5億美元。
數(shù)據(jù)處理公司還成為跨國公司競購的目標。2010年下半年,IBM先后收購了從事數(shù)據(jù)庫分析的Netezza公司和提供網(wǎng)絡(luò)分析軟件的Coremetrics,而惠普則于2011年斥資104億美元將擅長于語義分析的英國軟件公司Automony收入囊中。
而那些同時擁有海量數(shù)據(jù)和處理能力的公司,更是受到市場的熱捧,F(xiàn)acebook的首次公開募股(IPO)和新浪微博上線后新浪股價的暴漲,便是這方面典型的例證。
大數(shù)據(jù)還擁有更廣闊的前景。今年5月24日由丘吉爾俱樂部舉辦的第十屆“十大科技趨勢”研討會上,大數(shù)據(jù)亦位列其中。參與研討會的LinkedIn創(chuàng)始人Reid Hoffman表示,這一趨勢加上移動計算設(shè)備、社交媒體和云計算,可以創(chuàng)造出一種連接并利用所有數(shù)據(jù)的新應(yīng)用,在娛樂、醫(yī)療、交通控制等方面發(fā)揮作用。
趙國棟也對《中國科學報》記者表示,由于大數(shù)據(jù)具備體量巨大、價值稀疏、時效性強等特點,對現(xiàn)有企業(yè)信息架構(gòu)、系統(tǒng)的沖擊不言而喻。他認為,在不遠的未來,大數(shù)據(jù)技術(shù)將引發(fā)政府、公共事業(yè)、制造業(yè)、流通等領(lǐng)域的全面變革,而在這一輪的變革當中,首先獲益的是計算機產(chǎn)業(yè)。
事實上,一些IT公司已經(jīng)開始嘗到甜頭。2012年第一季度,數(shù)據(jù)存儲公司EMC銷售額為50.9億美元,利潤5.87億美元,同比增長23%。EMC首席營銷官杰里米?伯頓在5月22日于拉斯維加斯舉行的“EMC World”上透露,受大數(shù)據(jù)相關(guān)業(yè)務(wù)驅(qū)動,預(yù)計2014年EMC營收將增長至280億美元。
一扇有關(guān)大數(shù)據(jù)的財富之門正在被打開。