什么是大數(shù)據(jù)?編輯記者們旁征博引,試圖將數(shù)據(jù)堆砌的商業(yè)案例剔除,真正的、實用性強(qiáng)的數(shù)據(jù)挖掘故事留下。
我們報道的是偽大數(shù)據(jù)公司?我們是否成為《駕馭大數(shù)據(jù)》一書的作者Bill Franks所稱的“大數(shù)據(jù)騙局”中的一股力量?同樣的質(zhì)疑發(fā)生在阿里巴巴身上。有消息稱,3月23日,阿里巴巴以7000萬美元收購了一家移動開發(fā)者數(shù)據(jù)統(tǒng)計平臺。這引發(fā)了專家們熱烈討論,它收購的真是一家大數(shù)據(jù)公司嗎?
這些質(zhì)疑并非沒有道理。
中國確實沒有大數(shù)據(jù)的土壤。“差不多先生”、“大概齊”的文化標(biāo)簽一直存在。很多時候,各級政府不太需要“大數(shù)據(jù)”,形成決策的關(guān)鍵性數(shù)據(jù)只有一個數(shù)字比率(GDP)而已;其二,對于行業(yè)主管機(jī)構(gòu)來說,它們擁有大量原始數(shù)據(jù),但它們還在試探、摸索數(shù)據(jù)開放的尺度,比如說,是開放原始數(shù)據(jù),還是開放經(jīng)過各種加工的數(shù)據(jù)?是轉(zhuǎn)讓給擁有更高級計算和儲存能力的大型數(shù)據(jù)公司,還是將數(shù)據(jù)開源,與各種各樣的企業(yè)共享?其三,數(shù)據(jù)挖掘的工具價值并沒有完全被認(rèn)同。在這個領(lǐng)域,硬件和軟件的發(fā)展并不十分成熟。
即便如此,沒有人否認(rèn)數(shù)據(jù)革命的到來,尤其在互聯(lián)網(wǎng)行業(yè)。阿里巴巴的馬云將大數(shù)據(jù)作為戰(zhàn)略方向,百度的李彥宏用“框計算”來謀劃未來。即便是CBA(中國男子籃球職業(yè)聯(lián)賽)也學(xué)起了NBA(美國男籃職業(yè)聯(lián)賽)五花八門的數(shù)據(jù)統(tǒng)計、分析與挖掘。
在過去兩年間,大量的資本投資一些新型數(shù)據(jù)工具公司,根據(jù)美國道瓊斯風(fēng)險資源(Dow Jones VentureSource)的數(shù)據(jù),在過去的兩年時間里,11.7億美元流向了119家數(shù)據(jù)庫軟件公司。去年,SAP市值已經(jīng)超過西門子,成為德國市值最高的上市公司,而這樣的業(yè)績部分得益于其數(shù)據(jù)庫軟件HANA的商業(yè)化,去年一年時間里HANA帶給SAP3.92億歐元的收入,增長了142%。
但是,大數(shù)據(jù)還沒法分析、挖掘出自己的直接變現(xiàn)能力。在截稿日時,我們再重新讀維克托·邁爾-舍恩伯格(Viktor Mayer-Schonberger)的《大數(shù)據(jù)時代:生活、工作與思維的大變革》一書,作者相信,未來,數(shù)據(jù)會成為有價值的資產(chǎn)。假以時日,它會大搖大擺地進(jìn)入資產(chǎn)負(fù)債表里。
案例1:農(nóng)夫山泉用大數(shù)據(jù)賣礦泉水
發(fā)揮您的想象力,選擇您認(rèn)為可是的答案
這里是上海城鄉(xiāng)結(jié)合部九亭鎮(zhèn)新華都超市的一個角落,農(nóng)夫山泉的礦泉水堆頭靜靜地擺放在這里。來自農(nóng)夫山泉的業(yè)務(wù)員每天例行公事地來到這個點(diǎn),拍攝10張照片:水怎么擺放、位置有什么變化、高度如何……這樣的點(diǎn)每個業(yè)務(wù)員一天要跑15個,按照規(guī)定,下班之前150張照片就被傳回了杭州總部。每個業(yè)務(wù)員,每天會產(chǎn)生的數(shù)據(jù)量在10M,這似乎并不是個大數(shù)字。
但農(nóng)夫山泉全國有10000個業(yè)務(wù)員,這樣每天的數(shù)據(jù)就是100G,每月為3TB。當(dāng)這些圖片如雪片般進(jìn)入農(nóng)夫山泉在杭州的機(jī)房時,這家公司的CIO胡健就會有這么一種感覺:守著一座金山,卻不知道從哪里挖下第一鍬。
胡健想知道的問題包括:怎樣擺放水堆更能促進(jìn)銷售?什么年齡的消費(fèi)者在水堆前停留更久,他們一次購買的量多大?氣溫的變化讓購買行為發(fā)生了哪些改變?競爭對手的新包裝對銷售產(chǎn)生了怎樣的影響?不少問題目前也可以回答,但它們更多是基于經(jīng)驗,而不是基于數(shù)據(jù)。
從2008年開始,業(yè)務(wù)員拍攝的照片就這么被收集起來,如果按照數(shù)據(jù)的屬性來分類,“圖片”屬于典型的非關(guān)系型數(shù)據(jù),還包括視頻、音頻等。要系統(tǒng)地對非關(guān)系型數(shù)據(jù)進(jìn)行分析是胡健設(shè)想的下一步計劃,這是農(nóng)夫山泉在“大數(shù)據(jù)時代”必須邁出的步驟。如果超市、金融公司與農(nóng)夫山泉有某種渠道來分享信息,如果類似圖像、視頻和音頻資料可以系統(tǒng)分析,如果人的位置有更多的方式可以被監(jiān)測到,那么攤開在胡健面前的就是一幅基于人消費(fèi)行為的畫卷,而描繪畫卷的是一組組復(fù)雜的“0、1、1、0”。
SAP全球執(zhí)行副總裁、中國研究院院長孫小群接受《中國企業(yè)家》采訪時表示,企業(yè)對于數(shù)據(jù)的挖掘使用分三個階段,“一開始是把數(shù)據(jù)變得透明,讓大家看到數(shù)據(jù),能夠看到數(shù)據(jù)越來越多;第二步是可以提問題,可以形成互動,很多支持的工具來幫我們做出實時分析;而3.0時代,信息流來指導(dǎo)物流和資金流,現(xiàn)在數(shù)據(jù)要告訴我們未來,告訴我們往什么地方走。”