冬日的圣何塞,依然舒適,陽光照在臉上溫暖、祥和。Double Tree酒店會議廳,一個有趣的話題正在被激烈地討論著:“大數(shù)據(jù)如此之萬能,那為何我還單身?”
近年來,越來越多的人追捧一句話:“除了相信上帝之外,我們必須相信數(shù)據(jù)。”“大數(shù)據(jù)”以其獨具的海量、多樣性、高價值等特征癡迷了諸多領(lǐng)域的人,似乎它可以解決一切難題。
此刻,這個女孩的問題勾起了美國存儲與網(wǎng)絡(luò)領(lǐng)先廠商LSI公司工程師的興趣。Bob Quinn最先發(fā)言:“這或許是因為你的數(shù)據(jù)有問題。”但是,緊接著,Bob意識到,通過數(shù)據(jù)分析和挖掘,其實可以給出更專業(yè)、有效的解決方案,就像LSI公司日常為客戶提供的業(yè)務(wù)——有效管理海量數(shù)據(jù),同時使數(shù)據(jù)中心實現(xiàn)最高性能和效率。
Bob是LSI企業(yè)戰(zhàn)略辦公室副總裁兼首席技術(shù)專家。Bob的方案是,檢索全球單身男士的數(shù)據(jù)庫,將愛情特征進行量化,最終得出一個理想的結(jié)果。“數(shù)據(jù)架構(gòu)需要改變,原先是單個服務(wù)器鎖定單個目標,現(xiàn)在是多個服務(wù)器追蹤多個目標。” 即,有效管理和分析海量數(shù)據(jù)。
更酷的是,篩選過程可以瞬間完成。“當你進入一個酒吧,看到一個挺順眼的人,分析工具將幫你一秒鐘分析你的DNA和他的DNA,得出結(jié)論,你們的孩子將可以進世界頂級大學(xué),還是會變成一個毒販子。”Bob說道。這一過程追求得是數(shù)據(jù)的最高性能和效率。
這聽上去很酷?事實上,這僅是大數(shù)據(jù)的一個簡單應(yīng)用。隨著數(shù)據(jù)分析、存儲和管理將滲透到更多的行業(yè)和部門,從領(lǐng)先的互聯(lián)網(wǎng)應(yīng)用,到相對傳統(tǒng)的銀行、電信、保險、運輸?shù)阮I(lǐng)域,大數(shù)據(jù)產(chǎn)生的價值將超乎想象。
大數(shù)據(jù)并不遙遠,也不神秘。在IT基礎(chǔ)設(shè)施服務(wù)商和應(yīng)用廠商的共同努力下,未來有一天,它將像水、電、煤一樣成為我們?nèi)粘I畹囊徊糠帧?/p>
商業(yè)模式仍然是謎
言必及“數(shù)據(jù)”時代,大數(shù)據(jù)到底發(fā)展到什么程度?
麥肯錫、IDC等咨詢機構(gòu)發(fā)布過一系列令人瞠目結(jié)舌的統(tǒng)計報告。有數(shù)據(jù)統(tǒng)計顯示,移動互聯(lián)網(wǎng)時代的數(shù)據(jù)飛速增長,過去3年產(chǎn)生的數(shù)據(jù)量比過去4萬年還要多。
數(shù)據(jù)從生成到消耗,時間窗口非常小。每秒鐘,人們發(fā)送290萬封電子郵件;每分鐘,人們向Youtube上傳60小時的視頻;每一天,人們在Facebook上發(fā)出40億條信息。
但是,這一切僅僅說明大數(shù)據(jù)具備大規(guī)模爆發(fā)的基礎(chǔ),就如埋藏地下千年的石油寶藏一樣豐富,而能否像石油一樣被人們開采、利用,卻是另外一回事。
目前,大數(shù)據(jù)在日常生活中已經(jīng)開始應(yīng)用。例如:阿里巴巴、亞馬遜等電子商務(wù)網(wǎng)站從用戶以往瀏覽、購買行為中挖掘潛在需求;Google逾10億美元收購的以色列地圖公司W(wǎng)aze根據(jù)實時信息告訴用戶哪條路線狀況最好等。
不過,LSI公司總裁兼首席執(zhí)行官Abhi Talwalkar接受21世紀經(jīng)濟報道記者采訪時認為:“大數(shù)據(jù)仍然處于早期發(fā)展階段,離大規(guī)模商業(yè)化或者盈利仍然有非常遙遠的路途。”
目前,大數(shù)據(jù)的采集仍然以結(jié)構(gòu)化數(shù)據(jù)為主,非結(jié)構(gòu)化大數(shù)據(jù)的價值遠遠未被挖掘出來。據(jù)統(tǒng)計顯示,10%的結(jié)構(gòu)化數(shù)據(jù),存儲在數(shù)據(jù)庫中;而有90%的非結(jié)構(gòu)化數(shù)據(jù),與人類信息密切相關(guān),如:郵件、視頻、微博、位置信息、鏈接信息等。
Bob告訴21世紀經(jīng)濟報道記者,目前,大數(shù)據(jù)價值主要有兩方面:一個是像谷歌、Facebook等公司具備廣告價值的數(shù)據(jù),這通常被稱為“麥迪遜大道”。目前,大概有80%的數(shù)據(jù)商業(yè)價值都和廣告業(yè)務(wù)有關(guān)。另外一個是從數(shù)據(jù)中抽取信息的商業(yè)價值,規(guī)模還比較小。
“但是,未來十年,廣告將是大數(shù)據(jù)盈利化中價值最小的一部分。”Bob認為。
以中國市場為例,目前,百度、阿里巴巴和騰訊三家互聯(lián)網(wǎng)巨頭流量的轉(zhuǎn)化價值不同。百度和阿里的每個PV轉(zhuǎn)化差不多是五分錢,而騰訊不到一分錢。這背后是搜索引擎和電子商務(wù)產(chǎn)生的廣告價值要高于網(wǎng)絡(luò)瀏覽的數(shù)據(jù)價值導(dǎo)致。
然而,這個現(xiàn)象可能不久就會被顛覆。“當兩套不同的數(shù)據(jù),一個是直接與金錢相關(guān)的交易型數(shù)據(jù),一個是生活形態(tài)的數(shù)據(jù),兩者相互結(jié)合反映個人或者生活的全貌時,它所爆發(fā)出的商業(yè)價值將是另外一番景象。”Bob說道。
遺憾得是,銀行、電信、保險等行業(yè)的大量交易型數(shù)據(jù)和信息,都還處在休眠或者半休眠的狀態(tài),商業(yè)價值被嚴重忽略、低估。生活、娛樂等非結(jié)構(gòu)化的數(shù)據(jù)價值挖掘,也只是起步階段。