

當(dāng)一切都可以量化,大數(shù)據(jù)本身就會(huì)說話。我們對(duì)商機(jī)的發(fā)現(xiàn)其實(shí)就是聽的能力——只是傳統(tǒng)的耳朵未必聽得見“不可能”的聲音。
從萬事萬物中提取數(shù)據(jù)并存儲(chǔ)數(shù)據(jù),這是大數(shù)據(jù)開發(fā)的前提也是產(chǎn)業(yè)鏈的上游
世界上萬事萬物都可以轉(zhuǎn)化成數(shù)據(jù),而“轉(zhuǎn)化”本身就有著巨大的技術(shù)含量,因此,它無疑是產(chǎn)業(yè)鏈的上游。
在人類社會(huì)的發(fā)展歷程中,計(jì)量從長度、重量不斷擴(kuò)展到面積、體積和時(shí)間,可以說相當(dāng)漫長。19世紀(jì)隨著科學(xué)家發(fā)明新工具,電流、氣壓、溫度、聲頻之類的自然現(xiàn)象被量化,其間只經(jīng)過了一兩百年的時(shí)間。而計(jì)算機(jī)把世界推上大數(shù)據(jù)階段,僅僅四五十年時(shí)間。
文字可以變成數(shù)據(jù),谷歌有了數(shù)字圖書館,我們都有數(shù)據(jù)化的書籍;方位可以變成數(shù)據(jù),只要你的手機(jī)裝有百度地圖,GPS導(dǎo)航就能用一組數(shù)字顯示你的位置;溝通可以變成數(shù)據(jù),社交網(wǎng)絡(luò)將我們?nèi)粘I畹臒o形元素包括情緒提煉成了數(shù)據(jù);甚至作為人本身,我們也一樣被數(shù)據(jù)化了,喬布斯在癌癥治療過程中,醫(yī)生就為他制作了一個(gè)包括整個(gè)基因密碼的數(shù)據(jù)文檔。
數(shù)據(jù)化本身造就了一個(gè)一個(gè)商機(jī)。美國四大機(jī)票預(yù)訂系統(tǒng)之一的ITA僅將數(shù)據(jù)賣給Farecast就是一筆不小的收入。在中國,許多銀行保險(xiǎn)公司都愿與網(wǎng)絡(luò)公司合作,它們看中的正是網(wǎng)絡(luò)公司的數(shù)據(jù)。在深圳,我們??吹街锌圃荷钲谙冗M(jìn)技術(shù)研究院的一輛怪異的汽車在街上行走,它就是為深圳“智慧城市”建設(shè)采集數(shù)據(jù)的,只可惜,它不是企業(yè)行為。
把萬事萬物轉(zhuǎn)化為數(shù)據(jù),還需要存儲(chǔ)數(shù)據(jù)。事實(shí)上,大數(shù)據(jù)時(shí)代正是隨著存儲(chǔ)設(shè)備的大幅降價(jià)而成為現(xiàn)實(shí)的。目前Facebook每天要存儲(chǔ)大約100TB的用戶數(shù)據(jù),美國國家航空航天局每天要處理約24TB的數(shù)據(jù),只要推想一下,就能估算數(shù)據(jù)存儲(chǔ)市場(chǎng)有多大。
在大數(shù)據(jù)存儲(chǔ)產(chǎn)品上,華為一直走在國內(nèi)企業(yè)的前列,它們推出的N8000、CSS已為全球客戶所青睞。作為高性能存儲(chǔ)的一個(gè)指標(biāo),華為的大數(shù)據(jù)解決方案在不久前的測(cè)試中達(dá)到300萬OPS,也就是說每秒能進(jìn)行300萬個(gè)操作。
數(shù)據(jù)巨大的、不斷被開發(fā)的潛在價(jià)值,為技術(shù)類公司和分析類公司提供了市場(chǎng)
數(shù)據(jù)本身不是生產(chǎn)力,只有通過技術(shù)分析才能產(chǎn)生價(jià)值。正如谷歌一位負(fù)責(zé)人所說,數(shù)據(jù)只是一個(gè)新的生產(chǎn)要素,原始材料從數(shù)字流水線的一端輸入,而處理后的信息則從另一端輸出。
當(dāng)然,對(duì)數(shù)據(jù)進(jìn)行處理分析,遠(yuǎn)非谷歌負(fù)責(zé)人說的這么簡單,不然就不會(huì)有眾多的數(shù)據(jù)技術(shù)類和分析類公司。一個(gè)叫MasterCard Advisors的部門收集和分析來自210個(gè)國家的15億信用卡用戶的650億條交易記錄,用來預(yù)測(cè)商業(yè)發(fā)展和客戶的消費(fèi)趨勢(shì),并把這些分析結(jié)果賣給其他公司。美國Inrix公司通過匯集美洲和歐洲1億輛汽車的實(shí)時(shí)交通數(shù)據(jù),采用軟件分析預(yù)測(cè)交通狀況并同步到衛(wèi)星導(dǎo)航系統(tǒng)中。它們吃的都是技術(shù)和分析這碗飯。
數(shù)據(jù)具有再利用性,它不會(huì)因已使用就失去價(jià)值;數(shù)據(jù)具有可重組性,當(dāng)一個(gè)數(shù)據(jù)與另一個(gè)數(shù)據(jù)結(jié)合,它就可能產(chǎn)生新的創(chuàng)意;數(shù)據(jù)具有可擴(kuò)展性,一個(gè)數(shù)據(jù),本來為一個(gè)目標(biāo)而采集的數(shù)據(jù)結(jié)果常常一舉數(shù)得。數(shù)據(jù)的這些特點(diǎn),讓數(shù)據(jù)分析具有無限的可能,只要我們擁有數(shù)據(jù)分析工具以及必需的設(shè)備 ,我們就可以在更多領(lǐng)域更快更大規(guī)模地處理數(shù)據(jù),創(chuàng)業(yè)的機(jī)會(huì)無處不在。
那么,我們說的數(shù)據(jù)分析專才是什么樣的人呢?是計(jì)算機(jī)專業(yè)人才嗎?不一定。他們可能是計(jì)算機(jī)外行,但只要他們所具有思維的不受限制——用行業(yè)術(shù)語表達(dá)就是“大數(shù)據(jù)思維”,他可能就是專才。“他們思考的只有可能,而不考慮所謂的可行”,這是數(shù)據(jù)分析對(duì)人才提出的要求。
據(jù)麥肯錫全球研究所的一項(xiàng)調(diào)查,目前,美國需要19萬名以上具備“深度分析”專長的人員,而對(duì)具備數(shù)據(jù)知識(shí)的經(jīng)理的需求超過150萬。有人甚至預(yù)測(cè),隨著數(shù)據(jù)科學(xué)家的崛起,行業(yè)專家必將消亡,理由是“數(shù)據(jù)科學(xué)家不受舊觀念的影響,能夠聆聽數(shù)據(jù)發(fā)出的聲音。”
大數(shù)據(jù)引發(fā)思維變革,傳統(tǒng)產(chǎn)業(yè)在新思維的審視中將充滿前所未有的生機(jī)
大數(shù)據(jù)是人類歷史上的一個(gè)里程碑,它使人類第一次有條件獲得和使用全面的、完整的和系統(tǒng)的數(shù)據(jù),它所引發(fā)的思維變革必將使傳統(tǒng)產(chǎn)業(yè)因?yàn)閯?chuàng)新而充滿前所未有的生機(jī)。
《紙牌屋》是被中國網(wǎng)友們戲稱為“白宮甄嬛傳”的美國政治懸疑劇,它目前正在全球四十多個(gè)國家熱播。這個(gè)叫Netflix的視頻網(wǎng)站首次自制的電視連續(xù)劇何以能成功?原因是,它們擁有大數(shù)據(jù)思維。
在Netflix視頻網(wǎng)站,用戶每天產(chǎn)生高達(dá)3000多萬個(gè)收藏、推薦、回放、暫停之類的行為,訂閱用戶每天還給出 400萬個(gè)評(píng)分,300萬次搜索請(qǐng)求。這些巨量的數(shù)據(jù)使Netflix發(fā)現(xiàn),一部影片如果同時(shí)滿足幾個(gè)要素就可能大賣。于是就有了《紙牌屋》的成功。
影視行業(yè)如此,傳統(tǒng)報(bào)業(yè)一樣如此。一個(gè)叫克羅斯的小伙子創(chuàng)辦Prismatic網(wǎng)站,他通過收集網(wǎng)上資源并加以排序而一炮打響。這個(gè)對(duì)新聞一無所知的小伙子成功的原因是:他通過數(shù)據(jù)分析發(fā)現(xiàn),一篇報(bào)道是否受歡迎,讀者并不介意它來自于一個(gè)青少年博客、一個(gè)企業(yè)網(wǎng)站還是一家大報(bào),信息來源并不重要。
“關(guān)注相關(guān)關(guān)系,而不是因果關(guān)系。”《大數(shù)據(jù)時(shí)代》一書的作者將此作為一種思維變革提出來不無道理。許多看似不相關(guān)的事物在大數(shù)據(jù)中就有了聯(lián)系,而這種聯(lián)系正是商機(jī)所在。
一個(gè)叫鄂威的清華大學(xué)畢業(yè)生開發(fā)了一個(gè)類似于“社交管家”的軟件,他在做數(shù)據(jù)挖掘時(shí)發(fā)現(xiàn),聽羅大佑現(xiàn)場(chǎng)演唱會(huì)的人對(duì)上海大眾汽車興趣度會(huì)提高30%,作為創(chuàng)業(yè)者,鄂威正在做著這種風(fēng)馬牛不相及的生意,當(dāng)然他一樣也在追問為什么。
數(shù)據(jù)的真實(shí)價(jià)值就像漂浮在海洋中的冰山,你看到的只是冰山一角。弗洛伊德和海明威的“冰山理論”也適用于大數(shù)據(jù)的價(jià)值評(píng)估。
世界的本質(zhì)就是數(shù)據(jù)。這是物理學(xué)家說的。只不過,過去我們對(duì)這一看法多持異議。
支持我們這一異議的是數(shù)據(jù)獲取之不易。人類早期,純粹憑直覺、經(jīng)驗(yàn)、假設(shè)和推理去認(rèn)識(shí)這個(gè)世界;后來當(dāng)我們有能力獲取部分?jǐn)?shù)據(jù)的時(shí)候,抽樣調(diào)查就成了我們認(rèn)識(shí)世界的一種方法。我們從來沒有想過“樣本=總體”,可它卻不經(jīng)意間就變成了現(xiàn)實(shí)。
這就是全球熱議的大數(shù)據(jù)時(shí)代。在這個(gè)時(shí)代,雁過留聲,人過留數(shù)據(jù)。只要你隨身攜帶智能手機(jī)和計(jì)算設(shè)備,你的位置、行為,甚至身體生理數(shù)據(jù)等每一點(diǎn)變化都成了可被記錄和分析的數(shù)據(jù)。根據(jù)技術(shù)研究機(jī)構(gòu)IDC的預(yù)計(jì),新數(shù)據(jù)以每年50%的速度在增長,或者說每兩年就要翻一番多。
面對(duì)數(shù)據(jù),許多公司也曾進(jìn)行過開發(fā),如沃爾瑪就通過分析銷售、定價(jià)和經(jīng)濟(jì)、人口、天氣方面的數(shù)據(jù)來為特定的門店選擇合適的產(chǎn)品,并確定降價(jià)的時(shí)機(jī);中國移動(dòng)也用它來進(jìn)行客戶消費(fèi)行為分析,并用以調(diào)整自己的服務(wù)內(nèi)容和價(jià)格。但是這些都太低估數(shù)據(jù)的價(jià)值了。
不僅企業(yè)本身低估,整個(gè)社會(huì)都低估了數(shù)據(jù)的價(jià)值。以Facebook為例,在2011年供投資者評(píng)估公司的審核賬目中,它的資產(chǎn)僅被評(píng)估為66億美元,這些資產(chǎn)包括計(jì)算機(jī)硬件、專利和其他實(shí)物,唯獨(dú)不見數(shù)據(jù)。我們對(duì)百度、騰訊的認(rèn)識(shí)也一樣,沒有人把它們擁有的數(shù)據(jù)當(dāng)成無形資產(chǎn)。
但事實(shí)上,數(shù)據(jù)已成為企業(yè)最大的無形資產(chǎn)。在達(dá)沃斯舉行的世界經(jīng)濟(jì)論壇的一份報(bào)告上,數(shù)據(jù)已被宣布成為一種新型的經(jīng)濟(jì)資產(chǎn),就像貨幣或者黃金一樣。與之相應(yīng),對(duì)大數(shù)據(jù)的開發(fā)也正在興起,巨大的商機(jī)吸引著全世界的創(chuàng)業(yè)者。