在這個(gè)不確定的時(shí)代里面,等我們?nèi)フ业綔?zhǔn)確的因果關(guān)系,再去辦事的時(shí)候,這個(gè)事情早已經(jīng)不值得辦了。所以“大數(shù)據(jù)”時(shí)代的思維有點(diǎn)像回歸了工業(yè)社會(huì)的這種機(jī)械思維——機(jī)械思維就是說我按那個(gè)按鈕,一定會(huì)出現(xiàn)相應(yīng)的結(jié)果,是這樣狀態(tài)。而農(nóng)業(yè)社會(huì)往前推,不需要找到中間非常緊密的、明確的因果關(guān)系,而只需要找到相關(guān)關(guān)系,只需要找到跡象就可以了。社會(huì)因此放棄了尋找因果關(guān)系的傳統(tǒng)偏好,開始挖掘相關(guān)關(guān)系的好處。
例如:美國人開發(fā)一款“個(gè)性化分析報(bào)告自動(dòng)可視化程序”軟件從網(wǎng)上挖掘數(shù)據(jù)信息,這款數(shù)據(jù)挖掘軟件將自動(dòng)從各種數(shù)據(jù)中提取重要信息,然后進(jìn)行分析,并把此信息與以前的數(shù)據(jù)關(guān)聯(lián)起來,分析出有用的信息。
非法在屋內(nèi)打隔斷的建筑物著火的可能性比其他建筑物高很多。紐約市每年接到2.5萬宗有關(guān)房屋住得過于擁擠的投訴,但市里只有200名處理投訴的巡視員,市長辦公室一個(gè)分析專家小組覺得大數(shù)據(jù)可以幫助解決這一需求與資源的落差。該小組建立了一個(gè)市內(nèi)全部90萬座建筑物的數(shù)據(jù)庫,并在其中加入市里19個(gè)部門所收集到的數(shù)據(jù):欠稅扣押記錄、水電使用異常、繳費(fèi)拖欠、服務(wù)切斷、救護(hù)車使用、當(dāng)?shù)胤缸锫省⑹蠡纪对V,諸如此類。
接下來,他們將這一數(shù)據(jù)庫與過去5年中按嚴(yán)重程度排列的建筑物著火記錄進(jìn)行比較,希望找出相關(guān)性。果然,建筑物類型和建造年份是與火災(zāi)相關(guān)的因素。不過,一個(gè)沒怎么預(yù)料到的結(jié)果是,獲得外磚墻施工許可的建筑物與較低的嚴(yán)重火災(zāi)發(fā)生率之間存在相關(guān)性。利用所有這些數(shù)據(jù),該小組建立了一個(gè)可以幫助他們確定哪些住房擁擠投訴需要緊急處理的系統(tǒng)。他們所記錄的建筑物的各種特征數(shù)據(jù)都不是導(dǎo)致火災(zāi)的原因,但這些數(shù)據(jù)與火災(zāi)隱患的增加或降低存在相關(guān)性。這種知識(shí)被證明是極具價(jià)值的:過去房屋巡視員出現(xiàn)場時(shí)簽發(fā)房屋騰空令的比例只有13%,在采用新辦法之后,這個(gè)比例上升到了70%——效率大大提高了。
全世界的商界人士都在高呼大數(shù)據(jù)時(shí)代來臨的優(yōu)勢:一家超市如何從一個(gè)17歲女孩的購物清單中,發(fā)現(xiàn)了她已懷孕的事實(shí);或者將啤酒與尿不濕放在一起銷售,神奇地提高了雙方的銷售額。大數(shù)據(jù)透露出來的信息有時(shí)確實(shí)會(huì)起顛覆。比如,騰訊一項(xiàng)針對(duì)社交網(wǎng)絡(luò)的統(tǒng)計(jì)顯示,愛看家庭劇的男人是女性的兩倍還多;最關(guān)心金價(jià)的是中國大媽,但緊隨其后的卻是90后。而在過去一年,支付寶中無線支付比例排名前十的竟然全部在青海、西藏和內(nèi)蒙古地區(qū)。
說明:用關(guān)注相關(guān)性思維方式來思考問題,解決問題。尋找原因是一種現(xiàn)代社會(huì)的一神論,大數(shù)據(jù)推翻了這個(gè)論斷。過去尋找原因的信念正在被“更好”的相關(guān)性所取代。當(dāng)世界由探求因果關(guān)系變成挖掘相關(guān)關(guān)系,我們怎樣才能既不損壞建立在因果推理基礎(chǔ)之上的社會(huì)繁榮和人類進(jìn)步的基石,又取得實(shí)際的進(jìn)步呢?這是值得思考的問題。
解釋:轉(zhuǎn)向相關(guān)性,不是不要因果關(guān)系,因果關(guān)系還是基礎(chǔ),科學(xué)的基石還是要的。只是在高速信息化的時(shí)代,為了得到即時(shí)信息,實(shí)時(shí)預(yù)測,在快速的大數(shù)據(jù)分析技術(shù)下,尋找到相關(guān)性信息,就可預(yù)測用戶的行為,為企業(yè)快速?zèng)Q策提供提前量。
比如預(yù)警技術(shù),只有提前幾十秒察覺,防御系統(tǒng)才能起作用。比如,雷達(dá)顯示有個(gè)提前量,如果沒有這個(gè)預(yù)知的提前量,雷達(dá)的作用也就沒有了,相關(guān)性也是這個(gè)原理。比如,相對(duì)論與量子論的爭論也能說明問題,一個(gè)說上帝不擲骰子,一個(gè)說上帝擲骰子,爭論幾十年,最后承認(rèn)兩個(gè)都存在,而且量子論取得更大的發(fā)展——一個(gè)適用于宇宙尺度,一個(gè)適用于原子尺度。
六、預(yù)測原理
從不能預(yù)測轉(zhuǎn)變?yōu)榭梢灶A(yù)測
大數(shù)據(jù)的核心就是預(yù)測,大數(shù)據(jù)能夠預(yù)測體現(xiàn)在很多方面。大數(shù)據(jù)不是要教機(jī)器像人一樣思考,相反,它是把數(shù)學(xué)算法運(yùn)用到海量的數(shù)據(jù)上來預(yù)測事情發(fā)生的可能性。正因?yàn)樵诖髷?shù)據(jù)規(guī)律面前,每個(gè)人的行為都跟別人一樣,沒有本質(zhì)變化,所以商家會(huì)比消費(fèi)者更了消費(fèi)者的行為。
例如:大數(shù)據(jù)助微軟準(zhǔn)確預(yù)測世界懷。微軟大數(shù)據(jù)團(tuán)隊(duì)在2014年巴西世界足球賽前設(shè)計(jì)了世界懷模型,該預(yù)測模型正確預(yù)測了賽事最后幾輪每場比賽的結(jié)果,包括預(yù)測德國隊(duì)將最終獲勝。預(yù)測成功歸功于微軟在世界懷進(jìn)行過程中獲取的大量數(shù)據(jù),到淘汰賽階段,數(shù)據(jù)如滾雪球般增多,常握了有關(guān)球員和球隊(duì)的足夠信息,以適當(dāng)校準(zhǔn)模型并調(diào)整對(duì)接下來比賽的預(yù)測。