2、 我們要的是概率
我們總是為了一個(gè)“答案”而活著,精確性似乎一直是我們生活的支撐,但認(rèn)為每個(gè)問(wèn)題只有一個(gè)答案的想法是站不住腳的。“一個(gè)唯一的真理“的存在是不可能的,而且追求這個(gè)唯一的真理是對(duì)注意力的分散。大數(shù)據(jù)也許是拯救我們的關(guān)鍵方法:大數(shù)據(jù)通常用概率說(shuō)話(huà),而不是板著“準(zhǔn)確無(wú)疑”的面孔。
不是因果關(guān)系,而是相關(guān)關(guān)系
在大數(shù)據(jù)時(shí)代,我們不必知道現(xiàn)象背后的原因,而是要讓數(shù)據(jù)自己“發(fā)聲”。我們不再一味追求人們?yōu)槭裁催@么做,知道人們?yōu)槭裁催@么做可能是有用的,但這個(gè)問(wèn)題目前并不是很重要,重要的是我們能通過(guò)大數(shù)據(jù)分析出人們的相關(guān)行為。
1、相關(guān)關(guān)系
相關(guān)關(guān)系的核心是量化兩個(gè)數(shù)據(jù)值之間的數(shù)理關(guān)系:相關(guān)關(guān)系強(qiáng)是指當(dāng)一個(gè)數(shù)據(jù)值增加時(shí),另一個(gè)數(shù)據(jù)值很有可能也會(huì)隨之增加;相關(guān)關(guān)系弱就意味著當(dāng)一個(gè)數(shù)據(jù)值增加時(shí),另一個(gè)數(shù)據(jù)值幾乎不會(huì)發(fā)生變化。相關(guān)關(guān)系通過(guò)識(shí)別有用的關(guān)聯(lián)物來(lái)幫助我們分析一個(gè)現(xiàn)象,而不是通過(guò)揭示其內(nèi)部的運(yùn)作機(jī)制。相關(guān)關(guān)系沒(méi)有絕對(duì),只有可能性。
2、人們的直接目的就是尋找因果關(guān)系
人們的直接愿望就是了解因果關(guān)系,我們已經(jīng)習(xí)慣了信息的匱乏,故此亦習(xí)慣了在少量數(shù)據(jù)的基礎(chǔ)上進(jìn)行推理思考。以前我們用實(shí)驗(yàn)來(lái)證明因果關(guān)系,它是通過(guò)是否有誘因來(lái)分別觀察所產(chǎn)生的結(jié)果是不是和真實(shí)情況相符。但是,凡事皆有因果的話(huà),那么我們就沒(méi)有決定任何事的自由了。如果說(shuō)我們做的每一個(gè)決定或者每一個(gè)想法都是其他事情的結(jié)果,而這個(gè)結(jié)果又是由其他原因?qū)е碌?,以此循環(huán)往復(fù),那么就不存在人的自由意志這一說(shuō)了——所有的生命軌跡都只是受到因果關(guān)系的控制了——這顯然是不正確的。
3、 相關(guān)關(guān)系和因果關(guān)系并不矛盾
相關(guān)關(guān)系分析本身意義重大,同時(shí)它也為研究因果關(guān)系奠定了基礎(chǔ),通過(guò)找出可能相關(guān)的事物,我們可以在此基礎(chǔ)上進(jìn)行進(jìn)一步的因果關(guān)系分析,如果存在因果關(guān)系的話(huà),我們?cè)龠M(jìn)一步找出原因。在大多數(shù)情況下,一旦我們完成了對(duì)大數(shù)據(jù)的相關(guān)關(guān)系分析,而又不再滿(mǎn)足于僅僅知道“是什么”時(shí),我們就會(huì)繼續(xù)向更深層次研究因果關(guān)系,找出背后的“為什么”。在小數(shù)據(jù)時(shí)代,我們會(huì)假象世界是怎么運(yùn)作的,然后通過(guò)收集和分析數(shù)據(jù)來(lái)驗(yàn)證這種假象;在大數(shù)據(jù)時(shí)代,我們會(huì)在數(shù)據(jù)的指導(dǎo)下探索世界,不再受限于各種假想;我們的研究始于數(shù)據(jù),也因?yàn)閿?shù)據(jù)我們發(fā)現(xiàn)了以前不曾發(fā)現(xiàn)的聯(lián)系。
A.大量的數(shù)據(jù)意味著“理論的終結(jié)”:用一系列的因果關(guān)系來(lái)驗(yàn)證各種猜測(cè)的傳統(tǒng)研究范式已經(jīng)不實(shí)用了,如今它已經(jīng)被無(wú)需理論指導(dǎo)的相關(guān)關(guān)系研究所取代;
B.現(xiàn)在已經(jīng)是一個(gè)有海量數(shù)據(jù)的時(shí)代,應(yīng)用數(shù)學(xué)已經(jīng)取代了其他的所有學(xué)科工具,而且只要數(shù)據(jù)足夠,就能說(shuō)明問(wèn)題,如果你有一拍字節(jié)的數(shù)據(jù),只要掌握了這些數(shù)據(jù)之間的相關(guān)關(guān)系,一切就迎刃而解了;
C.“理論的終結(jié)”:所有的普遍規(guī)則都不重要了,重要的是數(shù)據(jù)分析,它可以揭示一切問(wèn)題;但大數(shù)據(jù)并不意味著理論已死,因?yàn)榇髷?shù)據(jù)就是在理論的基礎(chǔ)上形成的。
大數(shù)據(jù)時(shí)代的商業(yè)變革
在一個(gè)可能性和相關(guān)性占主導(dǎo)地位的世界里,專(zhuān)業(yè)性變得不那么重要了;行業(yè)并不會(huì)消失,但是他們必須與數(shù)據(jù)表達(dá)的信息進(jìn)行博弈。
1、 數(shù)據(jù)化:一切皆可量化
大數(shù)據(jù)的核心發(fā)展動(dòng)力來(lái)源于人類(lèi)測(cè)量、記錄和分析世界的渴望。為了得到可量化的信息,我們要知道如何計(jì)量;為了數(shù)據(jù)化量化了的信息,我們要知道怎么記錄計(jì)量的結(jié)果。如今我們經(jīng)常把“數(shù)字化”和“數(shù)據(jù)化”這兩個(gè)概念搞混,但是對(duì)這兩個(gè)概念的區(qū)分實(shí)際上非常重要:
A.數(shù)據(jù)化:一種把現(xiàn)象轉(zhuǎn)變?yōu)榭芍票矸治龅牧炕问降倪^(guò)程;
B.數(shù)字化:把模擬數(shù)據(jù)轉(zhuǎn)換成0和1表示的二進(jìn)制碼;
數(shù)字化帶來(lái)了數(shù)據(jù)化,但是數(shù)字化無(wú)法取代數(shù)據(jù)化;數(shù)字化是把模擬數(shù)據(jù)變成計(jì)算機(jī)課讀的數(shù)據(jù),和數(shù)據(jù)化有著本質(zhì)的不同。
2、當(dāng)方位變成了數(shù)據(jù)
1978年見(jiàn)證了一個(gè)偉大的轉(zhuǎn)變,當(dāng)時(shí)構(gòu)成全球定位系統(tǒng)(GPS)的24顆衛(wèi)星第一次發(fā)射成功,通過(guò)與技術(shù)手段的融合,全球定位系統(tǒng)能夠快速、相對(duì)低價(jià)地進(jìn)行地理定位,而且不需要任何專(zhuān)業(yè)知識(shí)。地理位置信息匯集起來(lái),可能會(huì)揭示事情的發(fā)展趨勢(shì);位置信息一旦被數(shù)據(jù)化,新的用途就猶如雨后春筍般涌現(xiàn)出來(lái),而新價(jià)值也會(huì)隨之不斷催生。