有人將“上帝與數(shù)據(jù)共舞”歸納為美國文化的特點之一,說的是美國人既有對神的誠意,又有通過數(shù)據(jù)求真的理性。美國從鍍金時代到進(jìn)步主義時期完成了數(shù)據(jù)文化的思維轉(zhuǎn)變,南北戰(zhàn)爭之后人口普查的方法被應(yīng)用到很多領(lǐng)域,形成了數(shù)據(jù)預(yù)測分析的思維方式。近百年來美國和西方各國的現(xiàn)代化與數(shù)據(jù)文化的傳播滲透有密切關(guān)系,我國要實現(xiàn)現(xiàn)代化也必須強調(diào)數(shù)據(jù)文化。
提高數(shù)據(jù)意識的關(guān)鍵是要理解大數(shù)據(jù)的戰(zhàn)略意義。數(shù)據(jù)是與物質(zhì)、能源一樣重要的戰(zhàn)略資源,數(shù)據(jù)的采集和分析涉及每一個行業(yè),是帶有全局性和戰(zhàn)略性的技術(shù)。從硬技術(shù)到軟技術(shù)的轉(zhuǎn)變是當(dāng)今全球性的技術(shù)發(fā)展趨勢,而從數(shù)據(jù)中發(fā)現(xiàn)價值的技術(shù)正是最有活力的軟技術(shù),數(shù)據(jù)技術(shù)與數(shù)據(jù)產(chǎn)業(yè)的落后將使我們像錯過工業(yè)革命機(jī)會一樣延誤一個時代。
2.2 理解大數(shù)據(jù)需要有正確的認(rèn)識論
歷史上科學(xué)研究是從邏輯演繹開始的,歐幾里得幾何的所有定理可從幾條公理推導(dǎo)出來。從伽利略和牛頓開始,科學(xué)研究更加重視自然觀察和實驗觀察,在觀察基礎(chǔ)上通過歸納方法提煉出科學(xué)理論,“科學(xué)始于觀察”成為科學(xué)研究和認(rèn)識論的主流。經(jīng)驗論和唯理論這兩大流派都對科學(xué)的發(fā)展做出過重大貢獻(xiàn),但也暴露出明顯的問題,甚至走入極端。理性主義走向極端就成為康德所批判的獨斷主義,經(jīng)驗主義走入極端就變成懷疑論和不可知論。
20世紀(jì)30年代,德國哲學(xué)家波普爾提出了被后人稱為“證偽主義”的認(rèn)識論觀點,他認(rèn)為科學(xué)理論不能用歸納法證實,只能被試驗發(fā)現(xiàn)的反例“證偽”,因而他否定科學(xué)始于觀察,提出“科學(xué)始于問題”的著名觀點[3]。證偽主義有其局限性,如果嚴(yán)格遵守證偽法則,萬有引力定律、原子論等重要理論都可能被早期的所謂反例扼殺。但“科學(xué)始于問題”的觀點對當(dāng)前大數(shù)據(jù)技術(shù)的發(fā)展有指導(dǎo)意義。
大數(shù)據(jù)的興起引發(fā)了新的科學(xué)研究模式:“科學(xué)始于數(shù)據(jù)”。從認(rèn)識論的角度看,大數(shù)據(jù)分析方法與“科學(xué)始于觀察”的經(jīng)驗論較為接近,但我們要牢記歷史的教訓(xùn),避免滑入否定理論作用的經(jīng)驗主義泥坑。在強調(diào)“相關(guān)性”的時候不要懷疑“因果性”的存在;在宣稱大數(shù)據(jù)的客觀性、中立性的時候,不要忘了不管數(shù)據(jù)的規(guī)模如何,大數(shù)據(jù)總會受制于自身的局限性和人的偏見。不要相信這樣的預(yù)言:“采用大數(shù)據(jù)挖掘,你不需要對數(shù)據(jù)提出任何問題,數(shù)據(jù)就會自動產(chǎn)生知識”。面對像大海一樣的巨量數(shù)據(jù),從事數(shù)據(jù)挖掘的科技人員最大的困惑是,我們想撈的“針”是什么?這海里究竟有沒有“針”?也就是說,我們需要知道要解決的問題是什么。從這個意義上講,“科學(xué)始于數(shù)據(jù)”與“科學(xué)始于問題”應(yīng)有機(jī)地結(jié)合起來。
對“原因”的追求是科學(xué)發(fā)展的永恒動力。但是,原因是追求不完的,人類在有限的時間內(nèi)不可能找到“終極真理”。在科學(xué)的探索途中,人們往往用“這是客觀規(guī)律”解釋世界,并不立即追問為什么有這樣的客觀規(guī)律。也就是說,傳統(tǒng)科學(xué)并非只追尋因果性,也可以用客觀規(guī)律作為結(jié)論。大數(shù)據(jù)研究的結(jié)果多半是一些新的知識或新的模型,這些知識和模型也可以用來預(yù)測未來,可以認(rèn)為是一類局部性的客觀規(guī)律??茖W(xué)史上通過小數(shù)據(jù)模型發(fā)現(xiàn)一般性規(guī)律的例子不少,比如開普勒歸納的天體運動規(guī)律等;而大數(shù)據(jù)模型多半是發(fā)現(xiàn)一些特殊性的規(guī)律。物理學(xué)中的定律一般具有必然性,但大數(shù)據(jù)模型不一定具有必然性,也不一定具有可演繹性。大數(shù)據(jù)研究的對象往往是人的心理和社會,在知識階梯上位于較高層,其自然邊界是模糊的,但有更多的實踐特征。大數(shù)據(jù)研究者更重視知行合一,相信實踐論。大數(shù)據(jù)認(rèn)識論有許多與傳統(tǒng)認(rèn)識論不同的特點,我們不能因其特點不同就否定大數(shù)據(jù)方法的科學(xué)性。大數(shù)據(jù)研究挑戰(zhàn)了傳統(tǒng)認(rèn)識論對因果性的偏愛,用數(shù)據(jù)規(guī)律補充了單一的因果規(guī)律,實現(xiàn)了唯理論和經(jīng)驗論的數(shù)據(jù)化統(tǒng)一,一種全新的大數(shù)據(jù)認(rèn)識論正在形成。
3 正確認(rèn)識大數(shù)據(jù)的價值和效益
3.1 大數(shù)據(jù)的價值主要體現(xiàn)為它的驅(qū)動效應(yīng)
人們總是期望從大數(shù)據(jù)中挖掘出意想不到的“大價值”。實際上大數(shù)據(jù)的價值主要體現(xiàn)在它的驅(qū)動效應(yīng),即帶動有關(guān)的科研和產(chǎn)業(yè)發(fā)展,提高各行各業(yè)通過數(shù)據(jù)分析解決困難問題和增值的能力。大數(shù)據(jù)對經(jīng)濟(jì)的貢獻(xiàn)并不完全反映在大數(shù)據(jù)公司的直接收入上,應(yīng)考慮對其他行業(yè)效率和質(zhì)量提高的貢獻(xiàn)。大數(shù)據(jù)是典型的通用技術(shù),理解通用技術(shù)要采用“蜜蜂模型”:蜜蜂的效益主要不是自己釀的蜂蜜,而是蜜蜂傳粉對農(nóng)業(yè)的貢獻(xiàn)。