
最近的幾篇文章透露出一些擔(dān)憂,認為大數(shù)據(jù)(Big Data)在所謂的新興技術(shù)炒作周期中可能已處于期望過高的巔峰期,很快就會開始落入幻滅的谷底。這在一種顛覆性技術(shù)的早期階段并不罕見。關(guān)鍵的問題是這種技術(shù)會繼續(xù)跌穿谷底、迅速被人遺忘呢還是最終會繼續(xù)向前,沿著復(fù)蘇的斜坡走向生命力長久的成熟期。你怎樣才能辨別它會朝哪方面發(fā)展?
根據(jù)我的經(jīng)驗,一種顛覆性的技術(shù)只要能持續(xù)吸引嚴肅研究人員和分析師的眼球就能成功。這些研究人員和分析師經(jīng)過一段時間會揭穿炒作行為,對技術(shù)的開發(fā)和營銷予以規(guī)范,提出解決諸多技術(shù)障礙的辦法,清理不切實際的承諾,重新勾勒這種技術(shù)實現(xiàn)目標(biāo)的范圍和時間表?;ヂ?lián)網(wǎng)(The Internet)就是從導(dǎo)致dot-com泡沫的一片炒作中重獲新生的,繼續(xù)朝著高度成功的未來在發(fā)展。云計算目前正在經(jīng)歷一個類似的嚴肅評估與發(fā)展期,大數(shù)據(jù)也同樣如此。
在《大數(shù)據(jù)的興起:它是如何改變我們看待世界的方式的》這篇才發(fā)表在《外交》雜志(Foreign Affairs)上的文章里,《經(jīng)濟學(xué)家》雜志(Economist)的編輯肯尼思?庫克耶(Kenneth Cukier)和牛津大學(xué)教授維克托?邁爾-舍恩伯格(Viktor Mayer-Sch?nberger) 很好地闡述了為什么“大數(shù)據(jù)標(biāo)志著信息社會終于迎來了履行其名字中暗含的承諾的時刻”。這篇文章節(jié)選自他們2013年3月出版的著作《大數(shù)據(jù):一場行將改變我們生活、工作和思考方式的革命》(Big Data: A Revolution That Will Transform How We Live, Work, and Think)。
庫克耶和邁爾-舍恩伯格解釋說,大數(shù)據(jù)已經(jīng)迅速興起,成為它所占據(jù)的舞臺的中心,原因就是現(xiàn)在四處飄散的數(shù)字信息比以往任何時候都多。2000年的時候,全世界存儲的信息中只有四分之一是數(shù)字信息,因此必須進行搜索和分析。自那以后,數(shù)字數(shù)據(jù)差不多每三年就會翻一番,因此到目前為止,所有存儲的信息中只有2%不是數(shù)字信息。
沒有數(shù)字化革命,大數(shù)據(jù)就不可能產(chǎn)生,而由于摩爾定律(Moore’s Law)的存在,數(shù)字化革命使人有可能大大降低存儲和分析海量信息的成本。網(wǎng)絡(luò)就跟移動設(shè)備和智能傳感器的爆炸性增長一樣,也讓數(shù)據(jù)的收集方便得多了?!暗蔷推浜诵亩?,”作者寫道,“大數(shù)據(jù)只是人類尋求認識并量化世界的過程中的最新舉措而已?!睌?shù)據(jù)化(Datafication)是他們使用的術(shù)語,用來描述當(dāng)今捕獲世界上以前從來沒有量化過的很多方面信息并將其作為數(shù)據(jù)的能力。
我完全贊同他們的觀點,認為大數(shù)據(jù)不僅應(yīng)該被視為過去幾十年里數(shù)字和互聯(lián)網(wǎng)革命的一部分,而且應(yīng)該視為過去幾百年間科技革命的一部分。在今年5月舉辦的2013年麻省理工學(xué)院斯隆商學(xué)院首席信息長研討會(the 2013 MIT Sloan CIO Symposium)上,麻省理工學(xué)院教授埃里克?布林約爾夫松(Erik Brynjolfsson)在他主持的“大數(shù)據(jù)的現(xiàn)實”小組討論中表達了類似觀點,他說縱觀歷史,新工具都會引發(fā)革命。
當(dāng)新工具讓我們有可能開展各種新的測量和觀察活動時,科技革命就開始了。早在17世紀,伽利略(Galileo)對發(fā)明不久的望遠鏡進行了重大改進,使他能夠作出大大改變我們整個宇宙觀的發(fā)現(xiàn)。幾個世紀以來,我們看到在物理、化學(xué)、生物和其它學(xué)科實現(xiàn)重大科技突破之前都會有新工具、新測量方式和新發(fā)現(xiàn)產(chǎn)生。
我們新的大數(shù)據(jù)工具有可能會引發(fā)一場基于信息的科技革命。就像望遠鏡、顯微鏡、光譜分析儀和DNA測序儀導(dǎo)致了新的科學(xué)學(xué)科產(chǎn)生一樣,數(shù)據(jù)科學(xué)現(xiàn)在正迅速成為大數(shù)據(jù)的學(xué)術(shù)伴侶。數(shù)據(jù)科學(xué)最讓人激動的地方之一是,鑒于我們剛剛獲得了收集差不多任何主題(包括醫(yī)療保健、金融、管理和社會科學(xué))方面有價值的數(shù)據(jù)的能力,大數(shù)據(jù)可以應(yīng)用于差不多任何知識領(lǐng)域。不過,就像所有的科技革命一樣,這需要時間。
按照庫克耶和邁爾-舍恩伯格的說法,數(shù)據(jù)化需要在我們處理數(shù)據(jù)的方式上發(fā)生三個深刻變化。第一個變化他們稱之為n=全部(n=all),也就是說,收集并利用大量數(shù)據(jù),而不是像統(tǒng)計學(xué)家至今之前所做的那樣只滿足于小樣本?!爱?dāng)收集數(shù)據(jù)的成本太高,處理數(shù)據(jù)既麻煩又耗時的時候,抽樣的樣本成為了救星。現(xiàn)代抽樣技術(shù)是基于這樣一個思想的:在一定的誤差范圍內(nèi),個人可以根據(jù)小團體的數(shù)據(jù)推斷出整體人口的某種情況,只要抽取的樣本是隨機的?!?p align="center" class="pageLink"> 1/2 1 2 下一頁 尾頁
更多詳細信息,請您微信關(guān)注“計算網(wǎng)”公眾號: