經(jīng)過一代人的時間,“技術(shù)天才”與社會的關(guān)系發(fā)生了改變,他們從宅男變成了救世主,從反社會群體變成了社會的最大希望。許多人似乎確信,當(dāng)下理解我們世界的最佳方式便是坐在屏幕前,分析海量信息——我們稱其為“大數(shù)據(jù)”。
來看看“谷歌流感趨勢”吧。2008年,當(dāng)它面世時,硅谷的許多人員鼓吹其將成為大數(shù)據(jù)的另一個里程碑,并且會很快淘汰掉傳統(tǒng)分析。
不過,他們錯了。
如果硅谷的大數(shù)據(jù)傳教士們真想“了解世界”,那么他們不僅需要掌握數(shù)據(jù)的量,也要掌握數(shù)據(jù)的質(zhì)。
“谷歌流感趨勢”不僅沒有提供流感傳播的精確圖表,它也無法實現(xiàn)大數(shù)據(jù)作為傳道者的美夢。沒有“厚數(shù)據(jù)”,大數(shù)據(jù)就什么也不是。你必須離開電腦,深入到現(xiàn)實世界當(dāng)中來獲取這些豐富且?guī)в星榫郴男畔?。電腦極客們一度因不擅社交而被嘲笑,他們被告知應(yīng)該“多出去走走”。事實上,如果大數(shù)據(jù)最主要的擁躉者希望理解這個他們也參與塑造的世界,他們真的需要出去走走。
與修改算法無關(guān)
“谷歌流感趨勢”試圖通過識別人們在流感季可能搜索的詞匯來發(fā)揮作用。當(dāng)它追蹤的詞匯搜索達到高峰時,谷歌會向大家預(yù)警新流感的爆發(fā),這大約要比官方數(shù)據(jù)早兩周時間。
對很多人來說,“谷歌流感趨勢”成為了大數(shù)據(jù)之力的代表。在暢銷書《大數(shù)據(jù):一場改變我們生活、工作和思考的革命》中,作者維克托-邁爾-舍恩柏格和肯尼斯-庫克耶稱,與政府滯后的數(shù)據(jù)報告相比,“谷歌流感趨勢”是更有用、更及時的流感指示器。為什么即便費心查看數(shù)據(jù),人們還是會得病,我們何時才能知道究竟什么與疾病相關(guān)?“因果關(guān)系”他們寫道,“不會被丟棄,不過其立意的根本正受到考驗。”
然而,本月發(fā)表在《科學(xué)》上的一篇文章表明,自2011年八月起,“谷歌流感趨勢”幾乎每周都會高估流感的流行性。
回溯到2009年,在發(fā)布后不久,“谷歌流感趨勢”完全沒預(yù)警到豬流感。這證明人們在流感季搜索的許多詞都與流感無關(guān),而與每年這一季相關(guān)的詞通常都有:冬天。
如今,很容易說(像許多人做過的那樣)“谷歌流感趨勢”的失敗源于大數(shù)據(jù)的不成熟。不過,這樣便錯過了問題的關(guān)鍵。當(dāng)然,調(diào)整算法、提高數(shù)據(jù)收集技術(shù)將會讓下一代大數(shù)據(jù)工具變得更有效。然而,大數(shù)據(jù)真正的狂妄之處不在于我們對一套不成熟的算法和方法過于自信,問題是我們盲目地相信坐在電腦屏幕前,搗鼓一些數(shù)字就足以讓自己對周圍廣闊的世界有個了解。
為什么大數(shù)據(jù)需要“厚數(shù)據(jù)”
大數(shù)據(jù)僅僅是在收集人文學(xué)科中所謂的”薄數(shù)據(jù)“,它們由我們的動作和行為路徑產(chǎn)生。我們每天最常走的路線,在網(wǎng)上搜索的東西,睡了多久,人與人之間的多種聯(lián)系,我們所聽的音樂類型等等。這些數(shù)據(jù)來自于你瀏覽器中的cookies,你腕上的fitbit或是你手機里的GPS。人們的這些行為內(nèi)容無疑是重要的,但它們并不是全部。
為了真正地了解人,我們也必須了解經(jīng)驗的那部分,即人類學(xué)家所指的“厚數(shù)據(jù)”。它不僅僅捕捉事實。比如說,美國有86%的家庭主婦每周會喝掉6夸脫以上的牛奶,但是她們?yōu)槭裁春扰D棠??而且這像什么呢?一塊帶有星星和條紋的三色布是薄數(shù)據(jù),而一面在風(fēng)中高高飄揚的美國國旗便是厚數(shù)據(jù)。
在探尋“我們做了什么”的基礎(chǔ)上,大數(shù)據(jù)簡單地認識我們;厚數(shù)據(jù)嘗試通過我們?nèi)绾闻c所在的不同世界相聯(lián)系來了解我們。只有了解我們的世界,人們才能從整體上真正認識它,這恰恰也是谷歌、facebook這類的公司想要做的。
用0和1認識世界
想想當(dāng)下硅谷的那些宏偉宣言,谷歌有名的宗旨是“組織全球信息,使人人皆可訪問并從中獲益?!弊罱?,馬克-扎克伯格跟他的投資人說,在全球性連接變得日趨重要、知識經(jīng)濟不斷受到強調(diào)的背景下,F(xiàn)acebook帶來了一個全新的視角,即”認識世界”。他描述了未來“認識”的樣子:“人們每天向graph(Facebook的算法搜索機制)發(fā)布數(shù)十億條內(nèi)容和鏈接,由此建立各種有待了解事物的最明晰模本?!痹谶@個追求認識的過程中,即便是一些小公司也可以分享信息。去年,捷波朗軟件的副總裁耶利米-羅賓遜說道,他們的健康跟蹤設(shè)備Jawbone UP試圖“認識行為變化的科學(xué)?!?p align="center" class="pageLink"> 1/4 1 2 3 4 下一頁 尾頁