英特爾人類學(xué)家Genevieve Bell分享了她針對(duì)大數(shù)據(jù)(big data)所做的研究,她深刻思考了大數(shù)據(jù)對(duì)未來可能激起的改變,并探討了在許多不同情境下,這些大數(shù)據(jù)現(xiàn)象實(shí)際上所蘊(yùn)涵的意義。
Bell在英特爾公司的正式頭銜是英特爾實(shí)驗(yàn)室互動(dòng)暨體驗(yàn)研究總監(jiān),她負(fù)責(zé)的工作與英特爾其他科學(xué)家和工程師截然不同,涉及的層面涵蓋了所有最近在業(yè)界掀起熱烈討論的數(shù)據(jù)海嘯(data tsunami)、云計(jì)算、設(shè)備擴(kuò)散(device proliferation),以及更強(qiáng)大的服務(wù)器在內(nèi)。“大數(shù)據(jù)”,正是Bell的下一個(gè)主要研究專案。
“問題是該從何處著手?對(duì)于我們想要討論的主題,我們?nèi)蕴幵谠囍胂襁@個(gè)主題的輪廓及其規(guī)模的階段,”Bell在稍早前英特爾的倫敦Xeon E5處理器發(fā)布會(huì)上表示。“而今天,所有已達(dá)爆滿邊緣的數(shù)據(jù)庫,只不過是個(gè)開端而已。”
接下來,Bell表示,這個(gè)世界必須去思考,我們想怎樣過濾這些數(shù)據(jù)?這會(huì)對(duì)傳統(tǒng)線上數(shù)據(jù)庫帶來哪些改變?既有的數(shù)據(jù)世界是否會(huì)開始失序,甚至面臨崩解而后再建設(shè)的局面?
而在這一切的轉(zhuǎn)變過程中,Bell表示,至少我們已經(jīng)開始明白,所有的一切都會(huì)朝著建立一種數(shù)據(jù)追蹤法則的方向發(fā)展,包括模擬和數(shù)字?jǐn)?shù)據(jù)在內(nèi),而且,我們還必須有能力管理所有數(shù)據(jù)。
“對(duì)我來說,在這份工作中,數(shù)據(jù)本身并不是讓我最感興趣的地方,因?yàn)樗械囊磺惺挛锒紩?huì)產(chǎn)生數(shù)據(jù),真正有趣之處在于如何開發(fā)更能善加運(yùn)用這些數(shù)據(jù)的算法之類,”她解釋道。
今天,我們使用數(shù)據(jù)的方法,并非都能直觀地展現(xiàn)出數(shù)據(jù)本身的意義,Bell說,特別是演算法──要讓所有的數(shù)據(jù)都能善加運(yùn)用,就必須深入了解數(shù)據(jù)本身的正確性,而這又和最初的數(shù)據(jù)填寫者有著密切關(guān)聯(lián)。
“所有我們?cè)噲D用來讓數(shù)據(jù)使用更加合理的想法,都會(huì)在一開始被就放在最優(yōu)先的位置,”她說。事實(shí)上,她也點(diǎn)出了當(dāng)我們開始在單一一種數(shù)據(jù)模式內(nèi)找尋數(shù)據(jù)間的固定模式、因果關(guān)系和關(guān)聯(lián)時(shí),實(shí)際上都早已落入固有的偏見之中。
“對(duì)我而言,大數(shù)據(jù)分析最迷人之處不僅在于匯聚了來自各個(gè)領(lǐng)域的廣泛數(shù)據(jù),更重要的是你可以拿它們來做些什么,”Bell表示,我們愈來愈依賴數(shù)據(jù)分析,某種層面來說,這也代表著文化腳本(cultural script)正在跨入嶄新的水平。
這類有關(guān)數(shù)據(jù)分析的想法,也推動(dòng)數(shù)據(jù)朝“擬人化”(anthropomorphizing)的方向發(fā)展。Bell指出,在開始討論到“數(shù)據(jù)的秘密生活”(the secret life of data)之際,所有這些數(shù)據(jù)都將是必要的。而這些討論也將進(jìn)一步推動(dòng)大數(shù)據(jù)和云計(jì)算等應(yīng)用的擴(kuò)展。
Bell表示,所有的數(shù)據(jù)實(shí)際上都擁有它自己的特性,這正是使它與其他所有數(shù)據(jù)有所差異化之處,因此,在分析數(shù)據(jù)以前,最好先厘清所有數(shù)據(jù)的特性。