英特爾人類學家Genevieve Bell分享了她針對大數(shù)據(jù)(big data)所做的研究,她深刻思考了大數(shù)據(jù)對未來可能激起的改變,并探討了在許多不同情境下,這些大數(shù)據(jù)現(xiàn)象實際上所蘊涵的意義。
Bell在英特爾公司的正式頭銜是英特爾實驗室互動暨體驗研究總監(jiān),她負責的工作與英特爾其他科學家和工程師截然不同,涉及的層面涵蓋了所有最近在業(yè)界掀起熱烈討論的數(shù)據(jù)海嘯(data tsunami)、云計算、設備擴散(device proliferation),以及更強大的服務器在內(nèi)。“大數(shù)據(jù)”,正是Bell的下一個主要研究專案。
“問題是該從何處著手?對于我們想要討論的主題,我們?nèi)蕴幵谠囍胂襁@個主題的輪廓及其規(guī)模的階段,”Bell在稍早前英特爾的倫敦Xeon E5處理器發(fā)布會上表示。“而今天,所有已達爆滿邊緣的數(shù)據(jù)庫,只不過是個開端而已。”
接下來,Bell表示,這個世界必須去思考,我們想怎樣過濾這些數(shù)據(jù)?這會對傳統(tǒng)線上數(shù)據(jù)庫帶來哪些改變?既有的數(shù)據(jù)世界是否會開始失序,甚至面臨崩解而后再建設的局面?
而在這一切的轉變過程中,Bell表示,至少我們已經(jīng)開始明白,所有的一切都會朝著建立一種數(shù)據(jù)追蹤法則的方向發(fā)展,包括模擬和數(shù)字數(shù)據(jù)在內(nèi),而且,我們還必須有能力管理所有數(shù)據(jù)。
“對我來說,在這份工作中,數(shù)據(jù)本身并不是讓我最感興趣的地方,因為所有的一切事物都會產(chǎn)生數(shù)據(jù),真正有趣之處在于如何開發(fā)更能善加運用這些數(shù)據(jù)的算法之類,”她解釋道。
今天,我們使用數(shù)據(jù)的方法,并非都能直觀地展現(xiàn)出數(shù)據(jù)本身的意義,Bell說,特別是演算法──要讓所有的數(shù)據(jù)都能善加運用,就必須深入了解數(shù)據(jù)本身的正確性,而這又和最初的數(shù)據(jù)填寫者有著密切關聯(lián)。
“所有我們試圖用來讓數(shù)據(jù)使用更加合理的想法,都會在一開始被就放在最優(yōu)先的位置,”她說。事實上,她也點出了當我們開始在單一一種數(shù)據(jù)模式內(nèi)找尋數(shù)據(jù)間的固定模式、因果關系和關聯(lián)時,實際上都早已落入固有的偏見之中。
“對我而言,大數(shù)據(jù)分析最迷人之處不僅在于匯聚了來自各個領域的廣泛數(shù)據(jù),更重要的是你可以拿它們來做些什么,”Bell表示,我們愈來愈依賴數(shù)據(jù)分析,某種層面來說,這也代表著文化腳本(cultural script)正在跨入嶄新的水平。
這類有關數(shù)據(jù)分析的想法,也推動數(shù)據(jù)朝“擬人化”(anthropomorphizing)的方向發(fā)展。Bell指出,在開始討論到“數(shù)據(jù)的秘密生活”(the secret life of data)之際,所有這些數(shù)據(jù)都將是必要的。而這些討論也將進一步推動大數(shù)據(jù)和云計算等應用的擴展。
Bell表示,所有的數(shù)據(jù)實際上都擁有它自己的特性,這正是使它與其他所有數(shù)據(jù)有所差異化之處,因此,在分析數(shù)據(jù)以前,最好先厘清所有數(shù)據(jù)的特性。