近日網(wǎng)上流傳這么一個故事:一名小伙子專門應(yīng)聘上海高檔小區(qū)的物業(yè)管理,自己配了掃描槍,每天就盯著小區(qū)垃圾堆,看見有條形碼就掃描,晚上回家把數(shù)據(jù)整理出來,得出小區(qū)居民喝什么水、吃什么油、買什么衣服,整個小區(qū)的消費品類和品牌偏好一清二楚,再形成報告賣給大公司,報告價值數(shù)十萬。
這是大數(shù)據(jù)價值的微小表象之一。
2013年被認(rèn)為是世界的大數(shù)據(jù)元年,數(shù)據(jù)被稱為新的石油,在未來,數(shù)據(jù)將會像土地、石油和資本一樣,成為經(jīng)濟(jì)運行中的根本性資源。美國人維克托·邁爾·舍恩伯格撰寫的《大數(shù)據(jù)時代》指出,大數(shù)據(jù)帶來的信息風(fēng)暴正在變革我們的生活、工作和思維,大數(shù)據(jù)開啟了一次重大的時代轉(zhuǎn)型。
維克托·邁爾·舍恩伯格被譽(yù)為“大數(shù)據(jù)商業(yè)應(yīng)用第一人”,擁有在哈佛大學(xué)、牛津大學(xué)、耶魯大學(xué)和新加坡國立大學(xué)等多個互聯(lián)網(wǎng)研究重鎮(zhèn)任教的經(jīng)歷,早在2010年就在《經(jīng)濟(jì)學(xué)人》上發(fā)布了長達(dá)14頁對大數(shù)據(jù)應(yīng)用的前瞻性研究。
什么是大數(shù)據(jù)
大數(shù)據(jù),或稱巨量資料,指所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時間內(nèi)達(dá)到擷取、管理、處理、整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。
概念很玄乎,其實每個人每天都在創(chuàng)造數(shù)據(jù)。以淘寶為例,每天有數(shù)以萬計的交易在淘寶上進(jìn)行,交易時間、商品價格、購買數(shù)量均被記錄,更重要的是,這些信息可以與買賣雙方的年齡、性別、地址、甚至興趣愛好等個人特征信息相匹配。運用匹配的數(shù)據(jù),淘寶可以優(yōu)化店鋪排名和用戶推薦;商家可以根據(jù)以往的銷售信息和“淘寶指數(shù)”進(jìn)行生產(chǎn)、庫存決策,賺更多的錢;而與此同時,更多的消費者也能以更優(yōu)惠的價格買到更心儀的寶貝。
相同道理,Google和百度、Facebook和人人網(wǎng)、Twitter和微博……互聯(lián)網(wǎng)每時每刻都在產(chǎn)生數(shù)據(jù),從而形成數(shù)據(jù)海洋。人們要做的,是如何從海里撈到大魚。
如何運用大數(shù)據(jù)
有這么幾個案例:
華爾街“德溫特資本市場”公司首席執(zhí)行官保羅·霍廷每天的工作之一,就是利用電腦程序分析全球3.4億微博賬戶的留言,進(jìn)而判斷民眾情緒,再以“1”到“50”進(jìn)行打分。根據(jù)打分結(jié)果,霍廷再決定如何處理手中數(shù)以百萬美元計的股票。他的判斷原則很簡單:如果所有人似乎都高興,那就買入;如果大家的焦慮情緒上升,那就拋售。這一招收效顯著——當(dāng)年第一季度,霍廷的公司獲得了7%的收益率。
美國一個超市將女性顧客中的孕婦視作購物的黃金消費者。為了將這部分目標(biāo)人群在懷孕前就爭取過來,該超市通過調(diào)查羅列出幾十種購物偏好,當(dāng)某位顧客的收銀條上集中呈現(xiàn)這類商品時,就會被認(rèn)定為可能是孕婦或家中有孕婦,超市隨后向其發(fā)送孕婦產(chǎn)品廣告。一次,當(dāng)有人以“家中并無孕婦卻總是收到相關(guān)產(chǎn)品廣告”為由控告這家超市后,卻發(fā)現(xiàn)原來是自己還在上高中的女兒懷孕了。
2009年甲型H1N1流感病毒出現(xiàn),在沒有疫苗的情況下,公共衛(wèi)生專家能做的只是減慢傳播速度,要做到這一點,專家必須先知道流感出現(xiàn)在哪里,這只能依靠各地醫(yī)生發(fā)現(xiàn)并告知疾控中心,信息肯定是滯后的??墒?,Google的工程師們比疾控專家更早地判斷出流感從哪里傳播出來,他們依靠的就是Google所掌握的大數(shù)據(jù)。
這就是大數(shù)據(jù)的運用實例。你在百度上搜索、論壇上發(fā)言、新浪上微博,都有可能成為被分析的數(shù)據(jù)?!洞髷?shù)據(jù)時代》詳細(xì)分析了Google、微軟、亞馬遜、IBM、蘋果、Facebook、Twitter、VISA等大數(shù)據(jù)先鋒們最具價值的應(yīng)用案例。如何利用大數(shù)據(jù),從而開發(fā)出其中的商業(yè)價值,已經(jīng)成為投資者、IT界人士以及政府公共管理部門普遍關(guān)心的問題。
大數(shù)據(jù)帶來什么變革
維克托認(rèn)為,大數(shù)據(jù)是一種“人們在大規(guī)模數(shù)據(jù)的基礎(chǔ)上可以做到的事情”的指代,是“人們獲得新的認(rèn)知、創(chuàng)造新的價值的源泉,還是改變市場、組織機(jī)構(gòu),以及政府與公民關(guān)系的方法”。
維克托提醒人們要做好“三大轉(zhuǎn)變”的準(zhǔn)備:其一,在大數(shù)據(jù)時代,可分析更多乃至全體的數(shù)據(jù),而不再依賴于隨機(jī)采樣;其二,數(shù)據(jù)如此之多,可以放棄精確允許混雜;其三,有了數(shù)據(jù)支持,完全可以知其然而不必知其所以然,即從因果關(guān)系轉(zhuǎn)為相關(guān)關(guān)系。此三大論斷,意味著人們理解和組建社會的方法將徹底改變,也預(yù)示著某些學(xué)科存在的正當(dāng)性將面臨史上最嚴(yán)峻的拷問,如社會科學(xué)。“這門學(xué)科過去曾非常依賴樣本分析、研究和調(diào)查問卷。當(dāng)記錄下來的是人們平常狀態(tài),也就不用擔(dān)心在做研究和調(diào)查問卷時存在的偏見了?,F(xiàn)在,我們可以收集過去無法收集到的信息。”艾伯特-拉斯洛·巴拉巴西的《爆發(fā)》甚至認(rèn)為,通過大數(shù)據(jù)和冪律分布分析,人類行為93%是可以預(yù)測的。