正在到來的數(shù)據(jù)革命將如何改變企業(yè)的經(jīng)營(yíng)、政府的服務(wù)乃至普通人的社會(huì)生活?
在你出生的那一刻:男孩、7斤8兩,而你的父母不再爭(zhēng)論你長(zhǎng)得像誰,因?yàn)樗麄冊(cè)缇椭懒岁P(guān)于你的一切。計(jì)算機(jī)通過計(jì)算你的基因、出生環(huán)境等遺傳信息,數(shù)據(jù)分析的結(jié)果你會(huì)有43%像母親、57%像父親,而你的未來的一切更是清晰可見:你的智力水平?jīng)Q定你只會(huì)上當(dāng)?shù)卮髮W(xué)(你就不用太努力讀書考清華、北大或者耶魯、哈佛了)、你不擅長(zhǎng)滑雪但擅長(zhǎng)跑步(跳遠(yuǎn)也不太行)、你是個(gè)異性戀會(huì)喜歡棕色頭發(fā)的苗條女孩(根據(jù)GPS和其他信息的推斷,她將會(huì)在你隔壁的隔壁的醫(yī)院出生,只不過比你晚兩年)、你喜歡喝可樂(會(huì)熱愛可口可樂,去超市就不用考慮百事可樂或其他牌子了)……如果關(guān)于你的一切已經(jīng)注定,當(dāng)真實(shí)的你來到人世,你是打算努力拼搏一把過個(gè)真正屬于自己的人生,還是打算按照計(jì)算機(jī)計(jì)算出的“你”的狀態(tài)過這一世?
這不是癡人說夢(mèng),更不是杞人憂天,而是一個(gè)真實(shí)如“少年派”的寓言。即使瑪雅人的末日預(yù)言不靠譜,但大數(shù)據(jù)技術(shù)的演進(jìn)已經(jīng)驅(qū)使人類來到了一個(gè)新世界的門口,肉身的人類將和虛擬的自己并存,有時(shí)候他們是無法分辨的兩者。正在到來的大數(shù)據(jù)革命,正在改變著人類的社會(huì)和生活--你,無法逃脫。
大數(shù)據(jù)時(shí)代到來
美國(guó)伊利諾斯大學(xué)的Kalev Leetaru教授發(fā)現(xiàn):“過去50年,紐約時(shí)報(bào)共產(chǎn)生了30億單詞,如今Twitter每一天都能產(chǎn)生80億單詞。”沒錯(cuò),你承認(rèn)這是-個(gè)數(shù)據(jù)爆炸的時(shí)代,不過你也許更關(guān)心另一個(gè)問題:到底什么樣的數(shù)據(jù)才能被叫做大數(shù)據(jù)?
信息技術(shù)管理專家涂子沛認(rèn)為,“大”是虛指,大數(shù)據(jù)中的“大”指的是人類有能力發(fā)現(xiàn)數(shù)據(jù)中蘊(yùn)藏的大價(jià)值。他在《大數(shù)據(jù)》一書中論述了摩爾定律、普適計(jì)算、數(shù)據(jù)挖據(jù)、社交媒體和云計(jì)算是如何共同作用促成大數(shù)據(jù)的出現(xiàn):摩爾定律帶來的硬件存儲(chǔ)性能增長(zhǎng)與價(jià)格降低為大數(shù)據(jù)形成了優(yōu)良的性價(jià)比前提;普適計(jì)算帶來的萬物互聯(lián)的數(shù)據(jù)布局;數(shù)據(jù)挖掘讓數(shù)據(jù)成為可以知道行動(dòng)、產(chǎn)生價(jià)值的知識(shí);社交媒體帶來的24小時(shí)在線使得人們可以利用算法預(yù)測(cè)公共衛(wèi)生和突發(fā)事件;云計(jì)算所形成的完整產(chǎn)業(yè)鏈和大規(guī)模的商業(yè)應(yīng)用為大數(shù)據(jù)提供存儲(chǔ)空間和訪問渠道……爆發(fā)的大數(shù)據(jù)意味著人們的社會(huì)生活將發(fā)生巨變。
一個(gè)微博上的故事也許能說明這個(gè)問題--硅谷帕洛阿托市中心有家創(chuàng)業(yè)公司,專門對(duì)公共大數(shù)據(jù)做分析。如果一個(gè)中東人士買了單程機(jī)票進(jìn)入美國(guó),連續(xù)兩次參觀迪士尼,并購(gòu)買化學(xué)品,這套分析軟件會(huì)發(fā)出預(yù)警,據(jù)說這套軟件很受政府和大零售商的青睞。大數(shù)據(jù)因此被美國(guó)政府視作科技領(lǐng)域的首要挑戰(zhàn)。2010年12月的美國(guó)總統(tǒng)科學(xué)技術(shù)顧問委員會(huì)中指出:“如何收集、保存、維護(hù)、管理、分析、共享正在呈指數(shù)級(jí)增長(zhǎng)的數(shù)據(jù)是我們必須面對(duì)的一個(gè)重要挑戰(zhàn)”。
的確,大數(shù)據(jù)將為很多領(lǐng)域帶來根本性的改變,統(tǒng)計(jì)學(xué)便是其中之一。傳統(tǒng)統(tǒng)計(jì)學(xué)中的普查和抽樣方法都是靜態(tài)和定時(shí)的,只能提供瞬間的記載。而人類本身充滿不確定性,其動(dòng)作也是連續(xù)且動(dòng)態(tài)的,因此大數(shù)據(jù)所能提供的實(shí)時(shí)、多源和傳統(tǒng)統(tǒng)計(jì)學(xué)融合之后,將得到相對(duì)更高質(zhì)量和及時(shí)的統(tǒng)計(jì)結(jié)果。
對(duì)歷史數(shù)據(jù)的研究,將有望改善犯罪、城市擁堵等社會(huì)問題。美英兩國(guó)3所大學(xué)合作將英國(guó)240年的罪犯庭審記錄輸入電腦,以研究犯罪情況發(fā)展的趨勢(shì)、觸發(fā)的原因以及和社會(huì)背景之間的關(guān)系。借助大數(shù)據(jù)的“顯微鏡”觀察人類行為,類似的數(shù)據(jù)應(yīng)用將帶來更多的社會(huì)管理模式創(chuàng)新。而整個(gè)社會(huì)將向智能化邁進(jìn)--計(jì)算機(jī)和網(wǎng)絡(luò)更加智能,人與人之間的合作、任務(wù)之間的對(duì)接會(huì)更精準(zhǔn),國(guó)家和社會(huì)的運(yùn)行成本會(huì)越來越低。
數(shù)據(jù)改變企業(yè)經(jīng)營(yíng)
商業(yè)社會(huì)中,大數(shù)據(jù)將是創(chuàng)新和競(jìng)爭(zhēng)的新技術(shù)。2007年信息經(jīng)濟(jì)學(xué)教授托馬斯·達(dá)文波特就前瞻性地指出:“一些公司已經(jīng)把它們商業(yè)活動(dòng)的每一個(gè)環(huán)節(jié)都建立在數(shù)據(jù)收集、分析和行動(dòng)的能力之上了。所有的公司都可以從它們的成功當(dāng)中學(xué)習(xí)”。
涂子沛認(rèn)為,今天,無論企業(yè)是否出于自愿,企業(yè)本身已經(jīng)身處數(shù)據(jù)之中--企業(yè)內(nèi)部信息系統(tǒng)、ERP所產(chǎn)生的每一條帶有具體含義和價(jià)值的數(shù)據(jù),與外部環(huán)境中由大眾掌握的社交媒體等產(chǎn)生的模糊數(shù)據(jù),以及社會(huì)生活中的人口、天氣和其他公司的外部數(shù)據(jù)。來自社交媒體的負(fù)面信息可能使企業(yè)本身“苦練”的產(chǎn)品質(zhì)量、品牌價(jià)值等內(nèi)功一夕之間發(fā)生根本性的變化。“老羅挑戰(zhàn)西門子冰箱”的微博大事件,足以讓每一個(gè)企業(yè)警醒并關(guān)注來自消費(fèi)者的信息。天氣等公共問題的瞬息變化更是企業(yè)必須要善用的信息。暴雨、極寒等極端天氣之下,應(yīng)對(duì)得當(dāng)?shù)钠髽I(yè)能夠迅速捕捉到商機(jī)。比如羽絨制衣等企業(yè)如果了解到今冬的嚴(yán)寒,提前采購(gòu)原料將會(huì)幫助其占得市場(chǎng)先機(jī)。這就要求以信息管理系統(tǒng)為代表的精確數(shù)據(jù)必須和來自社交媒體等來源的企業(yè)外部數(shù)據(jù)整合。涂子沛認(rèn)為,對(duì)于企業(yè)來說,過去那種精準(zhǔn)數(shù)據(jù)占90%、其他數(shù)據(jù)占10%的狀況將被改變,來自社交媒體等來源的外部數(shù)據(jù)將占到50%以上。
基于數(shù)據(jù)的競(jìng)爭(zhēng)將提高組織的日常運(yùn)營(yíng)效率,找出可以省錢的地方和機(jī)會(huì);基于數(shù)據(jù)的分析結(jié)果提高決策速度和質(zhì)量、增強(qiáng)預(yù)測(cè)能力,從而更好地理解客戶和市場(chǎng)需要。企業(yè)因此要學(xué)會(huì)計(jì)算數(shù)據(jù)的投資回報(bào)--數(shù)據(jù)價(jià)值和數(shù)據(jù)成本的比值。因此降低數(shù)據(jù)成本,增加優(yōu)質(zhì)數(shù)據(jù)價(jià)值都是企業(yè)要關(guān)心的方向。自動(dòng)化工具、使用云存儲(chǔ)等都可能成為企業(yè)降低數(shù)據(jù)成本的方法,而社交化ERP對(duì)更多、更全面數(shù)據(jù)的收集,建立負(fù)責(zé)數(shù)據(jù)質(zhì)量的數(shù)據(jù)治理隊(duì)伍和流程,使用更新更成熟的數(shù)據(jù)工具、搭建數(shù)據(jù)整合分析平臺(tái)都是數(shù)據(jù)增值的有效方法。其中,人們熟悉的數(shù)據(jù)挖掘、商務(wù)智能(BI)和證析(Analytics,泛指企業(yè)一切和數(shù)據(jù)相關(guān)活動(dòng),包括績(jī)效和風(fēng)險(xiǎn)分析)等工具,可在大數(shù)據(jù)時(shí)代進(jìn)行多源和實(shí)時(shí)的應(yīng)用。
一個(gè)典犁的商業(yè)應(yīng)用是迪士尼樂園。迪士尼是孩子和童心末泯的成人的天堂,每個(gè)樂園里都有100多個(gè)項(xiàng)目,但每一項(xiàng)目前等待的排隊(duì)人群常常令人興致大減。為此迪士尼公司使用10多午的歷史數(shù)據(jù),結(jié)合天氣、旅游等數(shù)據(jù)預(yù)測(cè)每一條隊(duì)伍每一天每一小時(shí)所需的排隊(duì)時(shí)間,游客可以參考這個(gè)分析結(jié)果安排自己在園區(qū)內(nèi)的游覽次序。為了處理突發(fā)情況,迪土尼公司還同時(shí)收集Twitter數(shù)據(jù)更新每一條隊(duì)伍的排隊(duì)等候時(shí)間。這可以使每位游客平均每人節(jié)省4個(gè)小時(shí),提升游客們進(jìn)園游玩的樂趣。
大數(shù)據(jù)在公共領(lǐng)域同樣大有用武之地。美國(guó)賓夕法尼亞州政府分析全州感冒藥片的銷量、對(duì)比系統(tǒng)保存的歷史數(shù)據(jù)以判斷是否會(huì)發(fā)生大面積流感,同時(shí)分析兒童的就診率,并對(duì)比歷史數(shù)據(jù),也對(duì)Twitter進(jìn)行文本分析,以實(shí)時(shí)監(jiān)控各地區(qū)流感爆發(fā)、傳播和分布情況。