我們正面臨一個(gè)大數(shù)據(jù)的時(shí)代。在過(guò)往的小數(shù)據(jù)時(shí)代,人類對(duì)事物的判斷多數(shù)基于直覺(jué)、經(jīng)驗(yàn)和臆想,偏見(jiàn)隨處可見(jiàn)。當(dāng)信息爆炸積累到量變引發(fā)質(zhì)變的階段,大數(shù)據(jù)將把數(shù)學(xué)算法運(yùn)用到海量數(shù)據(jù)上,以此來(lái)修正人類的偏見(jiàn)和直覺(jué),并預(yù)測(cè)未來(lái)。
從依靠自身作判斷作決策,發(fā)展到依靠數(shù)據(jù)作決定并獲得競(jìng)爭(zhēng)優(yōu)勢(shì),這個(gè)轉(zhuǎn)變是大數(shù)據(jù)的最大貢獻(xiàn),這將引發(fā)巨大的管理變革。因?yàn)閿?shù)據(jù)本身不會(huì)說(shuō)謊,通過(guò)讓數(shù)據(jù)做主,作科學(xué)決策,從而讓社會(huì)科學(xué)真正成為一門(mén)科學(xué)。
另一方面,數(shù)據(jù)也正成為企業(yè)的核心資產(chǎn),未來(lái)可能將被計(jì)入資產(chǎn)負(fù)債表。中國(guó)市值最大的三大互聯(lián)網(wǎng)公司,騰訊、阿里巴巴[微博]和百度[微博],也是數(shù)據(jù)資產(chǎn)的最多擁有者——騰訊擁有最大的網(wǎng)絡(luò)通訊數(shù)據(jù),阿里巴巴擁有最大的網(wǎng)絡(luò)交易數(shù)據(jù),而百度則擁有最大的搜索數(shù)據(jù)資產(chǎn)。
國(guó)外媒體預(yù)測(cè)2013年將是世界的大數(shù)據(jù)元年。這場(chǎng)正在到來(lái)的數(shù)據(jù)革命,將給企業(yè)發(fā)展模式和決策帶來(lái)前所未有的革新與挑戰(zhàn),這一點(diǎn)是顯而易見(jiàn)的。
公元前三世紀(jì),埃及國(guó)王托勒密一世創(chuàng)建亞歷山大圖書(shū)館,在鼎盛時(shí)期,該圖書(shū)館藏書(shū)達(dá)70萬(wàn)卷,埃及人稱它是“人類知識(shí)的燈塔,文明的交會(huì)”。如果以今日的眼光來(lái)看,亞歷山大圖書(shū)館可以說(shuō)是當(dāng)時(shí)全球規(guī)模最大的知識(shí)與數(shù)據(jù)中心,這些數(shù)據(jù)的分類、整理、存儲(chǔ)花費(fèi)數(shù)百年。
1439年,德國(guó)人古登堡發(fā)明印刷機(jī),從1453年至1503年,50年間大約有800萬(wàn)本書(shū)被印刷,比1200年以來(lái)整個(gè)歐洲的所有手抄本還要多,歐洲的信息存儲(chǔ)量花了50年才增長(zhǎng)了一倍,而如今大約每三年就能增長(zhǎng)一倍。
到2013年,世界上存儲(chǔ)的數(shù)據(jù)將達(dá)到1.2ZB(ZB,澤字節(jié),十萬(wàn)億億字節(jié)),如果把這些數(shù)據(jù)全部記錄在書(shū)中,這些書(shū)可以覆蓋整個(gè)美國(guó)52次;如果將之存儲(chǔ)在光盤(pán)上,這些光盤(pán)可以堆成5堆,每一堆都可以伸到月球。
全世界數(shù)據(jù)量呈現(xiàn)幾何級(jí)加速增長(zhǎng)速度,這要?dú)w因于摩爾定律。1965年,英特爾[微博]的創(chuàng)始人戈登·摩爾提出,當(dāng)價(jià)格不變時(shí),集成電路上可容納的晶體管數(shù)目,每隔18個(gè)月便會(huì)增加一倍,性能也將提升一倍。換言之,每一美元所能買到的電腦性能,將每隔18個(gè)月翻兩倍以上。而摩爾定律導(dǎo)致的結(jié)果就是,電腦運(yùn)行速度越來(lái)越快,存儲(chǔ)空間更大也更廉價(jià)。數(shù)據(jù)顯示,在過(guò)去50年,數(shù)據(jù)存儲(chǔ)成本大約每?jī)赡昃拖鳒p一半,而存儲(chǔ)密度則增加了5000萬(wàn)倍,人類存儲(chǔ)信息量的增長(zhǎng)速度比世界經(jīng)濟(jì)的增長(zhǎng)速度快4倍。
同時(shí),數(shù)據(jù)記錄的發(fā)展,其目的在于滿足人類測(cè)量、記錄和分析世界的渴望。記錄和計(jì)量能夠再現(xiàn)人類活動(dòng),為預(yù)測(cè)和計(jì)劃奠定基礎(chǔ)。幾百年來(lái),計(jì)量從長(zhǎng)度、重量不斷擴(kuò)展到面積、體積和時(shí)間等等。公元700年前后,阿拉伯軍隊(duì)征服了印度旁遮普地區(qū),他們驚奇地發(fā)現(xiàn),印度的計(jì)數(shù)方法相當(dāng)先進(jìn)。印度數(shù)學(xué)家根據(jù)同一數(shù)字符號(hào)與其他數(shù)字符號(hào)位置關(guān)系的不同,確定了數(shù)字位置的概念,后人不斷改進(jìn)并發(fā)明了表達(dá)數(shù)字的1,2,3,4,5,6,7,8,9,0十個(gè)符號(hào),成為記數(shù)的基礎(chǔ)。十字軍東征時(shí),歐洲騎士將這一計(jì)數(shù)方法從阿拉伯地區(qū)帶回歐洲。公元1000年,教皇希爾維斯特二世開(kāi)始倡導(dǎo)使用阿拉伯?dāng)?shù)字。到16世紀(jì)晚期,這一計(jì)數(shù)方法在歐洲得以普及。
到了19世紀(jì),隨著科學(xué)家發(fā)明新工具來(lái)測(cè)量和記錄電流、氣壓、溫度、聲頻之類的自然科學(xué)現(xiàn)象的出現(xiàn),科學(xué)已經(jīng)離不開(kāi)定量化了,我們已經(jīng)處在一個(gè)一切事物都需要被測(cè)量、劃分和記錄的時(shí)代。隨著計(jì)算機(jī)技術(shù)的發(fā)展,驅(qū)動(dòng)各類系統(tǒng)的算法也進(jìn)步神速,在很多領(lǐng)域,這些算法帶來(lái)的進(jìn)步還要?jiǎng)龠^(guò)芯片的進(jìn)步。數(shù)據(jù)顯示,計(jì)算機(jī)處理數(shù)據(jù)能力的增長(zhǎng)速度比世界經(jīng)濟(jì)的增長(zhǎng)速度快9倍。算術(shù)賦予數(shù)據(jù)新的意義,因?yàn)閿?shù)據(jù)此時(shí)不但可以被記錄,還可以被分析和再利用。
在古羅馬帝國(guó)時(shí)期,只有政府才擁有采集和分析人口、經(jīng)濟(jì)等大規(guī)模數(shù)據(jù)的能力和意愿。而到了21世紀(jì),隨著數(shù)據(jù)存儲(chǔ)和獲得越來(lái)越簡(jiǎn)單,私人控股公司開(kāi)始擁有大規(guī)模的數(shù)據(jù),如Google每天要處理24PB(PB,拍字節(jié),千萬(wàn)億字節(jié))的數(shù)據(jù),相當(dāng)于美國(guó)國(guó)家圖書(shū)館所有紙質(zhì)出版物所含數(shù)據(jù)量的上千倍。私人控股公司,尤其是互聯(lián)網(wǎng)公司可以收集大量有價(jià)值的數(shù)據(jù),而且有利用這些數(shù)據(jù)的強(qiáng)烈的利益驅(qū)動(dòng)力,所以互聯(lián)網(wǎng)公司順理成章地成為最新處理技術(shù)的領(lǐng)頭實(shí)踐者,“大數(shù)據(jù)”概念應(yīng)運(yùn)而生。