繼“物聯(lián)網(wǎng)”“云計算”之后,“大數(shù)據(jù)”成為了炙手可熱的科技“新貴”,不少地方政府紛紛提出率先布局大數(shù)據(jù)產(chǎn)業(yè)、建設(shè)大數(shù)據(jù)中心。
大數(shù)據(jù)時代來臨意味著什么?政府和業(yè)界如何應(yīng)對大數(shù)據(jù)時代帶來的變革和挑戰(zhàn)?科技日報記者就相關(guān)問題采訪了專家和業(yè)內(nèi)人士。
大數(shù)據(jù)不只是“數(shù)據(jù)大”
究竟什么是大數(shù)據(jù)?中國工程院院士、工信部通信科技委主任鄔賀銓認(rèn)為,隨著互聯(lián)網(wǎng)的出現(xiàn)和發(fā)展,數(shù)據(jù)量每年以40%的速度遞增,超過了現(xiàn)有計算機(jī)硬件和軟件的處理能力,于是人們將無法在容許的時間內(nèi)用常規(guī)軟件工具對其內(nèi)容進(jìn)行抓取、處理、分析的數(shù)據(jù)集合稱之為大數(shù)據(jù)。
多大規(guī)模的數(shù)據(jù)才算大數(shù)據(jù)?“大數(shù)據(jù)規(guī)模的標(biāo)準(zhǔn)是持續(xù)變化的,當(dāng)前泛指單一數(shù)據(jù)集的大小在幾十個TB(百萬兆字節(jié))和幾個PB(千萬億字節(jié))之間”。
也許你并沒有意識到,大數(shù)據(jù)在日常生活中已不鮮見。鄔賀銓舉例道,比如一個城市里有幾十萬個攝像頭,單個8兆比特每秒的攝像頭一小時就產(chǎn)生3.6GB(千兆字節(jié))的數(shù)據(jù),一個城市幾十萬個攝像頭一個月拍攝存儲下來的數(shù)據(jù)量就達(dá)到PB量級。再比如,醫(yī)院一天要做很多例CT檢查,一幅CT圖像幾百兆字節(jié),一個病人可能多達(dá)兩千幅CT照片,加上病人數(shù)據(jù)需要保存幾十年,自然產(chǎn)生非常龐大的數(shù)據(jù)量。“大數(shù)據(jù)已經(jīng)滲透進(jìn)了生活的每個角落,基于此,我們才說大數(shù)據(jù)時代已經(jīng)來臨。”
大數(shù)據(jù)只是數(shù)據(jù)大嗎?顯然不是。牛津大學(xué)教授維克托·邁爾-舍恩伯格在他與人合著的《大數(shù)據(jù)時代》一書中寫道:人們在大規(guī)模數(shù)據(jù)的基礎(chǔ)上可以做到的事情,在小規(guī)模數(shù)據(jù)的基礎(chǔ)上是無法完成的。
大數(shù)據(jù)正在改變我們的生活以及理解世界的方式,成為新發(fā)明和新服務(wù)的源泉。
對此,鄔賀銓也表達(dá)了相同的看法。“數(shù)據(jù)量大到一定程度,可挖掘價值超乎想象,是受樣本數(shù)量所限的小規(guī)模數(shù)據(jù)難以比擬的。因此,世界經(jīng)濟(jì)論壇去年發(fā)布的報告指出,大數(shù)據(jù)就是新財富,價值堪比石油。”
大數(shù)據(jù)帶來大挑戰(zhàn)
身處大數(shù)據(jù)時代,如何收集存儲海量數(shù)據(jù),并將一堆龐大的看似毫無關(guān)聯(lián)的“冰冷”數(shù)據(jù)轉(zhuǎn)化成幫助決策的利器,無疑考驗著人們的智慧。
正如鄔賀銓所說,盡管大數(shù)據(jù)時代已經(jīng)來臨,但這并不意味著我們真正掌控了大數(shù)據(jù),在大數(shù)據(jù)的收集存儲和挖掘分析上,還有很多技術(shù)難題需要去攻克。