這是一個(gè)注定要被拍磚的問題,但是這樣拍著改著也可能就真明確了。所以無論如何,還是先拋出塊磚頭吧。
我們都在說大數(shù)據(jù)時(shí)代來臨,信息和數(shù)據(jù)大爆炸。從2013年初開始,對于大數(shù)據(jù)爆發(fā)的焦慮感,緊迫感,不由自主地被卷入的甚至無力的感覺,驅(qū)動(dòng)眾多行業(yè)、企業(yè)和團(tuán)體去關(guān)注和開始接觸和了解大數(shù)據(jù),自覺或不自覺的,主動(dòng)或不得已地去融入這波洪流。但是,真的說到大數(shù)據(jù),我們身邊到底有多少數(shù)據(jù)量,它們都分布在哪些行業(yè),哪些數(shù)據(jù)是目前可用的,哪些行業(yè)已經(jīng)在使用數(shù)據(jù),進(jìn)入產(chǎn)業(yè)互聯(lián)網(wǎng)和數(shù)據(jù)引導(dǎo)的變革了?
可能看到的版圖依舊模糊。因此,我們懷抱很好的希望,以第一個(gè)吃螃蟹并期待來自行業(yè)的矯正和拍磚的態(tài)度,首先嘗試對于國內(nèi)各個(gè)領(lǐng)域,行業(yè)以及機(jī)構(gòu)的數(shù)據(jù)擁有情況,使用情況以及未來路徑做一個(gè)粗獷地調(diào)研、梳理和判斷,對大數(shù)據(jù)時(shí)代我國各個(gè)領(lǐng)域數(shù)據(jù)資產(chǎn)的擁有和使用情況,也就是我們數(shù)據(jù)資產(chǎn)的家底做個(gè)盤點(diǎn),也對各個(gè)行業(yè)、系統(tǒng)進(jìn)軍大數(shù)據(jù),以及擁抱產(chǎn)業(yè)互聯(lián)網(wǎng)的進(jìn)度和未來做個(gè)簡單判斷。事實(shí)上,大數(shù)據(jù)之題無疑繁若星辰,然而只有在相對完整的視圖下,繁星若塵,我們才可得以一窺天機(jī)。
閑話少敘,現(xiàn)在開始算賬。
從我們手頭掌握的數(shù)據(jù)來看,2013年度,中國存儲市場出貨容量超過1個(gè)EB,存儲總量而IDC曾經(jīng)發(fā)布的預(yù)測表明在未來的3-4年,中國存儲總?cè)萘靠赡苓_(dá)到18個(gè)EB.從數(shù)據(jù)存儲市場的需求來看,互聯(lián)網(wǎng)、醫(yī)療健康、通信、公共安全以及軍工等行業(yè)的需求是主要的,且上升態(tài)勢明顯。
鑒于存儲和服務(wù)器的緊密相關(guān),我們從已經(jīng)獲得的資料可以知道,目前全球運(yùn)行的服務(wù)器總量超過5000萬臺,美國國內(nèi)運(yùn)行的服務(wù)器總體容量接近1000萬臺。從各種市場公開數(shù)據(jù)來看,2013年中國內(nèi)地服務(wù)器銷售總數(shù)接近為100萬臺。大體估算,截止到2013年底,中國內(nèi)地整體在運(yùn)行的服務(wù)器總數(shù)量在300萬臺以上。
從現(xiàn)有存儲容量看,中國目前可存儲數(shù)據(jù)容量大約在8EB-10EB左右,現(xiàn)有的可以保存下來的數(shù)據(jù)容量大約在5EB左右,且每兩年左右會翻上一倍。這些被存儲數(shù)據(jù)的大體分布為:媒體/互聯(lián)網(wǎng)占據(jù)現(xiàn)有容量的1/3,政府部門/電信企業(yè)占據(jù)1/3,其他的金融、教育、制造、服務(wù)業(yè)各部分占據(jù)剩余1/3數(shù)據(jù)量。
公開數(shù)據(jù)顯示,互聯(lián)網(wǎng)搜索巨頭百度2013年擁有數(shù)據(jù)量接近EB級別、阿里、騰訊聲明自己存儲的數(shù)據(jù)總量都達(dá)到了百PB以上。此外,電信、醫(yī)療、金融、公共安全、交通、氣象等各個(gè)方面保存的數(shù)據(jù)量也都達(dá)到數(shù)十或者上百PB級別。
在目前被廣泛引用的IDC和EMC聯(lián)合發(fā)布的“2020年的數(shù)字宇宙”報(bào)告預(yù)測到2020年,全球數(shù)字宇宙將會膨脹到40000EB,均攤每個(gè)人身上是5200GB以上,這個(gè)量將會如何被有效存儲和應(yīng)用,我們眼下還很難想象。然而我們看到該報(bào)告指出,從現(xiàn)在起到2020年,全球數(shù)字宇宙的膨脹率大約為每兩年翻一番。事實(shí)上,根據(jù)上述調(diào)查結(jié)論和服務(wù)器容量調(diào)查,我們也能做出個(gè)相對合理的推斷:目前,全球產(chǎn)生的數(shù)據(jù)量中僅有1%左右的數(shù)據(jù)能夠被保存下來,也就是說今天全球能夠被保存下來的數(shù)據(jù)也就是在50EB左右,而其中被標(biāo)記并用于分析的數(shù)據(jù)更是不到10%.
作為全球人口和計(jì)算設(shè)備保有量的大國,我國每年所能產(chǎn)生的數(shù)據(jù)量也極為龐大,有數(shù)據(jù)說2014年甚至可能達(dá)到ZB級別,但是真正被有效存儲下來的數(shù)據(jù)僅僅是其中極微少部分,中國保存下來數(shù)據(jù)占全球數(shù)據(jù)的比例大約在10%左右,也就是上面說的5EB.這些數(shù)據(jù)中,目前已被標(biāo)記并用于分析的數(shù)據(jù)僅達(dá)到500PB左右,也是接近10%的一個(gè)比例。
伴隨著云計(jì)算迅速普及和各行業(yè),各企業(yè)和部門對于數(shù)據(jù)資產(chǎn)保存和利用意識的增強(qiáng),以及通過互聯(lián)網(wǎng)、大數(shù)據(jù)對產(chǎn)業(yè)進(jìn)行變革的意愿,未來2-3年一定會有越來越多的行業(yè)、大企業(yè)步入到PB、百PB、甚至EB級別數(shù)據(jù)俱樂部,未來3-3年中國的數(shù)據(jù)總量也將呈翻倍上升態(tài)勢,我們預(yù)測2015年中國就可能突破10EB數(shù)據(jù)保有量,被標(biāo)簽和分析利用數(shù)據(jù)量也將上升到EB級別,這些數(shù)據(jù)增長中互聯(lián)網(wǎng)、政務(wù)、醫(yī)療、教育、安全等行業(yè)和領(lǐng)域所做貢獻(xiàn)最大,而相對傳統(tǒng)的物流、生產(chǎn)制造、甚至農(nóng)業(yè)等領(lǐng)域數(shù)據(jù)擁有量的增長將更加明顯。(中云原創(chuàng),轉(zhuǎn)載請注明)