12月6日下午,陜西省工信廳副廳長(zhǎng)蔡蘇昌在“2012西咸新區(qū)大數(shù)據(jù)高峰論壇”上演講前講了一件小事:一位北京的朋友在得知陜西要在北京召開(kāi)關(guān)于大數(shù)據(jù)的論壇時(shí)調(diào)侃道:“你們陜西人一直挺實(shí)在的,怎么現(xiàn)在也學(xué)會(huì)忽悠了!”從物聯(lián)網(wǎng)到智慧城市,從云計(jì)算到大數(shù)據(jù),面對(duì)近幾年信息技術(shù)領(lǐng)域日新月異的發(fā)展,習(xí)慣于從傳統(tǒng)產(chǎn)業(yè)發(fā)展視角看信息技術(shù)發(fā)展的人著實(shí)感到眼花繚亂,而認(rèn)為陜西發(fā)展大數(shù)據(jù)只是追風(fēng)的懷疑顯然是這種心態(tài)的折射。
事實(shí)上,就在12月4日,IBM在京舉行了主題為“凝聚專(zhuān)家力,智贏大數(shù)據(jù)”的2012IBM PureData發(fā)布盛典。在發(fā)布會(huì)上,賽迪智庫(kù)軟件與信息服務(wù)業(yè)研究所所長(zhǎng)安暉說(shuō):“我們預(yù)測(cè)今年中國(guó)大數(shù)據(jù)的市場(chǎng)規(guī)模將達(dá)到3.1億元,未來(lái)5年的復(fù)合增長(zhǎng)率將達(dá)到75.2%,到2016年,市場(chǎng)規(guī)模將超過(guò)50億元。”
同樣,陜西西咸新區(qū)也絕非跟潮追風(fēng),因?yàn)槿珖?guó)人口信息處理與備份西安中心已經(jīng)落戶西咸新區(qū)大數(shù)據(jù)產(chǎn)業(yè)園區(qū)。雄心勃勃的他們希望到2020年建成2~3個(gè)百億級(jí)龍頭企業(yè),實(shí)現(xiàn)園區(qū)產(chǎn)值500億元,從業(yè)人員超過(guò)5萬(wàn)人,建成國(guó)家級(jí)大數(shù)據(jù)處理中心。體量巨大的大數(shù)據(jù)無(wú)處不在
一談起大數(shù)據(jù),似乎讓人覺(jué)得有些虛無(wú)縹緲,但通過(guò)一些真實(shí)的事例,就不難發(fā)覺(jué)大數(shù)據(jù)的挖掘是何等重要了。
今年3月,美國(guó)奧巴馬政府宣布了大數(shù)據(jù)的研究和發(fā)展計(jì)劃,要投入2億美元啟動(dòng)這一計(jì)劃。在前不久結(jié)束的美國(guó)總統(tǒng)大選中,奧巴馬也成為大數(shù)據(jù)的直接受益者?!稌r(shí)代》雜志認(rèn)為,奧巴馬贏得選舉的秘密之一是其競(jìng)選團(tuán)隊(duì)對(duì)數(shù)據(jù)的準(zhǔn)確分析和把握,確保其投放的競(jìng)選廣告更為有效,針對(duì)不同的人群采取不同的競(jìng)選策略,利用Facebook推動(dòng)大家投票。
安暉所長(zhǎng)很喜歡兩部電影:一部是《點(diǎn)球成金》,講的是一個(gè)教練在俱樂(lè)部遭遇困難時(shí),通過(guò)建立數(shù)學(xué)模型,利用各種比賽的數(shù)據(jù)然后贏得比賽的故事;另一部電影《少數(shù)派報(bào)告》是科幻片,講的是未來(lái)為了防止犯罪活動(dòng),怎樣利用各種數(shù)據(jù)進(jìn)行犯罪預(yù)測(cè),并在犯罪可能出現(xiàn)之前就將犯罪的危險(xiǎn)予以消除。“可以看出這兩部電影的后臺(tái)都有一個(gè)很關(guān)鍵的詞——數(shù)據(jù),通過(guò)數(shù)據(jù)可以贏得比賽,通過(guò)數(shù)據(jù)可以消除犯罪。”安暉說(shuō)。
在“2012西咸新區(qū)大數(shù)據(jù)高峰論壇”上,中國(guó)工程院院士倪光南表示,大數(shù)據(jù)是商業(yè)智能發(fā)展的結(jié)果,但兩者又有不同:在信息量上,商業(yè)智能不太大,常為T(mén)B量級(jí),而大數(shù)據(jù)信息量非常大,常為PB量級(jí);在數(shù)據(jù)特性方面,商業(yè)智能是結(jié)構(gòu)化信息,非實(shí)時(shí)信息,而大數(shù)據(jù)主要為非結(jié)構(gòu)化信息,如文本、圖形、音頻、視頻、遙感遙測(cè)信息,大多是實(shí)時(shí)信息;在信息來(lái)源上,商業(yè)智能主要為企業(yè)交易數(shù)據(jù),而大數(shù)據(jù)主要是社會(huì)日常運(yùn)作和各種服務(wù)中實(shí)時(shí)產(chǎn)生的數(shù)字?jǐn)?shù)據(jù)。
國(guó)家信息化專(zhuān)家咨詢委員會(huì)常務(wù)副主任、中國(guó)工程院院士鄔賀銓在同一論壇上介紹,麥肯錫認(rèn)為,全世界現(xiàn)在企業(yè)數(shù)據(jù)在硬盤(pán)上的存儲(chǔ)量是7EB,谷歌現(xiàn)在能夠處理的網(wǎng)頁(yè)數(shù)量在千億以上,每個(gè)月處理的數(shù)據(jù)總量超過(guò)400PB。中國(guó)淘寶每天的交易量超過(guò)數(shù)千萬(wàn)筆,百度目前的數(shù)據(jù)總量接近1000PB,中國(guó)聯(lián)通用戶的上網(wǎng)記錄每秒鐘有3萬(wàn)條,一年可達(dá)到1萬(wàn)億條。
IBM提供的資料顯示,據(jù)估計(jì),過(guò)去兩年間產(chǎn)生的數(shù)據(jù)占目前全球數(shù)據(jù)的90%,新的數(shù)據(jù)正在以每天2.5EB的量級(jí)高速增長(zhǎng)。從數(shù)據(jù)中找到金子
在“2012西咸新區(qū)大數(shù)據(jù)高峰論壇”上,工信部軟件服務(wù)業(yè)司司長(zhǎng)陳偉表示,大數(shù)據(jù)并非新近才突然冒出來(lái)的,大規(guī)模數(shù)據(jù)的分析處理與應(yīng)用也不是一個(gè)新問(wèn)題,只是近年來(lái)數(shù)據(jù)增長(zhǎng)的速度越來(lái)越快,各行業(yè)積累的數(shù)據(jù)量越來(lái)越巨大。“大數(shù)據(jù)中大量有用和可能沒(méi)用的數(shù)據(jù)并存,所以有的專(zhuān)家形象地描述大數(shù)據(jù)遍地是金子又遍地是沙子。”陳偉進(jìn)一步道,“大數(shù)據(jù)的目的就是要從龐大的數(shù)據(jù)集合中尋找到有價(jià)值的數(shù)據(jù)和知識(shí),這種分析和挖掘?qū)楦餍袠I(yè)提供真正的智慧。從這個(gè)意義上說(shuō),可以理解大數(shù)據(jù)是云計(jì)算、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、智慧城市等新技術(shù)、新模式發(fā)展的必然產(chǎn)物。”
鄔賀銓院士說(shuō),據(jù)麥肯錫統(tǒng)計(jì),如果美國(guó)對(duì)保健行業(yè)的數(shù)據(jù)進(jìn)行收集分析,整個(gè)行業(yè)收入一年可增加3000億美元;歐盟統(tǒng)計(jì)過(guò),如果對(duì)管理數(shù)據(jù)進(jìn)行挖掘,一年可以增加2500億歐元的價(jià)值;零售商可以利用大數(shù)據(jù)增加60%的收入。而世界經(jīng)濟(jì)論壇稱(chēng),大數(shù)據(jù)是新財(cái)富,價(jià)值堪比石油。據(jù)預(yù)測(cè),大數(shù)據(jù)會(huì)為全球帶來(lái)440萬(wàn)個(gè)IT崗位,其中190萬(wàn)個(gè)在美國(guó),另外每一個(gè)大數(shù)據(jù)的崗位會(huì)催生3個(gè)非IT就業(yè)崗位,也就是說(shuō)未來(lái)會(huì)推動(dòng)美國(guó)產(chǎn)生600萬(wàn)個(gè)就業(yè)崗位。