一個數(shù)據(jù)爆炸性增長的大數(shù)據(jù)時代正撲面而來。
從人類文明開始到2003年,人類共創(chuàng)造了5兆億字節(jié)信息。如今,這樣的數(shù)據(jù)量兩天就能被創(chuàng)造出來,而且速度仍在加快。數(shù)據(jù)顯示,2011年全球創(chuàng)建和復制數(shù)據(jù)總量達到1.8ZB(1ZB等于10的21次方比特).
迅速膨脹的數(shù)據(jù)將人類帶進了一個嶄新的大數(shù)據(jù)時代。在這個時代,數(shù)據(jù)被認為是21世紀最重要和最關鍵的資產。2012年,美國政府撥款2億美元啟動“大數(shù)據(jù)研究和發(fā)展倡議”計劃。這是繼1993年美國宣布“信息高速公路”計劃后的又一次重大科技戰(zhàn)略部署。美國政府將大數(shù)據(jù)視為“未來的新石油”并將對大數(shù)據(jù)的研究上升為國家意志。
如今,身處大數(shù)據(jù)時代,我國該如何占有和使用這些資產,并從這些資產中掘金呢?
1月19日,在由中國科學院虛擬經濟與數(shù)據(jù)科學研究中心主辦的“大數(shù)據(jù)背景下的計算機和經濟發(fā)展高層論壇”上,在大數(shù)據(jù)研究領域有著較高造詣的多位院士、學者和有著大數(shù)據(jù)應用實踐經驗的企業(yè)家們縱論大數(shù)據(jù)應用價值,并針對大數(shù)據(jù)在我國發(fā)展應用中遇到的挑戰(zhàn)提出了政策建議。
大數(shù)據(jù)價值幾何?
“無論是國家的整體設計,還是虛擬經濟、虛擬商務的發(fā)展和優(yōu)化,都離不開大量的數(shù)據(jù)分析作支撐。”第九屆、第十屆全國人大常委會副委員長、中國科學院虛擬經濟與數(shù)據(jù)科學研究中心主任成思危在論壇致辭中表示。他希望,將大數(shù)據(jù)科學、技術、工程與國家當前迫切需要解決的問題結合起來,從而通過大數(shù)據(jù)的應用促進社會經濟發(fā)展。
中國工程院院士、中國科學院大學計算機與控制學院院長李國杰將大數(shù)據(jù)比作與自然資源、人力資源一樣重要的戰(zhàn)略資源。他認為,大數(shù)據(jù)是一個國家數(shù)字主權的體現(xiàn)。“大數(shù)據(jù)時代,國家層面的競爭力將部分體現(xiàn)為一國擁有大數(shù)據(jù)的規(guī)模、活性以及對數(shù)據(jù)的解釋、運用能力。一個國家在網絡空間的數(shù)據(jù)主權將是繼海、陸、空、天之后另一個大國博弈的空間。” 李國杰說。
中國科學院虛擬經濟與數(shù)據(jù)科學研究中心常務副主任石勇教授認為,大數(shù)據(jù)的應用在于分析和創(chuàng)造價值。在此前提下,政府部門可以利用大數(shù)據(jù)的挖掘結果,用科學方法制定政策;企業(yè)可以利用大數(shù)據(jù)使利潤最大化;學者則可以利用大數(shù)據(jù)尋找科學規(guī)律,支持社會經濟發(fā)展。
針對大數(shù)據(jù)的價值,中國工程院院士、西安交通大學教授汪應洛從大數(shù)據(jù)產業(yè)的角度進行分析。他將大數(shù)據(jù)產業(yè)定義為泛指一切與大數(shù)據(jù)組織與管理、分析與發(fā)現(xiàn)、應用與服務相關的所有活動的集合。他認為,大數(shù)據(jù)產業(yè)能改善已有組織績效,包括促進構建高效型政府、提供經濟發(fā)展新動力、提高文化教育質量;大數(shù)據(jù)產業(yè)還可促進相關產業(yè)的發(fā)展與革新,比如促進軟件和硬件的革新、推動科學技術創(chuàng)新、催生數(shù)據(jù)服務性企業(yè);此外,大數(shù)據(jù)產業(yè)在社會管理、智慧城市、金融服務、醫(yī)療衛(wèi)生、生產制造、商業(yè)零售、個人數(shù)字生活等方面都有巨大價值。
來自麥肯錫2012年大數(shù)據(jù)報告中的一組數(shù)據(jù)也驗證了汪應洛的觀點。數(shù)據(jù)顯示,大數(shù)據(jù)產業(yè)為美國醫(yī)療系統(tǒng)帶來每年3000億美元的收益;為歐洲公共管理部門帶來2500億歐元的收益;為零售業(yè)增加60%的凈利潤;為制造業(yè)減少50%的產品研發(fā)等成本;個人地理位置信息的利用,為服務商帶來超過1000億美元的收益,為用戶帶來超過7000億美元的價值。
大數(shù)據(jù)挑戰(zhàn)重重
大數(shù)據(jù)擁有巨大的應用價值,但占有并用好這些重要資產也將面臨諸多方面的挑戰(zhàn)和困難。
“戰(zhàn)略觀念上的缺失、政府機構協(xié)調困難、企業(yè)對數(shù)據(jù)共享的認識不足及投入不夠、科學家對大數(shù)據(jù)的渴望無法滿足等都是大數(shù)據(jù)在我國發(fā)展應用中不得不面對的困難。”石勇說。
李國杰則提出,處理大數(shù)據(jù)的7種技術挑戰(zhàn),主要有大數(shù)據(jù)的去冗降噪技術;大數(shù)據(jù)的新型表示方法;高效率低成本的大數(shù)據(jù)存儲;大數(shù)據(jù)的有效融合;非結構化和半結構化數(shù)據(jù)的高效處理;適合不同行業(yè)的大數(shù)據(jù)挖掘分析工具和開發(fā)環(huán)境;大幅度降低數(shù)據(jù)處理、存儲和通信能耗的新技術等。
汪應洛認為,大數(shù)據(jù)產業(yè)在諸多方面面臨巨大挑戰(zhàn),如政府的政策與法規(guī)、技術研發(fā)、管理模式、人才培養(yǎng)等。他認為,在大數(shù)據(jù)產業(yè)發(fā)展中,數(shù)據(jù)質量也是一大障礙,不容忽視。“數(shù)據(jù)質量是大數(shù)據(jù)產業(yè)這座大廈的基礎。如果數(shù)據(jù)質量不高,基礎不牢靠,大數(shù)據(jù)產業(yè)就可能岌岌可危,甚至根本無從發(fā)展。”他說。