2014中關(guān)村大數(shù)據(jù)日于2014年12月11日在中關(guān)村舉辦,大會以大會以“聚合數(shù)據(jù)資產(chǎn),推動產(chǎn)業(yè)創(chuàng)新”為主題,探討數(shù)據(jù)資產(chǎn)管理和變現(xiàn)、大數(shù)據(jù)深度技術(shù)以及行業(yè)大數(shù)據(jù)應(yīng)用創(chuàng)新和生態(tài)系統(tǒng)建設(shè)等等關(guān)鍵問題。大會還承載從政亞信府主管部門到各行各業(yè)的需求和實踐中的疑問,探討包括政府、金融、運營商等部門是如何通過數(shù)據(jù)資產(chǎn)管理和運營,實現(xiàn)轉(zhuǎn)型發(fā)展和產(chǎn)業(yè)創(chuàng)新的路徑。
在下午的政府@Big Data論壇中,科技部科技費監(jiān)管中心副主任房漢廷帶來《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展預測與政策取向分析》。他認為未來誰擁有了數(shù)據(jù),誰擁有了數(shù)據(jù)的發(fā)掘能力,誰會使用數(shù)據(jù),誰就會在競爭前就可能勝出,而且以后,不是在競爭當中,競爭的結(jié)果是由競爭前的要素決定的,而這個要素的核心就是數(shù)據(jù)。
房漢廷:中國有一部分人是1960年代出生的,他們都活了一千年,一千年之前的狀態(tài)和今天的狀態(tài)都在這三十多年完成,在這個過程當中,我們今天不知不覺的就走進了大數(shù)據(jù)的時代,研究這樣一個話題,研究這樣一個產(chǎn)業(yè),對于我們來講,也都是一個新事物。我今天給大家做一個相對的梳理的一部分內(nèi)容,就是大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展趨勢和政策取向,而這些大數(shù)據(jù)本身是不是一個產(chǎn)業(yè),大數(shù)據(jù)本身到底是什么東西,其實都是在待定當中,我們比較確切的知道,大數(shù)據(jù)是人產(chǎn)生的,是物產(chǎn)生的,是機器產(chǎn)生的,這三個方面結(jié)合到一起,才產(chǎn)生了數(shù)據(jù)。
我們都知道,人的活動如果沒有機器沒有載體,那就是我們下面的嗡嗡議論,不會成為數(shù)據(jù),物的變化沒有載體的表達,也不能成為數(shù)據(jù),當數(shù)據(jù)積累到一定的程度就會出現(xiàn)很多新業(yè)態(tài)新的形態(tài),它是這些東西的高度融合,深度聚合,產(chǎn)生的一個爆炸式的增長以及復雜性的變化這么一個過程。如果我們用一句話來衡量,就是大數(shù)據(jù)實際是增加的全社會的社會資本,作為一個社會資本每個人都在創(chuàng)造它,每個人也都在享用它,每個人也都在受它制約,但是如何從一個社會資本提升為一種產(chǎn)業(yè)資本,并從過程當中進行開發(fā)和利用,這實際上是我們今天所面臨的最大的課題,大數(shù)據(jù)很多人已經(jīng)概括了,實際上有四個特征。
第一個是規(guī)模超大,超大到什么程度呢?叫做沒法想象,我們可以來理解一下,2009年的時候,是0.8個ZB,12年是到2.72,根據(jù)預計2020年將達到35.2,每兩年大概能增加一倍,這樣的一個過程,使我們用原來的想象數(shù)據(jù)的方式無法想象,就像我們無法想象時間有多長,無法想象空間有多大,未來人類長期的這個器官也同樣會走到天文數(shù)字,其實,我們用ZB的方法也是類似于公年的工作計劃。
第二個是數(shù)據(jù)流速超快,目前數(shù)據(jù)的流動速度快到幾乎用傳統(tǒng)方法難以處理,我們?nèi)绾喂芾頂?shù)據(jù)如何捕捉數(shù)據(jù),特別是捕捉有用的數(shù)據(jù),整個互聯(lián)網(wǎng)就像人一個大腦一樣,它在不斷的計劃,我們每個人都在給它提供血液提供思想火花,所以未來的互聯(lián)網(wǎng)這個人類的供應(yīng)大腦,將擁有大數(shù)據(jù)不斷的進化,進化到一定高級的水平,我相信每個人見到互聯(lián)網(wǎng)都是恐懼的,都是害怕的,其實我現(xiàn)在已經(jīng)很害怕這個互聯(lián)網(wǎng),因為我后面要講到,你每個人都是裸游,只是你覺得海水沒有退潮。
第三個就是內(nèi)容超雜,我們可以看到,過去我們在治理數(shù)據(jù)的時候,通常來講,就像剛才于斌部長一樣,他給我們編好PPT,做好圖形,現(xiàn)在傳輸?shù)臄?shù)據(jù)五花八門,形式多樣,結(jié)構(gòu)化的非結(jié)構(gòu)化的數(shù)據(jù)比比皆是,這些東西怎么樣來利用和來處理,實際上就非常復雜,我們可以看一下,07年的時候,全球有多少裝設(shè)備聯(lián)網(wǎng)是5億個,人均是0.1個,到2013全球有500億個,人均就擁有70個,下一步來講,整個可穿戴設(shè)備又到了每個人從耳釘?shù)蕉h(huán),從帽子到衣服等等都是的話,你想每天產(chǎn)生多少數(shù)據(jù),一個人等等這樣的數(shù)據(jù)都可能會傳到互聯(lián)網(wǎng)上去,形成整個大數(shù)據(jù),五花八門。在這樣的一個雜亂無章的一個數(shù)據(jù)體系當中,如何來找到你需要的或者說是別人需要的數(shù)據(jù),這就是未來也是一個產(chǎn)業(yè)的節(jié)點。
第四點就是價值密度超低。過去我們想要了解一個人非常簡單,到他單位看他檔案,他什么時候入的團,什么時候入的黨,到什么時候提的干,現(xiàn)在大數(shù)據(jù)里面都有記錄了,你是轉(zhuǎn)帳你是匯款,還是你的朋友圈一關(guān)聯(lián)到你的資金流向,為什么跟這幾個人的資金流向這么密集呢?當然,這就是現(xiàn)在他有一個數(shù)據(jù)擴大,如果我的朋友棚無限大,涉及十億的朋友圈,那要查找很麻煩,可能他一段的記錄,你需要查找海量的數(shù)據(jù)才能發(fā)現(xiàn),整個的過程是不斷的海外膨脹,但是,宇宙的密度基本上還是一個均質(zhì)的密度所以在大數(shù)據(jù)的情況下,價值密度超低,這個密度超低之后,就給那些提取價值的人帶來困擾。
以上我認為大數(shù)據(jù)四個特征,就是超大、超快、超雜、超低,這四個方面,當然大家可能還可以概括出很多來,反正大數(shù)據(jù)給我們無限的遐想。
第二個方面,我講一下大數(shù)據(jù)產(chǎn)業(yè)的一個初步的發(fā)展趨勢,因為對我來講,這也是新課題,并不是說有多少深的造詣和研究,對我們大多數(shù)人來講也是數(shù)據(jù)積累到一定程度之后,發(fā)現(xiàn)自己制造的那堆垃圾已經(jīng)可以制造更好的復合肥了,我們原來不知道每個人每天上廁所都能夠創(chuàng)造出化工廠這樣的作用,實際上大數(shù)據(jù)我們也是在這樣一個制造垃圾的過程當中創(chuàng)造了財富,我們從大數(shù)據(jù)來看研究來看,針對超大超快超雜超低這四個特點,實際上我們首先需要做的就是如何來提出新的技術(shù)和產(chǎn)品,來解決這四個問題,規(guī)模太大,就相當于你進了一個廣場,你不知道那個針落在哪里,如何把它找到,那個超快,你的眼睛還沒有眨一眨的時間,整個形象都變了,超雜,那就像一個萬花筒,密度超低,你想找的找不到,你不想找的,撲面而來。在這樣的一種情況下,就需要一些大數(shù)據(jù)的技術(shù)以及大數(shù)據(jù)的產(chǎn)品來做。
在這個方面,有時候我們中國總是后知后覺,美國2012年發(fā)布了《大數(shù)據(jù)研究與發(fā)展倡議》,這個東西可以媲美美國的信息高速公路,那個時候,我們中國才剛剛接觸互聯(lián)網(wǎng),還不知道互聯(lián)網(wǎng)將產(chǎn)生多大的影響,當美國又先知先覺做了大數(shù)據(jù)研發(fā)的時候,我們才感覺跟上,這就是一流國家跟二流國家的差距,一流國家總是建設(shè)于未來,二流國家總是跟進于先進者,大家剛才聽于部長講到的,按PPT來衡量中國已經(jīng)是世界第一大經(jīng)濟體,按14年的推測,我們大約比美國的經(jīng)濟體多2000億美元的一個水平,可是大家也知道,一個人體量大,不等于有力量,一個人如果是胖子,肥胖長大的,那么他可能還不如一個精干的瘦子。
所以說,中國在大數(shù)據(jù)方面,我想第一個一個產(chǎn)業(yè)的機會或者研發(fā)的機會就是在研發(fā)方面,這里面我認為有四高一深,實際上是我們在研發(fā)產(chǎn)業(yè)這個環(huán)節(jié)上應(yīng)該是有機會的,首先就是如何高效的存儲大數(shù)據(jù)帶來的就是海量的存儲,海量的存儲我們現(xiàn)在的存儲技術(shù),盡管我們有云,盡管我們有其他的大規(guī)模存儲介質(zhì),但是能不能把它進一步的壓縮,進一步的簡潔化,這方面給我們提出一些挑戰(zhàn)。
第二個方面就是高效提煉,你如何在一大堆龐雜的數(shù)據(jù)當中,提取出你的有效數(shù)據(jù),或者提取出你的用戶需要的有效數(shù)據(jù),第三個就是高效降噪,噪就是沒用的干擾的,這些你能不能去處,第四個是高效整合,最后是深度挖掘,如果是做好這四高一深,我想中國這方面是有機會站在這第一梯隊當中的。
第二個方面我們分析一下大數(shù)據(jù)的需求,大數(shù)據(jù)的需求從總的來講,不外乎是三大主體,一個是個人,一個是企業(yè),一個是政府,大數(shù)據(jù)的需求從個人角度來講,每一個人每天都在制造數(shù)據(jù),但是,他每天不一定知道自己在需求數(shù)據(jù),在這個過程當中,會有一些服務(wù)商一些廠商不斷的給你提供一些數(shù)據(jù)產(chǎn)品,其實他在慢慢的改變你的生活,你的需求是以服務(wù)商的形式來代理你來做。
第二個方面就是大數(shù)據(jù)企業(yè)的需求,我們都知道,在過去的企業(yè)決策的時候,外面提出了戰(zhàn)略規(guī)劃,實際上未來的決策是數(shù)據(jù)為王的一個時代,誰擁有了數(shù)據(jù),誰就可以在之前確定了很多的東西,大家說不能算命,但是有了大數(shù)據(jù),算命真的八九不離十,政府的決策也在大數(shù)據(jù)的平臺上,大數(shù)據(jù)會導致政府的治理,剛才我們說發(fā)展出版社要出現(xiàn)代國家治理,現(xiàn)代國家治理原來一個最缺陷的東西是因為缺乏信心,缺乏足夠的海量數(shù)據(jù),能把各方面的訴求民意集中起來,所以需要精英,精英就是接近圣人的一波人,有時候錯了,有時候?qū)α?,錯了,他們就跟他吃藥,對的時候就跟他吃糖,未來有了大數(shù)據(jù),政府的決策就可以形成一個社會化的決策,比如任何一個問題都可以提交到網(wǎng)絡(luò),也可以對網(wǎng)絡(luò)已經(jīng)形成的信息進行深度的發(fā)掘和分析,這樣的決策就是整個真正社會化決策,就可以取代精英決策,如果有一天,我們中國的政府的官員不需要精英,我們只需要輸入幾個關(guān)健詞,就把我們需要的東西基本找到,我們再發(fā)布幾個關(guān)鍵詞,讓社會群體來決策,最后,肯定找到的要比現(xiàn)在的精英治國,某種程度上更具有效益,也更符合大眾的訴求。
歸納一點,就是誰擁有了數(shù)據(jù),誰擁有了數(shù)據(jù)的發(fā)掘能力,誰會使用數(shù)據(jù),誰就會在競爭前就可能勝出,而且以后,不是在競爭當中,競爭的結(jié)果是由競爭前的要素決定的,而這個要素的核心就是數(shù)據(jù)。我們可以看到大數(shù)據(jù)這個里面會派生出很多的東西,將來一定會出現(xiàn)大量的數(shù)據(jù)公司,大量的數(shù)據(jù)服務(wù)商,因為數(shù)據(jù)將決定每個人,他從一種社會資本逐漸發(fā)掘出一種商業(yè)資本,他成為無論是企業(yè)的一個競爭資源還是政府治理社會的工具,還是居民決策個人行為的一個工具,未來都將產(chǎn)生海量的需求,在這個海量需求的過程當中,它將成為一個互聯(lián)網(wǎng)深度發(fā)展的新興產(chǎn)業(yè),在這個產(chǎn)業(yè)當中也有很多的公司或者其他的部門做過預測,僅美國來講,全球可能未來有440萬個IT新崗位和上千萬的非IT的崗位是由大數(shù)據(jù)來決定的。同時,還要派生出一大堆的懂這個大數(shù)據(jù)的管理崗位,當然這方面,中國才剛剛起步,中國是一個人力資源大國,將來也是一個智力大國,中國在這方面的產(chǎn)業(yè)以及這方面派生出的需求可能是許國的幾倍或者更多。尤其是在互聯(lián)網(wǎng)大數(shù)據(jù)時代,是一個真正能夠發(fā)揮一個人力優(yōu)勢的時代,而中國恰巧在這方面有所準備。到2030年左右中國受過高等教育的人達到2700萬,這里有一部分人或者大部分人掌握了大數(shù)據(jù)的工具,我想未來各個方面的效率的提升,我講是一個不可限量的事情。
最后,給大家做一點分析,從政策來講,這個行當剛剛興起,最近中國的科技體制正在發(fā)生著一個重大的變化,也就是過去的分散在四十多個部門的研發(fā)計劃,都歸并到一起,形成了五大類的研發(fā)計劃,面向基礎(chǔ)前沿的重大專項還有重點研發(fā)計劃,創(chuàng)新引導類計劃,還有人才基地,我想在這里面,如果說我們業(yè)內(nèi)還有一些咨詢機構(gòu)可以提出這樣一個專項就是研究大數(shù)據(jù),研究與開發(fā),目前國家的一個政策,是叫做貫穿式的研發(fā),從基礎(chǔ)一直到產(chǎn)業(yè)化,全鏈條的,缺什么補什么,而2015年正好是這一項體制改革的一個元年,如果我們現(xiàn)在能夠著手準備的話,我想借助政府的力量,也借助我們企業(yè)的力量,還有其他資本的力量,共同的來把這樣的一個事情做起來,這樣的話,那些所有智力與研發(fā),或者有志于研發(fā),從事這個行當?shù)娜司涂梢栽谶@個旗下集中起來,從我現(xiàn)在來看,還沒有哪個部門或者哪個牽頭的企業(yè)來提出這樣一個專項。
第二個方面就是從產(chǎn)業(yè)政策方面,應(yīng)該有一個規(guī)劃,大家都覺得一個民間的決定可能是最科學的,但是我們說當它發(fā)展到一定程度之后,有一個規(guī)劃就可以使我們的目標更加明晰,也能夠使我們的政策更加接近于實際,在這個地方可以考慮建立一個中國的大數(shù)據(jù)發(fā)展的計劃,至少要不輸于美國這樣的一個安排。
第三個方面就是投資政策,目前我特別希望如果能夠有這樣的一個投資基金專門來做我們這樣的一個大數(shù)據(jù),包括從它利用候補權(quán)益性資助以及引導資金或者其他的方式共同匯聚,因為沒有投資,一切東西都會成為空中樓閣,大數(shù)據(jù)也一定是一個先燒錢后產(chǎn)錢的一個產(chǎn)業(yè),而不可能是上來之后就是一片沃土。
第四個從人力資源政策,我們應(yīng)該說在IT行業(yè)我們有一定的準備,但是在這方面的人力或者是數(shù)學人才還是非常的缺乏。
最后開放國家的數(shù)據(jù)庫,這也是一個必要的條件,因為我們國家現(xiàn)在大量的來自政府的數(shù)據(jù)實際上是碎片化的,被分割在很多保密箱,而這些由公共財政支出以及公共活動形成的數(shù)據(jù)如果不開放,那我們在研究整個中國數(shù)據(jù)的時候,你就會感到有些東西是不正確的?;蛘呤遣荒芡耆磉_的,特別在中國,作為一個強大的一個主體,政府的數(shù)據(jù)如果不能夠進來的話,那么這個數(shù)據(jù)他就不服從分布。
最后,給大家說說,我們還不確定大數(shù)據(jù)社會,到底會引起怎樣的一個社會顛覆,但是以后引起的顛覆已經(jīng)足夠讓我們瞠目結(jié)舌了,只要有挖掘技術(shù)能力,凡是在網(wǎng)絡(luò)上留下足夠痕跡的行為都可以一一還原。大家可以看最近阿里巴巴把他最近十幾年的一個銷售數(shù)據(jù)進行還原,哪些人是該剁手的,哪些人該鼓勵的,一一清楚,如果還原一個人的行為也一樣,有一個人每天從家里出來到單位,總是曲曲折折走好多路,但是你最后發(fā)現(xiàn),他還是要回家還是要到單位的,那在這個單位干什么了,路上有幾個風景點或者還有幾個心愛的人他其實是在走這樣曲折的路,大數(shù)據(jù)既可以模糊個體,大數(shù)據(jù)技術(shù)又可以聚焦個體,大數(shù)據(jù)可以使信息雜亂,同時又可以使信息雜而不亂,大數(shù)據(jù)是可怕的,世界都在裸泳,只是海水還在漲潮,大數(shù)據(jù)是誘人的,有誰不想看到自己和別人的真容呢?這就是大數(shù)據(jù)帶給我們很多的遐想也有很多的恐懼,我相信在大數(shù)據(jù)這個時代,我們既是它的創(chuàng)造者也是它的分享者,同時我們還可能是它的受害人,謝謝大家。