中國IDC圈4月29日報道,互聯(lián)網(wǎng)的發(fā)展使得大數(shù)據(jù)引起人們廣泛關(guān)注?,F(xiàn)如今大數(shù)據(jù)技術(shù)早已滲透到金融、通訊等行業(yè)以及生物學(xué)、物理學(xué)等領(lǐng)域。大數(shù)據(jù)在容量、多樣性和高增速方面的爆炸式增長全面考驗(yàn)著現(xiàn)代企業(yè)的數(shù)據(jù)處理和分析能力,與此同時也為各個行業(yè)帶來了準(zhǔn)確洞察市場行為的機(jī)會。迄今為止大數(shù)據(jù)技術(shù)與產(chǎn)品有哪些創(chuàng)新,工業(yè)大數(shù)據(jù)應(yīng)用面臨哪些挑戰(zhàn),金融行業(yè)大數(shù)據(jù)應(yīng)用現(xiàn)狀如何等。圍繞這一系列問題,4月27日至28日,由工業(yè)和信息化部指導(dǎo)、中國信息通信研究院主辦的"2016大數(shù)據(jù)產(chǎn)業(yè)峰會"在北京國際會議中心盛大召開。28日上午,在數(shù)據(jù)中心聯(lián)盟、中國智慧城市產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟協(xié)辦的地方大數(shù)據(jù)產(chǎn)業(yè)發(fā)展論壇中北京大學(xué)軟件所副所長黃罡先生做了精彩的演講。
北京大學(xué)軟件所副所長黃罡
以下為黃罡演講實(shí)錄:
黃罡:非常高興來這個論壇和大家分享我們北京大學(xué)在政府?dāng)?shù)據(jù)開放方面的一些工作。其實(shí)就大數(shù)據(jù)來說,我個人認(rèn)為互聯(lián)網(wǎng),BAT搞大數(shù)據(jù),實(shí)際上是垃圾數(shù)據(jù)里面去挖金子。但是,其實(shí)在中國,因?yàn)槲覀冞^去十年以部委為中心進(jìn)行了政府信息化建設(shè)的提升,我們的政府信息過程政府?dāng)?shù)據(jù)實(shí)際上本身就是金子。所以,只不過這些金子藏在一個個以部門為中心的信息孤島里面。所以,我個人認(rèn)為政府做大數(shù)據(jù)考慮的不是像BAT這種互聯(lián)網(wǎng)大數(shù)據(jù),更多考慮怎么能夠盡快的把這些已經(jīng)是金礦的數(shù)據(jù)拿出來,怎么讓這些金礦變成更大的輔助我們國家去做治理。
信息孤島這個詞大家聽過了,去年國務(wù)院發(fā)布的《大數(shù)據(jù)行動發(fā)展綱要》,當(dāng)然是舉國歡慶,包括廠商,包括地方政府。但是,我們自己看這個綱要里面實(shí)際上藏著一些數(shù)字。我們通過對神州數(shù)碼、中軟、東軟等這些有資質(zhì)的企業(yè)進(jìn)行調(diào)研,基本上一個典型的政府信息系統(tǒng),如果是一個孤島式的,它的開放成本一般是1000人/天。這意味著我們的政府信息系統(tǒng)現(xiàn)在至少十萬個以上,這樣開放下來,至少達(dá)到1億人/天。政府給了時間點(diǎn),在2020年對外開放。我們以2018年為時間點(diǎn),短短兩年半的時間,如果要利用1億人/天實(shí)現(xiàn)政府?dāng)?shù)據(jù)開放,需要的中高端軟件工程師20萬。我們中國現(xiàn)在正兒八經(jīng)的軟件工程師也就是幾十萬。所以,拋開互聯(lián)網(wǎng)、產(chǎn)業(yè)、物聯(lián)網(wǎng),光政府?dāng)?shù)據(jù)開放現(xiàn)在就需要20萬個軟件工程師給我們干活。這20萬個軟件工程師光工資就得一千億。所以,在這個里面看上去,這個數(shù)字首先大家覺得比較聳人聽聞,但是實(shí)際上在政府行動綱要里面,部委內(nèi)部是算過賬的,最高的一筆帳達(dá)到3000億。所以,這個數(shù)字實(shí)際上是比較準(zhǔn)確的。
但是,我們在歡慶的同時,我們具體看一下,這到底是一千個億的市場機(jī)遇還是一個代價高達(dá)一千億的政府的痛點(diǎn)?當(dāng)我們真正要去把一個政府的信息化系統(tǒng)打開的時候會碰見什么問題?首先,很容易算出來顯性成本,如果直接把后臺數(shù)據(jù)庫打開風(fēng)險太大,而且對于政府來說,那就意味著所有的數(shù)據(jù)不加保留的暴露在所有其他人的面前,我為什么要這樣?第二,即便我們做好了這兩個,這時候原系統(tǒng)的開發(fā)商可能不在了,即這樣可能給你開發(fā)的這個系統(tǒng)團(tuán)隊也都早就沒在了,這意味著要花大量的時間把原來的系統(tǒng)重新補(bǔ)一遍才能準(zhǔn)確無誤沒有風(fēng)險的把數(shù)據(jù)開放出來。第三,系統(tǒng)開發(fā)商的鎖定問題。所以,這些可以證明我們算出來的數(shù)據(jù)。
更關(guān)鍵的是我們現(xiàn)在的數(shù)據(jù),所謂政府很多的數(shù)據(jù)開放平臺,更多是說先把數(shù)據(jù)搞出來再說,怎么用,沒想出來,或者說畫幾個漂亮的數(shù)字。所以,如果想不清楚數(shù)據(jù)開放出來怎么用,其實(shí)它的阻力就很明顯,怎么去協(xié)調(diào)這些數(shù)據(jù)利益的相關(guān)者,怎么協(xié)調(diào)原來信息系統(tǒng)的相關(guān)者。因?yàn)槲腋局v不明白,把數(shù)據(jù)開放出來到底干什么?所以,整個的溝通成本,基本上形成了一個系統(tǒng)。真正到了這邊的真正開工,基本上要花半年到一年的時間進(jìn)行溝通、交流、論證。所以,這么一算下來,其實(shí)真的用傳統(tǒng)方式去實(shí)現(xiàn)大數(shù)據(jù)行動綱要的三個時間節(jié)點(diǎn)我個人是持比較悲觀的態(tài)度。