中國(guó)IDC圈4月27日?qǐng)?bào)道,互聯(lián)網(wǎng)的發(fā)展使得大數(shù)據(jù)引起人們廣泛關(guān)注?,F(xiàn)如今大數(shù)據(jù)技術(shù)早已滲透到金融、通訊等行業(yè)以及生物學(xué)、物理學(xué)等領(lǐng)域。大數(shù)據(jù)在容量、多樣性和高增速方面的爆炸式增長(zhǎng)全面考驗(yàn)著現(xiàn)代企業(yè)的數(shù)據(jù)處理和分析能力,與此同時(shí)也為各個(gè)行業(yè)帶來(lái)了準(zhǔn)確洞察市場(chǎng)行為的機(jī)會(huì)。迄今為止大數(shù)據(jù)技術(shù)與產(chǎn)品有哪些創(chuàng)新,工業(yè)大數(shù)據(jù)應(yīng)用面臨哪些挑戰(zhàn),金融行業(yè)大數(shù)據(jù)應(yīng)用現(xiàn)狀如何等。圍繞這一系列問(wèn)題,4月27日至28日,由工業(yè)和信息化部指導(dǎo)、中國(guó)信息通信研究院主辦的"2016大數(shù)據(jù)產(chǎn)業(yè)峰會(huì)"在北京國(guó)際會(huì)議中心盛大召開(kāi)。在27日下午的大數(shù)據(jù)技術(shù)與產(chǎn)品創(chuàng)新分論壇上北京因特睿公司的CTO張穎給我們帶來(lái)了主題為《燕云DaaS-大數(shù)據(jù)服務(wù)平臺(tái)-打破信息孤島、創(chuàng)新數(shù)據(jù)價(jià)值》的精彩演講。
北京因特睿公司的CTO張穎
以下是張穎演講實(shí)錄:
張穎:今天很高興有這個(gè)機(jī)會(huì)向大家介紹一下北京大學(xué)以及北京大學(xué)的產(chǎn)學(xué)用基地,北京因特睿軟件公司在我們大數(shù)據(jù)方面的工作。
我們認(rèn)為,信息化建設(shè)已經(jīng)經(jīng)歷了兩次浪潮,我們把它稱之為數(shù)字化階段和網(wǎng)絡(luò)化階段。在數(shù)字化階段的時(shí)候,我們大多數(shù)人用計(jì)算機(jī)主要是處理一些個(gè)人的東西,比如說(shuō)之前的WPS,寫(xiě)一些資料,通過(guò)打印共享給各個(gè)部門(mén)。接下來(lái)第二個(gè)階段我們稱之為網(wǎng)絡(luò)化階段,這個(gè)階段大量的可以在部門(mén)內(nèi)部、行業(yè)內(nèi)部共享的信息系統(tǒng),像雨后春筍這樣快速的出來(lái)。經(jīng)歷了這兩個(gè)階段過(guò)后,接下來(lái)我們看到,就像別人在寫(xiě)有第三次浪潮一樣,我們認(rèn)為信息化建設(shè)也會(huì)經(jīng)歷第三次浪潮。我們總結(jié)第三次浪潮的特征是數(shù)據(jù)開(kāi)放、共享、融合。
為什么要這么講?首先從實(shí)際需要來(lái)看,比如說(shuō)現(xiàn)在的不動(dòng)產(chǎn)登記需要去整合土地、林地、房產(chǎn)等格式各樣的數(shù)據(jù),這就是一個(gè)實(shí)際的需要。我們?cè)賮?lái)看國(guó)家政策,從國(guó)務(wù)院發(fā)布促進(jìn)大數(shù)據(jù)行動(dòng)綱要,2017年的時(shí)候要實(shí)現(xiàn)數(shù)據(jù)開(kāi)放共享目錄,2018年的時(shí)候要實(shí)現(xiàn)內(nèi)部共享,2020年的時(shí)候要實(shí)現(xiàn)可以向公眾開(kāi)放的數(shù)據(jù)開(kāi)放給公眾。2015年習(xí)主席說(shuō)要加快城市建設(shè),打破數(shù)據(jù)孤島和分割。再到今年的政府工作報(bào)告,要實(shí)現(xiàn)部門(mén)間內(nèi)部的數(shù)據(jù)共享,讓企業(yè)少跑腿,好辦事,這都是從國(guó)家政策來(lái)看,從實(shí)際需求來(lái)看,就是要實(shí)現(xiàn)數(shù)據(jù)的開(kāi)放、共享、融合。
在這個(gè)過(guò)程當(dāng)中有一個(gè)很關(guān)鍵的問(wèn)題,我們認(rèn)為有一個(gè)巨大的挑戰(zhàn)就是信息孤島的挑戰(zhàn)。我們來(lái)看一下原來(lái)信息系統(tǒng)的建設(shè),經(jīng)常是為了某一個(gè)業(yè)務(wù)我們就上一套系統(tǒng),或者是某一個(gè)領(lǐng)導(dǎo)新官上任我們就上一套系統(tǒng)。導(dǎo)致我所有的系統(tǒng)之間邊界是非常清晰的,但是這種清晰的邊界導(dǎo)致我們的數(shù)據(jù)孤島的形成,每個(gè)系統(tǒng)都有它自己整個(gè)的一套配置。這些系統(tǒng)我們稱之為是孤島系統(tǒng),這些孤島系統(tǒng)有哪些呢?大多數(shù)的政企內(nèi)部業(yè)務(wù)系統(tǒng),大量的App系統(tǒng),10萬(wàn)計(jì)的PC應(yīng)用,這些都是我們稱之為的數(shù)據(jù)孤島。為什么它是數(shù)據(jù)孤島?我們看這些系統(tǒng)不遵循標(biāo)準(zhǔn)的協(xié)議,很難類似于被爬蟲(chóng)去爬取,大量的這些信息系統(tǒng)占到整個(gè)數(shù)據(jù)量的96%。
我們來(lái)舉兩個(gè)例子看一下,這是某運(yùn)營(yíng)商的一個(gè)人資系統(tǒng),我這個(gè)系統(tǒng)是由不同的領(lǐng)導(dǎo)、不同的部門(mén)分不同的時(shí)間開(kāi)發(fā)的。每當(dāng)要月末發(fā)放工資的時(shí)候,就要從考勤系統(tǒng)里面去拿到這個(gè)基地每天人們進(jìn)出這個(gè)園區(qū)的時(shí)間,統(tǒng)計(jì)他的考勤信息。然后導(dǎo)出來(lái),放到Excle統(tǒng)計(jì)過(guò)后,再填到相應(yīng)的工資發(fā)放系統(tǒng)去發(fā)放,這是在同一個(gè)體系之內(nèi),不同的信息系統(tǒng)之間需要交換共享數(shù)據(jù),但是卻難以交換共享。再講第二個(gè)例子,這是某個(gè)市的公檢法司希望打造的一個(gè)共享平臺(tái),現(xiàn)在是兩條腿辦事,文本送去,還要把相應(yīng)的公安的信息系統(tǒng)從公安系統(tǒng)里面導(dǎo)出來(lái)刻成光盤(pán)送到檢察院,檢察院從光盤(pán)里面把數(shù)據(jù)讀出來(lái),再進(jìn)行處理之后再刻成光盤(pán),再傳遞到其他的單位。我們也看到,在不同的體系之內(nèi),也需要進(jìn)行相應(yīng)的數(shù)據(jù)共享和融合,也需要把這個(gè)信息孤島打破。
要打破信息孤島,就要有一個(gè)顛覆式的新技術(shù),我們看一下存在信息孤島的本質(zhì)是什么。我們看很多的信息系統(tǒng)開(kāi)發(fā)團(tuán)隊(duì)不在了,文檔源代碼缺失,還有一些金蝶、用友這樣的商業(yè)系統(tǒng),我們要去理解它,要從這些系統(tǒng)里面拿到相應(yīng)的數(shù)據(jù),這個(gè)理解、學(xué)習(xí)和重構(gòu)系統(tǒng)的工作量是非常巨大的。有的人說(shuō)我可以直接拿到數(shù)據(jù)庫(kù),但是不是所有的信息系統(tǒng)數(shù)據(jù)都存在數(shù)據(jù)庫(kù)里面,我們要把數(shù)據(jù)庫(kù)開(kāi)放給對(duì)方,實(shí)際上有改變數(shù)據(jù)的風(fēng)險(xiǎn)。其實(shí)對(duì)于很多不同的廠商、不同的部門(mén)開(kāi)發(fā)的這些信息系統(tǒng),這些孤島系統(tǒng),你很難拿到它的數(shù)據(jù)庫(kù)。并且如果你要拿到它的數(shù)據(jù)庫(kù),必須要確保作為甲方把數(shù)據(jù)讀寫(xiě)出來(lái),還要確保讀寫(xiě)權(quán)限和時(shí)效性,這個(gè)帶來(lái)的風(fēng)險(xiǎn)是非常大的。其實(shí)最主要的就是不愿意,要去協(xié)調(diào)相關(guān)的利益相關(guān)者去開(kāi)放和共享他的數(shù)據(jù),其實(shí)這個(gè)時(shí)間成本是非常大的。很多的集成商,很多的公司發(fā)現(xiàn)我的一個(gè)項(xiàng)目要做這樣的事,寧愿不接這樣的項(xiàng)目,也不愿意去趟這些渾水。正是因?yàn)椴粫?huì)、不敢、不愿,導(dǎo)致我們整個(gè)信息系統(tǒng)圍繞著數(shù)據(jù)的生命周期來(lái)看,90%的精力都花在了如何開(kāi)采、管理數(shù)據(jù)上面,只有花了不到10%的精力在整個(gè)應(yīng)用處理上面。因此,圍繞大數(shù)據(jù)來(lái)講,我們本身不是說(shuō)數(shù)據(jù)多了,而是說(shuō)大量的企業(yè)是沒(méi)有數(shù)據(jù),是無(wú)源之水、無(wú)本之木。