第二是安全,在安全有五個(gè)核心,隔離脫敏,標(biāo)識(shí)授權(quán)審計(jì),隔離,在隔離上想做好安全運(yùn)營(yíng),在技術(shù)上需要更多的探索和突破,第一,比如我們數(shù)據(jù)文件,兩邊的數(shù)據(jù)文件,如果要來給用戶開放,第一,我能不能做到分段的抽取,第二,給這個(gè)用戶提供三個(gè)字段那個(gè)提供五個(gè)字段,這樣開放做融合訓(xùn)練,他能不能把用戶的空間隔離起來,第二用戶大數(shù)據(jù)的組件,他在生態(tài)里的弱項(xiàng)是多租戶隔離,你們有這種技術(shù)能力實(shí)現(xiàn)這種隔離機(jī)制,這是我們?nèi)ツ暾麄€(gè)研發(fā)工作的重點(diǎn),我們更多時(shí)候是通過已有的開源軟件的改造,能夠?qū)崿F(xiàn)一種多租戶的隔離。
第三,數(shù)據(jù)的脫敏,整個(gè)數(shù)據(jù)從采集和生產(chǎn)環(huán)節(jié)出現(xiàn)之后,會(huì)在清洗和轉(zhuǎn)換過程中把一些關(guān)鍵字段用戶的信息姓名家庭住址等等包括終端通話記錄信息,把這些脫敏做了,保證流入到生產(chǎn)環(huán)境的數(shù)據(jù)安全性要有保證,通過標(biāo)識(shí)把脫敏的數(shù)據(jù),假如脫敏之后找不到人了這個(gè)數(shù)據(jù)就沒用了,我們通過標(biāo)識(shí)把脫敏的數(shù)據(jù)彼此之間重新關(guān)聯(lián)起來,產(chǎn)生邏輯關(guān)聯(lián),在數(shù)據(jù)使用過程中有授權(quán),你使用哪些數(shù)據(jù)能做控制,要有審計(jì)的痕跡,這樣有第三方審計(jì)機(jī)構(gòu)做審計(jì)才能滿足要求,整個(gè)安全合規(guī)一定要把隔離脫敏標(biāo)識(shí)授權(quán)審計(jì)五個(gè)環(huán)節(jié)做好之后,數(shù)據(jù)的開放才能落到實(shí)處才敢開放出來。
數(shù)據(jù)假如能開放出來之后有幾個(gè)開放的形式,我們現(xiàn)在碰到的開放有三類,第一類,我們有一些查詢,這些是需求最大的,他更多是以標(biāo)簽接口的方式提供,這種對(duì)應(yīng)用的設(shè)備性最強(qiáng),第二是有些科研院所,他們可能是基于希望把數(shù)據(jù)做關(guān)系化處理,比如開環(huán)表的方式。整個(gè)從服務(wù)模式上,接口方式對(duì)接所有的APP、應(yīng)用和運(yùn)營(yíng)系統(tǒng)。再往下是有關(guān)系化的環(huán)表做訓(xùn)練,這個(gè)在技術(shù)準(zhǔn)備上做很多儲(chǔ)備和工作。這是我們?nèi)ツ暝诩尤隑GU聯(lián)盟之后有一個(gè)天翼大數(shù)據(jù)生長(zhǎng)計(jì)劃,希望跟大家合作挖掘這個(gè)數(shù)據(jù)的價(jià)值,在整個(gè)接口體系開放出來之后,整個(gè)調(diào)度量有一個(gè)比較明顯的上升,這是到去年11月的數(shù)據(jù),到今年為止整個(gè)對(duì)外開放服務(wù)平臺(tái),已經(jīng)基本上到四百到五百億次每個(gè)月,感覺到確實(shí)讓這個(gè)數(shù)據(jù)為社會(huì)做一些價(jià)值。
最后是數(shù)據(jù)開放的運(yùn)營(yíng)體系,這個(gè)圖是我們內(nèi)部從數(shù)據(jù)產(chǎn)生到開放出來的發(fā)布,他中間要有一個(gè)27步的過程,在這個(gè)數(shù)據(jù)開放過程中,隨著工作加深更多要減少人的參與,只有人參與的少過程是固化的,這樣一個(gè)流程才是安全可控質(zhì)量穩(wěn)定,最終這個(gè)服務(wù)才能被這個(gè)社會(huì)所接受。數(shù)據(jù)開放整個(gè)運(yùn)營(yíng)體系,整個(gè)過程中的清洗集合,這樣開放的數(shù)據(jù)才是有價(jià)值有質(zhì)量的。