9月1日,由工業(yè)和信息化部指導(dǎo),中國信息通信研究院、中國通信標準化協(xié)會主辦,數(shù)據(jù)中心聯(lián)盟承辦的“2016可信云大會”在京隆重召開。在9月2日下午的大數(shù)據(jù)分論壇上,新華三集團研發(fā)架構(gòu)研究部系統(tǒng)架構(gòu)師孫曉軍發(fā)表了題為《大數(shù)據(jù)安全防護》的演講。
新華三集團研發(fā)架構(gòu)研究部系統(tǒng)架構(gòu)師 孫曉軍
以下是演講實錄:
大數(shù)據(jù)安全有兩個方面的層面,第一,數(shù)據(jù)安全。第二是大數(shù)據(jù)安全。數(shù)據(jù)從產(chǎn)品到生出來到最后的消亡有三種狀態(tài),一個是在我們的存儲設(shè)備系待著。第二種狀態(tài)是在路上傳輸?shù)臓顟B(tài)。第三種是被使用。
大數(shù)據(jù)的安全防護,我認為前兩種狀態(tài),就是在存儲里息著還是在路上,它的保護的方式也比較傳統(tǒng)。今天我主要想從大數(shù)據(jù)使用的角度來分析數(shù)據(jù)安全的新的特點。大數(shù)據(jù)時代,由于低敏感度數(shù)據(jù)的整合,造成了一些現(xiàn)象,比如說在很早很早之前,這種方式就有了,在報紙上,說某將軍參加了某某活動,他從哪來的,或者是哪個上校的女兒跟誰結(jié)婚了。這些東西在報紙上就登了,這些敏感度是很低的。但是在30年代,英國的反戰(zhàn)人士從德國的報紙上整理以后,分析以后,得出了希特勒上臺以后整軍備戰(zhàn)的信息,他只用這樣的幾把剪刀就能把機密拿來,這是大數(shù)據(jù)年代在信息保密方面的問題。
另外一個是數(shù)據(jù)敏感度的增加,對我們隱私的侵犯。隱私這個詞各有個的見解,我認為可以分成兩部分,一個是PII個人信息識別,這些信息能用于識別個人的。第二個就是個人的屬性,這兩個加在一起才是隱私。比如說咱們現(xiàn)在總是看到代表的罪犯在飛機上壓下來以后到大陸來,他是戴手銬的,這個時候一個人的臉能被識別,而且他犯了詐騙的罪行,兩者結(jié)合起來才是隱私。隱私的保護,我們在比較傳統(tǒng)的環(huán)境下只是采用了加密的方法,把PII加密以后就可以了。但是在大數(shù)據(jù)的背景下,隱私可能有一些啊問題,因為隱私保護在傳統(tǒng)的或者是現(xiàn)在的破壞數(shù)據(jù)完整性就是隱私保護的最主要的手段。就是PII跟那個人的屬性的結(jié)合,傳統(tǒng)的方式就是破壞數(shù)據(jù)的完整性。但是大數(shù)數(shù)據(jù)混合使用下,我們可以通過數(shù)據(jù)整合恢復(fù)數(shù)據(jù)的完整性,這個時候個人的隱私還是保證不了的,這也是在大數(shù)據(jù)環(huán)境下對個人隱私的挑戰(zhàn)。
第二個挑戰(zhàn),就是大數(shù)據(jù)整個應(yīng)用成功的屬性是萬眾創(chuàng)新,并不是幾個科學(xué)家在里面想一想就能促進整個的大數(shù)據(jù)的創(chuàng)新的成功。這個理念還是克強總理提出的萬眾創(chuàng)新,每個人都從自己的角度上去理解數(shù)據(jù)的內(nèi)涵,進行一些數(shù)據(jù)的分析。這樣的話,這種局面就打破了傳統(tǒng)的數(shù)據(jù)安全方面的最基本的理念,就是正確率,或者是分類工具。我們的數(shù)據(jù)在傳統(tǒng)的組織里,一般認為首先它有部門屬性的,研發(fā)的,市場的數(shù)據(jù)。第二部分,再把某一個領(lǐng)域里的數(shù)據(jù)按照什么公開,保密,進行一個分級。在這樣的體系下,一般的數(shù)據(jù)的季度來講,增加用戶,再給用戶加到用戶組里,采用這樣的體系,這樣的體系是比較僵硬的。這樣的話,傳統(tǒng)的體系也受到了很大的挑戰(zhàn)。
第三個方面,數(shù)據(jù)驅(qū)動業(yè)務(wù)。造成的數(shù)據(jù)的可信性成為了重要的安全對象?,F(xiàn)在雖然說沒有實現(xiàn),但是我們一般開大數(shù)據(jù)的會議上都會講,未來的經(jīng)濟是數(shù)據(jù)驅(qū)動的。但是我們從一些互聯(lián)網(wǎng)的廠家上就能看到這個苗頭;比如說像這樣的某一個搜索廠家,對他來講,他的排名,在搜索結(jié)果里的排名是一項很重要的業(yè)務(wù),是特別主要的來源。但是,在這種情況下,每個人都希望我們的排名在上面,在前三頁,最好是能排上,出現(xiàn)了很多這樣的搜索引擎優(yōu)化的業(yè)務(wù)。他們就是分析某個廠商的排序算法,然后針對這些算法的弱點,有意識的編造一些數(shù)據(jù)輸入到排序算法里,把他的網(wǎng)站排名提高起來,這個時候?qū)@個廠家,對這樣的搜索引擎的公司的信譽度打擊是非常之大的,會直接影響他的銷售。那么在大數(shù)據(jù)的年代里數(shù)據(jù)的可信性怎么判斷是很重要的問題。
我們提到三個挑戰(zhàn),華三對于數(shù)據(jù)安全有自己思考,在方法論方面和具體工作方面也投入了經(jīng)歷。華把數(shù)據(jù)安全體系分成兩塊,第一塊就是最核心的,就是數(shù)據(jù)。從數(shù)據(jù)的產(chǎn)生一直到消亡的各個階段進行了分析。最主要的安全原因是使用,我們在每個階段里,從數(shù)據(jù)使用的角度上,我們給它數(shù)據(jù)過程的角度分析數(shù)據(jù)的安全問題。