更可怕的是,這些信息你永遠(yuǎn)無法刪除,它們永遠(yuǎn)存在于互聯(lián)網(wǎng)的某些你不知道的角落。除非你更換掉自己的所有信息,但是這代價(jià)太大了。
用戶隱私問題一直是大數(shù)據(jù)應(yīng)用難以繞開的一個(gè)問題,如被央視曝光過的分眾無線、羅維鄧白氏以及網(wǎng)易郵箱都涉及侵犯用戶隱私。目前,中國并沒有專門的法律法規(guī)來界定用戶隱私,處理相關(guān)問題時(shí)多采用其他相關(guān)法規(guī)條例來解釋。但隨著民眾隱私意識的日益增強(qiáng),合法合規(guī)地獲取數(shù)據(jù)、分析數(shù)據(jù)和應(yīng)用數(shù)據(jù),是進(jìn)行大數(shù)據(jù)分析時(shí)必須遵循的原則。
說到隱私被侵犯,愛德華?斯諾登應(yīng)該占據(jù)一席之地,這位前美國中央情報(bào)局(CIA)雇員一手引爆了美國“棱鏡計(jì)劃”(PRISM)的內(nèi)幕消息。“棱鏡”項(xiàng)目是一項(xiàng)由美國國家安全局(NSA)自2007年起開始實(shí)施的絕密電子監(jiān)聽計(jì)劃,年耗資近2000億美元,用于監(jiān)聽全美電話通話記錄,據(jù)稱還可以使情報(bào)人員通過“后門”進(jìn)入9家主要科技公司的服務(wù)器,包括微軟、雅虎、谷歌、Facebook、PalTalk、美國在線、Skype、YouTube、蘋果。這個(gè)事件引發(fā)了人們對政府使用大數(shù)據(jù)時(shí)對公民隱私侵犯的擔(dān)心。
再看看我們身邊,當(dāng)微博,微信,QQ空間這些社交平臺(tái)肆意的吞噬著數(shù)億用戶的各種信息時(shí),你就不要指望你還有隱私權(quán)了,就算你在某個(gè)地方刪除了,但也許這些信息已經(jīng)被其他人轉(zhuǎn)載或保存了,更有可能已經(jīng)被百度或Google存為快照,早就提供給任意用戶搜索了。
因此在大數(shù)據(jù)的背景下,很多人都在積極的抵制無底線的數(shù)字化,這種大數(shù)據(jù)和個(gè)體之間的博弈還會(huì)一直繼續(xù)下去……
專家給予了我們一些如何有效保護(hù)大數(shù)據(jù)背景下隱私權(quán)的建議:1-減少信息的數(shù)字化;2-隱私權(quán)立法;3-數(shù)字隱私權(quán)基礎(chǔ)設(shè)施(類似DRM數(shù)字版權(quán)管理);4-人類改變認(rèn)知(接受忽略過去);5-創(chuàng)造良性的信息生態(tài);6-語境化。
但是這些都很難立即見效或者有實(shí)質(zhì)性的改善。
比如,現(xiàn)在有一種職業(yè)叫刪帖人,專門負(fù)責(zé)幫人到各大網(wǎng)站刪帖,刪除評論。其實(shí)這些人就是通過黑客技術(shù)侵入各大網(wǎng)站,破獲管理員的密碼然后進(jìn)行手工定向刪除。只不過他們保護(hù)的不是客戶的隱私,而大多是丑聞。還有一種職業(yè)叫人肉專家,他們負(fù)責(zé)從互聯(lián)網(wǎng)上找到一個(gè)與他們根本就無關(guān)系用戶的任意信息。這是很可怕的事情,也就是說,如果有人想找到你,只需要兩個(gè)條件:1-你上過網(wǎng),留下過痕跡;2-你的親朋好友或僅僅是認(rèn)識你的人上過網(wǎng),留下過你的痕跡。這兩個(gè)條件滿足其一,人肉專家就可以很輕松的找到你,可能還知道你現(xiàn)在正在某個(gè)餐廳和誰一起共進(jìn)晚餐。
當(dāng)很多互聯(lián)網(wǎng)企業(yè)意識到隱私對于用戶的重要性時(shí),為了繼續(xù)得到用戶的信任,他們采取了很多辦法,比如google承諾僅保留用戶的搜索記錄9個(gè)月,瀏覽器廠商提供了無痕沖浪模式,社交網(wǎng)站拒絕公共搜索引擎的爬蟲進(jìn)入,并將提供出去的數(shù)據(jù)全部采取匿名方式處理等。
在這種復(fù)雜的環(huán)境里面,很多人依然沒有建立對于信息隱私的保護(hù)意識,讓自己一直處于被滋擾,被精心設(shè)計(jì),被利用,被監(jiān)視的處境中。可是,我們能做的幾乎微乎其微,因?yàn)閭€(gè)人隱私數(shù)據(jù)已經(jīng)無法由我們自己掌控了,就像一首詩里說到的:“如果你現(xiàn)在繼續(xù)麻木,那就別指望這麻木能抵擋得住被”扒光”那一刻的驚恐和絕望……”
和大數(shù)據(jù)相關(guān)的技術(shù)
云技術(shù)
大數(shù)據(jù)常和云計(jì)算聯(lián)系到一起,因?yàn)閷?shí)時(shí)的大型數(shù)據(jù)集分析需要分布式處理框架來向數(shù)十、數(shù)百或甚至數(shù)萬的電腦分配工作??梢哉f,云計(jì)算充當(dāng)了工業(yè)革命時(shí)期的發(fā)動(dòng)機(jī)的角色,而大數(shù)據(jù)則是電。
云計(jì)算思想的起源是麥卡錫在上世紀(jì)60年代提出的:把計(jì)算能力作為一種像水和電一樣的公用事業(yè)提供給用戶。
如今,在Google、Amazon、Facebook等一批互聯(lián)網(wǎng)企業(yè)引領(lǐng)下,一種行之有效的模式出現(xiàn)了:云計(jì)算提供基礎(chǔ)架構(gòu)平臺(tái),大數(shù)據(jù)應(yīng)用運(yùn)行在這個(gè)平臺(tái)上。
業(yè)內(nèi)是這么形容兩者的關(guān)系:沒有大數(shù)據(jù)的信息積淀,則云計(jì)算的計(jì)算能力再強(qiáng)大,也難以找到用武之地;沒有云計(jì)算的處理能力,則大數(shù)據(jù)的信息積淀再豐富,也終究只是鏡花水月。
那么大數(shù)據(jù)到底需要哪些云計(jì)算技術(shù)呢?
這里暫且列舉一些,比如虛擬化技術(shù),分布式處理技術(shù),海量數(shù)據(jù)的存儲(chǔ)和管理技術(shù),NoSQL、實(shí)時(shí)流數(shù)據(jù)處理、智能分析技術(shù)(類似模式識別以及自然語言理解)等。