隨著社交網(wǎng)絡(luò)的快速發(fā)展,互聯(lián)網(wǎng)將實時釋放出海量數(shù)據(jù)。社交網(wǎng)絡(luò)向個人用戶提供豐富服務(wù),體現(xiàn)出它的應(yīng)用價值。但是,社交網(wǎng)絡(luò)中的個人數(shù)據(jù)如果被任意搜索,隱私問題更加讓人擔(dān)憂。這里尤其要注意的是,在這樣一個大數(shù)據(jù)時代,日益膨脹的數(shù)據(jù)“黑色市場”的危險性。
超出網(wǎng)站“使用規(guī)定”,大量數(shù)據(jù)被買賣
“大數(shù)據(jù)”最近備受關(guān)注,同時數(shù)據(jù)“黑色市場”的危險性也開始被廣泛討論。
目前,各社交網(wǎng)站均不同程度地開放其用戶所產(chǎn)生的實時數(shù)據(jù),被一些數(shù)據(jù)提供商收集。一些監(jiān)測數(shù)據(jù)的市場分析機構(gòu)尤其是金融、廠商、零售業(yè)等各種數(shù)據(jù)用戶企業(yè)還會將這些實時數(shù)據(jù)二次應(yīng)用,用于把握新產(chǎn)品的市場反應(yīng),檢測消費者對品牌的認知度。
如果進行監(jiān)測,一旦發(fā)生問題就能捕獲并及時作出對應(yīng)。此外,進行災(zāi)害救援的組織也對社交數(shù)據(jù)應(yīng)用非常關(guān)注。但是,這些數(shù)據(jù)在采集過程中,有超出網(wǎng)站(發(fā)布者)《使用規(guī)定》開展數(shù)據(jù)采集,并將其出售給其他企業(yè)等行為。
黑客經(jīng)常入侵服務(wù)器,盜取信用卡等的個人數(shù)據(jù)或者企業(yè)機密數(shù)據(jù)等,顯然屬于非法行為。而采集社交網(wǎng)站數(shù)據(jù)行為并非此類犯罪行為,而是被稱為“灰色市場”或者更加不透明的黑色市場。他們利用Facebook、Twitter(國內(nèi)如微博等社交網(wǎng)站)等公開開放API(應(yīng)用程序接口,外部開發(fā)者便于二次應(yīng)用網(wǎng)站部分功能以及數(shù)據(jù)庫的接口),有意地采集數(shù)據(jù),超出網(wǎng)站原始的使用規(guī)定。
過去5年間,公開類似的開放API的網(wǎng)站呈爆炸式增長。在發(fā)布者來看是一項慷慨的舉措,但是利用這些API的數(shù)據(jù)采集者經(jīng)常“希望得到更多的數(shù)據(jù)”。因此,發(fā)生了許多網(wǎng)站使用規(guī)定之外的非法數(shù)據(jù)采集行為。
有沒有遏制非法數(shù)據(jù)采集行為的方法
許多人會問,能通過程序處理,杜絕社交網(wǎng)站的開放API被惡意使用嗎?目前,盡管有遏制此類非法行為的對策,但都不是完美的解決方案。
“可口可樂”的標志隨處可見。標志是可以自由觀看的,但不可以任意使用。社交網(wǎng)站用戶發(fā)布的內(nèi)容,對此的訪問或者轉(zhuǎn)發(fā)等,就像商標一樣。數(shù)據(jù)提供商或者開發(fā)者也可以查看所有數(shù)據(jù),但是他們原本應(yīng)該根據(jù)社交網(wǎng)站的使用規(guī)定,在二次應(yīng)用之前有一道紅線。但是,對數(shù)據(jù)的市場欲望超越了這道線。
當然,也存在從數(shù)據(jù)代理商處買來各種數(shù)據(jù),組合挖掘成更加有附加值的個人信息的方式方法。實際上,通過我們在社交網(wǎng)站中寫入的信息、智能手機顯示的位置信息等多種數(shù)據(jù)組合,已經(jīng)可以非常高精度地鎖定個人。
基于多種數(shù)據(jù)來源,就像解碼那樣,然后進行拼圖,挖掘出個人信息體系,仿佛就是一個黑色市場。如果,發(fā)布者能夠以技術(shù)手段高速生成海量數(shù)據(jù),那么外部數(shù)據(jù)商同樣也可以挖掘出個人用戶的所以信息。
2010年,F(xiàn)acebook曾經(jīng)在API使用規(guī)定中對可索引化文件設(shè)置了限制,原因就是意識到這種方式非常容易實現(xiàn)數(shù)據(jù)挖掘。
普通用戶需要注意什么
那么,普通用戶應(yīng)用社交網(wǎng)站,應(yīng)該注意什么?
任何發(fā)布者都想掌控盡可能多的用戶信息。但是,問題是哪些設(shè)定應(yīng)該是必需的?用戶經(jīng)常在并不知情的情況下忽視一些并不想公開的數(shù)據(jù),結(jié)果往往被各種目的所利用。可以說,大數(shù)據(jù)的黑色市場只會增加,而不會消失。所以,用戶自身為了保護個人信息,在應(yīng)用各類社交網(wǎng)站之際,需要耐心花時間去閱讀和理解各個網(wǎng)站的隱私保護策略。