“數(shù)據(jù)背后是網(wǎng)絡,網(wǎng)絡背后是人,研究網(wǎng)絡數(shù)據(jù)實際上是研究人組成的社會網(wǎng)絡。”在2012年5月召開的第424次香山科學會議上,李國杰提出建立一門大數(shù)據(jù)研究的“網(wǎng)絡數(shù)據(jù)科學”,重點研究數(shù)據(jù)背后的社會網(wǎng)絡。
就在他提出建立這門新型交叉學科之前的兩個月,美國聯(lián)邦政府宣布了“大數(shù)據(jù)研究和發(fā)展倡議”計劃,擬用2億美元提高從大量數(shù)字數(shù)據(jù)中訪問、組織、收集發(fā)現(xiàn)信息的工具和技術(shù)水平。
《大數(shù)據(jù)時代》一書的中文譯者周濤認為,大數(shù)據(jù)分析和利用與提升國家競爭力及國民幸福程度密切相關(guān),數(shù)據(jù)儲備和數(shù)據(jù)分析能力將成為未來新型國家最重要的核心戰(zhàn)略能力。
周濤稱:“包括與國家安全、社會穩(wěn)定相關(guān)的尖端武器制造與性能模擬實驗,群體事件以及謠言的預警和干預;與國家科技能力相關(guān)的等離子即高能粒子實驗分析,納米材料及生物基因工程;與國民經(jīng)濟繁榮相關(guān)的經(jīng)濟金融態(tài)勢感知與失穩(wěn)預測,精準營銷與智能物流倉儲等。”
面向2020年,中國也將在戰(zhàn)略高度上將信息科技發(fā)展作為主戰(zhàn)場之一,在新科技革命進程中,加速人、機、物三元世界的融合發(fā)展。
挑戰(zhàn)信息安全
通過立法和各種有效手段保護個人隱私刻不容緩
回到文章開頭,被大數(shù)據(jù)應用猜到購物喜好的尷尬大概源于對個人隱私泄露的不安。的確,目前大數(shù)據(jù)應用面臨的挑戰(zhàn)之一便是對個人隱私信息的擔憂。
張敏回憶起前些年看過的一個科幻故事,描寫的是當時的作者暢想的現(xiàn)代生活:主人公早晨醒來打開一部類似手機的機器,機器自動彈出了主人公將要前往地點的路線及相關(guān)信息,不僅如此,主人公最喜歡的餐廳和電影也被自動推送出來。
“你能相信嗎,有一臺機器比你自己還了解你。”張敏感嘆。不過在她看來,這樣美好的未來對于個人隱私也是相當危險的。
“棱鏡計劃”是談論大數(shù)據(jù)時不得不提的事件。根據(jù)美國中情局前職員愛德華·斯諾登提供的信息,美國情報機構(gòu)在2007年開始的“棱鏡”竊聽計劃中,對美國9家互聯(lián)網(wǎng)公司的數(shù)據(jù)進行挖掘工作,從音頻、視頻、圖片、郵件、文檔以及連接信息中分析個人的聯(lián)系方式與行動。該計劃一經(jīng)曝光,便受到國際社會的譴責。
然而,《大數(shù)據(jù)時代》作者舍恩·伯格在評論斯諾登事件時曾表示,令他驚奇的并不是“棱鏡計劃”本身,而是大家對這個計劃如此驚奇,大多數(shù)人竟然仍以小數(shù)據(jù)的經(jīng)驗和視野來看待它。
從大數(shù)據(jù)應用創(chuàng)新的角度來看,“棱鏡計劃”無疑是一個非常出色的案例,同樣暴露了大數(shù)據(jù)應用對個人隱私的威脅。
大數(shù)據(jù)時代如何保護個人隱私是一個共同關(guān)心的問題。在前不久召開的中國計算機學會青年計算機科技論壇上,南京大學計算機系教授仲盛介紹,傳統(tǒng)互聯(lián)網(wǎng)對個人信息保護的方式之一便是“去識別”,即去掉姓名等關(guān)鍵信息。那么,大數(shù)據(jù)時代,“去識別”還能保護隱私嗎?
例如,一家醫(yī)院在提供醫(yī)療服務時發(fā)現(xiàn)張家村有兩名45歲的男性患有某種疾病,其中一名未婚。在這條信息里,病人的個人信息雖然被去除了,但只要知道張家村有誰滿足45歲和未婚兩個條件,依然能知道究竟是誰患病。
仲盛指出,正是數(shù)據(jù)集成暴露了個人隱私。“即使每一個機構(gòu)發(fā)布的數(shù)據(jù)都是安全的,但把它們結(jié)合在一起便什么都知道了。”他說。
從技術(shù)而言,科學家至今還沒有最有效的辦法為個人隱私“上保險”。大數(shù)據(jù)時代的信息安全恐怕需要新的社會規(guī)則來規(guī)范使用數(shù)據(jù)的行為。
2013年年初,世界經(jīng)濟論壇發(fā)表《解除個人信息的價值:從收集到使用》的報告,甚至建議所有數(shù)據(jù)收集都應當使用密碼,以達到“限制使用數(shù)據(jù)”的目的。
大數(shù)據(jù)的應用對公眾信息安全來說無疑增加了一個新的維度。李國杰在接受媒體采訪時曾表示:“如何通過立法和各種手段真正保護個人的隱私,這是國家需要高度重視的一個新的安全問題。”