似乎所有人都在關(guān)注大數(shù)據(jù),甚至包括美國(guó)聯(lián)邦政府。美國(guó)聯(lián)邦貿(mào)易委員會(huì)(FTC)去年年底向數(shù)據(jù)經(jīng)紀(jì)行業(yè)的9家公司發(fā)出命令,要求他們提供對(duì)客戶數(shù)據(jù)收集和使用情況的信息。FTC的行動(dòng)明確表明,雖然大數(shù)據(jù)的興起提供了很多商業(yè)利益,但也帶來重大的隱私問題。
為什么要使用大數(shù)據(jù)?
大數(shù)據(jù)不同于過去的數(shù)據(jù)倉庫,因?yàn)樗鼛缀醴治鏊蓄愋偷臄?shù)據(jù)文件或格式,包括圖像、視頻以及從社交媒體收集的數(shù)據(jù)。大數(shù)據(jù)的另一個(gè)特點(diǎn)是它沒有像服務(wù)器對(duì)數(shù)據(jù)存儲(chǔ)的“一對(duì)一”的關(guān)系,而是依賴虛擬化架構(gòu),從大型內(nèi)容商店和檔案中提取內(nèi)容作為單一全球資源。
在企業(yè)管理人員和業(yè)務(wù)線經(jīng)理中,使用大數(shù)據(jù)的最大動(dòng)機(jī)是形成更準(zhǔn)確、詳細(xì)的預(yù)測(cè)或者推測(cè),從而為企業(yè)提供潛在的優(yōu)勢(shì)。大數(shù)據(jù)帶來的業(yè)務(wù)優(yōu)勢(shì)很廣泛,從新產(chǎn)品開發(fā)和改進(jìn)到最佳定價(jià),再到篩選求職簡(jiǎn)歷和設(shè)計(jì)有效的營(yíng)銷活動(dòng)等。事實(shí)上,政治運(yùn)動(dòng)已經(jīng)開始利用大數(shù)據(jù)分析:2012年奧巴馬競(jìng)選就利用了大數(shù)據(jù)分析來確定可能投票的選民,然后影響他們,通過他們來籌集競(jìng)選資金,并獲得選票,這是奧巴馬獲得最終勝利的關(guān)鍵戰(zhàn)略。
大數(shù)據(jù)隱私問題
FTC最近采取的行動(dòng)是專門針對(duì)數(shù)據(jù)經(jīng)紀(jì)公司:這種公司收集和分析特定消費(fèi)者行為數(shù)據(jù),然后將分析結(jié)果賣給希望提高營(yíng)銷和銷售業(yè)績(jī)的公司。然而,需要承認(rèn)的是,使用大數(shù)據(jù)帶來越來越多的隱私問題,這并不僅限于這些傳統(tǒng)的數(shù)據(jù)經(jīng)紀(jì)公司。經(jīng)濟(jì)學(xué)人信息部(經(jīng)濟(jì)學(xué)人集團(tuán)內(nèi)獨(dú)立的業(yè)務(wù)部)公布了使用大數(shù)據(jù)最多的19個(gè)行業(yè)領(lǐng)域,包括制造業(yè)、IT和技術(shù)、金融服務(wù)、專業(yè)服務(wù)、醫(yī)療保健、制藥和生物技術(shù)以及消費(fèi)品等。毫無疑問,大數(shù)據(jù)革命已經(jīng)開始。
根據(jù)大數(shù)據(jù)的特點(diǎn),以及大數(shù)據(jù)使用的業(yè)務(wù)動(dòng)機(jī),最關(guān)鍵的隱私問題是,簡(jiǎn)單地說,數(shù)據(jù)的質(zhì)量或者準(zhǔn)確性;以及企業(yè)使用這些數(shù)據(jù)來作出決定而可能會(huì)對(duì)個(gè)人產(chǎn)生的負(fù)面影響。例如,從社交媒體獲取的個(gè)人信息的準(zhǔn)確性?從社交媒體或者其他網(wǎng)絡(luò)來源的信息可以用于篩選或者排名求職申請(qǐng),或者提高醫(yī)療保險(xiǎn)的價(jià)格嗎?基本的個(gè)人資料,例如年齡、婚姻狀況、教育或者就業(yè)情況通常都是未經(jīng)驗(yàn)證的。在免費(fèi)電子郵件服務(wù)中同樣也沒有這些驗(yàn)證,幾乎所有用戶都會(huì)點(diǎn)選接受使用條款和私隱聲明,表明同意放棄用于數(shù)據(jù)匯總的一定程度的隱私權(quán)利。
另一個(gè)質(zhì)量問題是,當(dāng)收集互聯(lián)網(wǎng)搜索字詞或短語時(shí),可能會(huì)對(duì)它們存在誤解。企業(yè)利用大數(shù)據(jù)不佳的例子包括使用互聯(lián)網(wǎng)搜索詞條來評(píng)估產(chǎn)品定價(jià),或者潛在目標(biāo)客戶。要知道,在家庭計(jì)算機(jī)中可能有多個(gè)用戶,并且有很多原因某人在網(wǎng)上搜索與他們無關(guān)的主題。這種類型的數(shù)據(jù)收集、分析和使用可能產(chǎn)生有問題的分析結(jié)果,從而導(dǎo)致錯(cuò)誤的決策,而最終造成個(gè)人和分析數(shù)據(jù)的企業(yè)兩敗俱傷的局面。這種缺乏對(duì)大數(shù)據(jù)質(zhì)量的控制將我們指向另一個(gè)隱私保護(hù)原則,即收集符合且適合既定目標(biāo)的個(gè)人數(shù)據(jù)。
大數(shù)據(jù)隱私的最佳做法
企業(yè)處理大數(shù)據(jù)的最佳做法仍然還沒有確定,但已經(jīng)有一些經(jīng)驗(yàn)可供我們借鑒,確保在不犧牲個(gè)人數(shù)據(jù)隱私的情況下,推動(dòng)大數(shù)據(jù)創(chuàng)新。
有效使用大數(shù)據(jù)的第一步是正確地采購(gòu)和管理云服務(wù),這是使大數(shù)據(jù)符合成本效益的先決條件:大多數(shù)企業(yè)不能或者不會(huì)投資于支持大數(shù)據(jù)計(jì)劃所需要的IT基礎(chǔ)設(shè)施,而是依賴云計(jì)算應(yīng)用、基礎(chǔ)設(shè)施和處理能力。此外,即使是那些愿意投資的企業(yè)也會(huì)發(fā)現(xiàn),沒有云計(jì)算提供的靈活性,他們將舉步維艱。這也暴露了很多企業(yè)的薄弱環(huán)節(jié),即普遍不能確保云計(jì)算中數(shù)據(jù)的安全性和隱私性。企業(yè)執(zhí)行標(biāo)準(zhǔn)的一般安全合同條款并不夠。對(duì)于特定數(shù)據(jù)隱私控制,云服務(wù)供應(yīng)商和云服務(wù)用戶明確各自必須承擔(dān)的責(zé)任。還必須對(duì)云服務(wù)進(jìn)行持續(xù)的檢測(cè)和審計(jì),同時(shí)通過相關(guān)指標(biāo)來顯示數(shù)據(jù)完整、保密和可用。使用云計(jì)算服務(wù)的完美的數(shù)據(jù)保護(hù)資源是云安全聯(lián)盟(Cloud Security Alliance),其官網(wǎng)上有很多指導(dǎo)性文件可供參考。
從過往的經(jīng)驗(yàn)來看,在部署云服務(wù)時(shí),最好在公共云執(zhí)行大數(shù)據(jù)原型,然后轉(zhuǎn)移到私有云。為什么?公共云部署,顧名思義,是在第三方環(huán)境內(nèi),并可能受到“不信任”各方的訪問。而私有云部署直接受組織或者企業(yè)的控制和管理,即使數(shù)據(jù)計(jì)算設(shè)施可能位于企業(yè)外部,但私有云部署只能由受信任的各方來訪問。