倘若上述閉環(huán)并未合上,則不存在隱私侵犯的問題。如用戶個體數據被加工為各類宏觀統(tǒng)計數據,如百度遷徙數據,或者數據沒被用于針對用戶本身的營銷或洞察行為之中。如用戶的Netflix電影評分數據隨同NASA的最新探測器被作為人類社會行為的樣本發(fā)射到了太空,即使數據中含有了敏感的PII信息(個人身份可辨識信息),用戶也不必擔心在有生之年會因為在《獨立日》中的高評分會被外星人找麻煩。
個人隱私保護是數據交易當前的焦點問題,鑒于其中的巨大挑戰(zhàn),本文無意深入探究數據交易隱私保護的技術與方案。但實際上業(yè)界對于數據交易的隱私保護已經有了一定的嘗試,其中在線廣告的數據交易平臺的實踐是值得我們去玩味的。
雖然目前數據交易是非常熱的一個話題,但實際上能通過程序化形式每天開展大量數據交易的,業(yè)界里恐怕只有在線廣告的在線用戶行為標簽數據交易,這種數據交易形式被廣泛用戶RTB等競價廣告的客戶定向之中。簡單而言,DMP(數據管理平臺)會通過各種渠道聚合在線用戶的行為數據,并加工為有價值的用戶標簽數據,并出售給廣告主(實際為DSP)用于廣告的精準投放,從而提高廣告的投入產出。這種明細用戶的標簽交易形成了上述四方問題的閉環(huán),必然會帶來用戶隱私的困擾,那DMP是如何去界定與解決的?
我們以去年被Oracle收購的廣告數據管理平臺商Bluekai說明。Bluekai的商業(yè)模式主要是從各類中小主題網站及其他來源獲取用戶數據,加工為各類用戶標簽,比如近期想買奧迪汽車的人、想去米蘭度假的人等,并出售給廣告主用于精準投放。鑒于Bluekai作為一家具影響力的DMP以及這種堂而皇之的個人數據出售方式,必然會引起數據隱私的問題,作為解決方案,Bluekai搭建了一套用戶隱私保護體系,上面明示遵守了那些法律法規(guī),明確了收集與不收集哪些數據,讓使用者可以看到自己的資料是在被誰使用,并且讓用戶隨時可以選擇opt-out。
除了告知外,Bluekai還具備用戶自主opt-out機制,下圖是微軟MSN、Outlook.com以及其他微軟網站和應用上應用了用戶標簽數據的個性化廣告的隱私說明和opt-out頁面,用戶可自由選擇是否接受個性化廣告的投放。而在數據的收益權上,有趣的是,Bluekai甚至允許用戶選擇將因為使用自己數據獲得的收益捐給慈善機構。
數據交易中的隱私保護是一個蘊含巨大挑戰(zhàn)的課題,本文認為其中至少有三點是必不可少的:法律層面?zhèn)€人信息及隱私立法、對用戶透明公開的正常與數據使用情況、以及用戶擁有部分數據交易收益分配權。而這些舉措毫無疑問不是市場自身能夠完善與執(zhí)行的,除了國家層面的推動以外,數據交易市場是其中最重要的推動力量。
另外,數據交易市場在上述“四方問題”中的核心定位,在于降低數據交易過程中的交易成本。數據交易市場需要具備核心能力從而最小化整體市場的交易成本,關于這點在接下來關于數據交易市場的章節(jié)將會進一步討論。
第三部分 未來的數據交易市場
數據交易市場存在的意義,在于顯著降低數據交易的交易成本,否則數據交易雙方是沒有任何理由在交易市場開展交易的。數據交易的成本,由搜尋成本、因信息不對稱導致的風險成本、議價成本(狹義的交易成本)組成。其中搜尋成本是數據買賣雙方對接需求并成功撮合所需要付出的成本;而風險成本是由于數據交易的雙方信息不對稱,所出現的賣方夸大數據價值、以次充好等道德風險行為;而議價成本是雙方在數據定價問題上討價還價帶來的價值損耗,大家不妨回憶本文第一部分關于數據價值的相對性的論述,就不難理解如果缺乏一套有效的數據定價機制,交易雙方會圍繞數據定價損耗大量的精力與成本。
那么數據交易中心該如何降低上述的交易成本?交易成本的最小化,是任何一個多邊平臺的最終目標,也是一個艱難的課題。本文試圖通過四個問題,從不同角度進行穿插梳理,權作拋磚引玉——
問題一:在數據交易市場,交易對象是什么?
數據交易中心中可交易的數據??梢愿鶕弦徽鹿?jié) “四方問題”中是否有形成閉環(huán)分為兩類:第一類是非閉環(huán)數據,即不涉及任何個人隱私的統(tǒng)計性與科研數據(為方便起見,這類數據下文稱作“第一類數據”)。如各類經濟及行業(yè)統(tǒng)計數據、用于工程及研究目的得各類如聲音語料庫、城市交通數據、匿名的上網行為數據等。這類數據由于不涉及到個人隱私,一般可以認為產權屬于所有方,采取“柜臺式”報價掛牌交易即可。