而數(shù)據(jù)不適合共享的第二個(gè)原因,就是數(shù)據(jù)的價(jià)值相對(duì)性。對(duì)于數(shù)字內(nèi)容,一般都是普羅大眾都能夠接受的產(chǎn)品,比如一部電影再不符合你的口味,悶得慌時(shí)湊合看看總是可以的。但數(shù)據(jù)則不一樣,即使是同樣一個(gè)數(shù)據(jù)集,對(duì)于不同的企業(yè)其價(jià)值可能是天淵之別,而對(duì)于數(shù)據(jù)這種相對(duì)價(jià)值差異極大的產(chǎn)品定價(jià),免費(fèi)模式幾乎不可能達(dá)到經(jīng)濟(jì)上的帕累托最優(yōu)。
數(shù)據(jù)的第二個(gè)特征是數(shù)據(jù)價(jià)值的相對(duì)性。比如我有大量全國(guó)方言的語(yǔ)料庫(kù)數(shù)據(jù),這個(gè)語(yǔ)料庫(kù)對(duì)于絕大部分人而言其價(jià)值幾乎為零,但對(duì)于如科大訊飛等專門(mén)做語(yǔ)音識(shí)別的公司,則是能大幅度提升識(shí)別準(zhǔn)確率的“金子般”高價(jià)值數(shù)據(jù)。另外一個(gè)例子是,假設(shè)我有整個(gè)中國(guó)13億人的興趣愛(ài)好標(biāo)簽數(shù)據(jù),雖然這個(gè)數(shù)據(jù)對(duì)于幾乎所有的企業(yè)都是非常有價(jià)值的數(shù)據(jù),但實(shí)際上大部分企業(yè)只是需要其中的一部分而已,如上海的淘寶賣家只關(guān)心江浙一帶用戶的數(shù)據(jù),母嬰電商僅關(guān)注其中的女性用戶數(shù)據(jù)。讓數(shù)據(jù)需求方把全體數(shù)據(jù)買(mǎi)回去無(wú)疑是不符合市場(chǎng)規(guī)律的,數(shù)據(jù)交易需要給予數(shù)據(jù)需求方“挑數(shù)據(jù)”的能力。
上述兩個(gè)個(gè)案例,分別說(shuō)明了數(shù)據(jù)總體價(jià)值在需求方的差異性,以及數(shù)據(jù)本身內(nèi)在價(jià)值分布的差異。對(duì)于大部分?jǐn)?shù)據(jù)交易,使用傳統(tǒng)商品交易的方式,即供給方簡(jiǎn)單為數(shù)據(jù)貼上一個(gè)價(jià)格標(biāo)簽掛平臺(tái)出售的方式是不合適的。因?yàn)樵趥鹘y(tǒng)商品流通中,不太可能出現(xiàn)比如一本書(shū)對(duì)于買(mǎi)家A價(jià)值高達(dá)1萬(wàn)元、但對(duì)于買(mǎi)家B僅值10元這樣的巨大價(jià)值感知差別。
有趣的是,傳統(tǒng)商品交易確實(shí)會(huì)存在上述的情況,比如玉石/字畫(huà),或土地/有價(jià)證券等價(jià)值感知主觀性極強(qiáng)的商品交易。事實(shí)上我們已經(jīng)為它們創(chuàng)造了一種幾乎完美的定價(jià)模式,那就是競(jìng)價(jià)拍賣,即需求方定價(jià):你覺(jué)得對(duì)你而言,值多少錢(qián)就出多少價(jià)。
數(shù)據(jù)交易第三個(gè)特征是,交易的不僅是數(shù)據(jù)本身,而是知識(shí)。這個(gè)看起來(lái)非常顯而易見(jiàn)的觀點(diǎn),實(shí)際是數(shù)據(jù)交易中最為核心的原則。在未來(lái)成熟的數(shù)據(jù)交易市場(chǎng),主要交易的量會(huì)圍繞蘊(yùn)含在數(shù)據(jù)背后的知識(shí),而數(shù)據(jù)的知識(shí)發(fā)現(xiàn)KDD(Knowledge Discovery in Data)將會(huì)是數(shù)據(jù)交易市場(chǎng)的核心任務(wù)。而其中的道理也是顯而易見(jiàn)的,需求方分別把數(shù)據(jù)買(mǎi)回去然后做加個(gè)應(yīng)用無(wú)疑是不經(jīng)濟(jì)的,更好的模式是,知識(shí)已經(jīng)由數(shù)據(jù)交易市場(chǎng)以云計(jì)算的形式處理好,由需求方直接購(gòu)買(mǎi)回去使用。俗話說(shuō)書(shū)本有價(jià)知識(shí)無(wú)價(jià),而至于怎么對(duì)這些“無(wú)價(jià)”的知識(shí)進(jìn)行定價(jià)出售,數(shù)據(jù)交易市場(chǎng)需要設(shè)計(jì)一套巧妙的機(jī)制,通過(guò)需求方定價(jià)的方式去激活市場(chǎng)。
在未來(lái),數(shù)據(jù)交易產(chǎn)品化將會(huì)是重大趨勢(shì),而數(shù)據(jù)知識(shí)發(fā)現(xiàn)KDD是其中的核心問(wèn)題。正如你去谷歌搜索“數(shù)據(jù)交易”,谷歌不會(huì)粗暴地把所有含“數(shù)據(jù)交易”關(guān)鍵字的網(wǎng)頁(yè)打包為一個(gè)碩大的txt文檔返回給你一樣。
數(shù)據(jù)交易最后一個(gè)特征,是數(shù)據(jù)涉及的隱私性。目前的數(shù)據(jù)交易之所以困難,在于大部分有交易價(jià)值的數(shù)據(jù)都與用戶的個(gè)人隱私有緊密關(guān)聯(lián)。如國(guó)內(nèi)三大電信運(yùn)營(yíng)商雖然具備用戶全行為洞察以及跨屏數(shù)據(jù)的巨大優(yōu)勢(shì),但在數(shù)據(jù)變現(xiàn)中腳步蹣跚,最主要原因在于用戶隱私紅線。數(shù)據(jù)交易實(shí)質(zhì)是一個(gè)復(fù)雜的“四方問(wèn)題”,關(guān)于用戶隱私和四方問(wèn)題本文接下來(lái)的章節(jié)會(huì)詳細(xì)介紹。
第二部分 數(shù)據(jù)交易的“四方問(wèn)題”
在數(shù)據(jù)交易的具體過(guò)程中,存在復(fù)雜的四方問(wèn)題,具體如下圖所示。在長(zhǎng)期以來(lái)的數(shù)據(jù)交易探討中,我們都傾向于為求簡(jiǎn)便,有意無(wú)意地忽略了數(shù)據(jù)的“原點(diǎn)”,也就是數(shù)據(jù)的當(dāng)事人——用戶本身。但在現(xiàn)實(shí)當(dāng)中,大部分?jǐn)?shù)據(jù)尤其是行為類數(shù)據(jù),都是用戶基于與某個(gè)服務(wù)提供方(第二方)的服務(wù)或產(chǎn)品契約,在使用過(guò)程中所產(chǎn)生的。數(shù)據(jù)的當(dāng)事人,即用戶在數(shù)據(jù)交易的設(shè)計(jì)與規(guī)劃中是不能被忽略的,數(shù)據(jù)交易不能被簡(jiǎn)化為簡(jiǎn)單的“三方問(wèn)題”。而在目前國(guó)內(nèi)成立的一些數(shù)據(jù)交易所中,數(shù)據(jù)當(dāng)事人并未被納入到其頂層設(shè)計(jì)之中,僅僅通過(guò)一些如“涉及用戶隱私或其他法律保護(hù)情形的數(shù)據(jù),不能交易”等條款含糊應(yīng)對(duì),這是比較可惜的地方。
在數(shù)據(jù)交易之中,之所以有用戶隱私侵犯甚至違法交易之憂,最本質(zhì)的原因是數(shù)據(jù)交易 “四方問(wèn)題”是一個(gè)閉環(huán)的結(jié)構(gòu)。也就是說(shuō),取之于用戶的數(shù)據(jù),被售賣到數(shù)據(jù)購(gòu)買(mǎi)方后,有可能被用于利或不利于用戶的行為之中。如運(yùn)營(yíng)商把運(yùn)營(yíng)商把數(shù)據(jù)售賣給征信機(jī)構(gòu),導(dǎo)致用戶在貸款申請(qǐng)中,授信額度被降低了10萬(wàn)元;或電商把用戶購(gòu)物興趣標(biāo)簽出售后,用戶接到了大量的營(yíng)銷電話。因?yàn)橛羞@一閉環(huán)的存在,服務(wù)提供方在未經(jīng)用戶許可的情況下,單方面把數(shù)據(jù)提供給可能會(huì)為用戶帶來(lái)不利后果的購(gòu)買(mǎi)方,無(wú)論是倫理上還是契約上都是不合適的。