很多人都將數(shù)據(jù)比喻我們這個(gè)時(shí)代的石油,但是石油如果在沒(méi)有開(kāi)采和利用人的那里,只是埋在地底的黑色的沉淀物;在一般人那,只是可以點(diǎn)燃照亮的東西,還冒著濃濃的黑煙;經(jīng)過(guò)提煉之后的石油,可以驅(qū)動(dòng)汽車、輪船、飛機(jī);到了其他制造商那里,原本被認(rèn)為無(wú)用的原油提煉剩余物可以制造出我們鋪路的瀝青,化學(xué)肥料、用的塑料、穿的衣服,還有肥皂洗發(fā)水等,當(dāng)然這一切的前提,原油作為一種生產(chǎn)資料作為必須進(jìn)入生產(chǎn)環(huán)節(jié)可以流通和購(gòu)買。大數(shù)據(jù)時(shí)代,我們面臨同樣的問(wèn)題,甚至還更復(fù)雜,因?yàn)閿?shù)據(jù)作為一種生產(chǎn)資源,還具備隱私性,國(guó)家、企業(yè)組織及信息個(gè)人安全考量,同時(shí)其生產(chǎn)者和使用者分離,以及跟原油一樣作為國(guó)家戰(zhàn)略資源的特殊屬性。
信息孤島、數(shù)據(jù)割裂和難以流通不僅讓很多有研究和數(shù)據(jù)應(yīng)用條件的單位沒(méi)有數(shù)據(jù)可用,也讓很多數(shù)據(jù)沉睡不能發(fā)揮價(jià)值甚至價(jià)值逐漸降低。這樣的情況,正如《大數(shù)據(jù)時(shí)代》譯者,成都科技大學(xué)周濤教授年初所說(shuō),全世界今天都還沒(méi)有準(zhǔn)備好迎接這場(chǎng)革命,尚不了解數(shù)據(jù)的類別、品質(zhì)和價(jià)值如何界定,也不知道數(shù)據(jù)的隱私、安全和版權(quán)如何保障,沒(méi)有建立良好的數(shù)據(jù)產(chǎn)業(yè)生態(tài)環(huán)境,也沒(méi)有針對(duì)大數(shù)據(jù)的教育和訓(xùn)練。在這個(gè)問(wèn)題上我們和其他國(guó)家是站在同一起跑線上的,這種“不清晰”也給了我們更多的機(jī)會(huì),讓我們證府、企業(yè)界、學(xué)術(shù)界、投資界和媒體齊心協(xié)力,通過(guò)數(shù)據(jù)交換、流動(dòng)推動(dòng)數(shù)據(jù)行業(yè)應(yīng)用和商業(yè)創(chuàng)新,推動(dòng)這次可能深刻改變我們社會(huì)和經(jīng)濟(jì)的變革。在此之前,我們需要了解到數(shù)據(jù)交易或者數(shù)據(jù)流通,目前存在的可能的范式和操作的例子。
一、最基礎(chǔ)的,政府或組織開(kāi)放
美國(guó)Data.gov以及英國(guó)、印度、新加坡等國(guó)的政府開(kāi)放計(jì)劃,都是由政府出面通過(guò)國(guó)家數(shù)據(jù)開(kāi)放平臺(tái)形式,將地理信息、農(nóng)業(yè)、醫(yī)療、天氣、交通等數(shù)據(jù)進(jìn)行開(kāi)放,并且提供開(kāi)放接口和分析工具,以提供給企業(yè)或個(gè)人開(kāi)發(fā)應(yīng)用使用。
通過(guò)Guardian Datablog,《衛(wèi)報(bào)》及其數(shù)據(jù)博客每天都會(huì)發(fā)布新聞背后所隱藏的數(shù)據(jù),它鼓勵(lì)讀者對(duì)這些數(shù)據(jù)進(jìn)行可視化處理和研究。該數(shù)據(jù)博客利用谷歌電子表格和谷歌云計(jì)算數(shù)據(jù)庫(kù)(Google Fusion Tables)來(lái)發(fā)布數(shù)據(jù),讓讀者可以搜索到世界各地?cái)?shù)以千計(jì)的官方數(shù)據(jù)集。數(shù)據(jù)堂是北京一家公司提供的專業(yè)的科研數(shù)據(jù)共享平臺(tái),主要為國(guó)內(nèi)外高等院校、科研機(jī)構(gòu)、研發(fā)企業(yè)及相關(guān)科研人員提供科研數(shù)據(jù)支持。通過(guò)對(duì)分散在各個(gè)領(lǐng)域的數(shù)據(jù)進(jìn)行收集、加工、整理,以及用戶自行上傳并發(fā)布的數(shù)據(jù),數(shù)據(jù)堂擁有43227份科研數(shù)據(jù)集,以計(jì)算機(jī)學(xué)科和交通數(shù)據(jù)為主。
作為一個(gè)為科學(xué)研究提供數(shù)據(jù)與資料開(kāi)放獲取的社交媒體,MyScienceWork以O(shè)pen Access為理念,旨在為研究人員和公眾提供無(wú)障礙獲取科學(xué)知識(shí)的途徑。它免費(fèi)向用戶提供最新的研究成果、學(xué)者簡(jiǎn)介、行業(yè)招聘信息以及學(xué)術(shù)領(lǐng)域內(nèi)相關(guān)的會(huì)議活動(dòng)預(yù)告。目前網(wǎng)站公開(kāi)資料已經(jīng)超過(guò)3億份,涵蓋101種語(yǔ)言的學(xué)術(shù)內(nèi)容。地質(zhì)、氣象、醫(yī)療、物理等科研資料的開(kāi)放全球都有組織或機(jī)構(gòu)牽頭進(jìn)行,谷歌、微軟等公司也在這方面做出,這也是個(gè)讓全社會(huì)、各領(lǐng)域都可以受益的大趨勢(shì)。
二、合縱連橫,產(chǎn)業(yè)鏈間數(shù)據(jù)開(kāi)放和交易
咨詢公司埃森哲在一份報(bào)告中指出,Web2.0時(shí)代,企業(yè)內(nèi)部數(shù)據(jù)的權(quán)重要遠(yuǎn)遠(yuǎn)超過(guò)外部數(shù)據(jù),這些內(nèi)部數(shù)據(jù)包括企業(yè)內(nèi)部產(chǎn)生的交易數(shù)據(jù)、CRM(客戶關(guān)系管理系統(tǒng))數(shù)據(jù)等。一旦企業(yè)內(nèi)外部的數(shù)據(jù)真正流通起來(lái)后,企業(yè)外部數(shù)據(jù)的權(quán)重會(huì)越來(lái)越上升。
1、合縱,產(chǎn)業(yè)鏈縱向開(kāi)發(fā)或聯(lián)合
通過(guò)日產(chǎn)公司提供的汽車駕駛行為數(shù)據(jù),日本損害保險(xiǎn)公司2013年7月推出的個(gè)人汽車綜合保險(xiǎn)“DRIVE-LOG”.今天,國(guó)內(nèi)很多大數(shù)據(jù)領(lǐng)域的創(chuàng)業(yè)公司,也是依靠三大巨頭BAT或者新浪微博這樣的開(kāi)放數(shù)據(jù)。沃爾瑪和寶潔之間數(shù)據(jù)交換的例子更是廣泛傳播:沃爾瑪掌握了解消費(fèi)者在店里的購(gòu)買行為數(shù)據(jù);寶潔則了解寶潔的品牌什么樣的消費(fèi)者會(huì)有什么樣的偏好,通過(guò)數(shù)據(jù)的交換和貫通,兩個(gè)企業(yè)能夠從不同的層面更好的了解消費(fèi)者。
像百分點(diǎn)這樣的企業(yè),通過(guò)掌握的互聯(lián)網(wǎng)行為的數(shù)據(jù),也可以為產(chǎn)業(yè)鏈上的電商企業(yè)或者是媒體公司,通過(guò)推薦引擎和分析引擎優(yōu)化內(nèi)部運(yùn)營(yíng)和外部廣告投放。今年來(lái),阿里巴巴的多項(xiàng)投資,進(jìn)入新浪微博、高德地圖和友盟都顯示其整合、打通縱向數(shù)據(jù)鏈的意圖。自然,百度和騰訊也在做著同樣的事情。
2、連橫,產(chǎn)業(yè)群聯(lián)合共享數(shù)據(jù)
大數(shù)據(jù)時(shí)代,數(shù)據(jù)今天因?yàn)槭莻€(gè)獨(dú)特、稀缺的資源,但是根本上作為一種生產(chǎn)資料,數(shù)據(jù)本身?yè)碛胁⒉灰馕吨鴵碛形磥?lái),對(duì)數(shù)據(jù)挖掘、生產(chǎn)能力會(huì)是未來(lái)制勝的關(guān)鍵。數(shù)據(jù)開(kāi)放、流通是個(gè)大趨勢(shì),即便在同一行業(yè)內(nèi)部很多企業(yè)已經(jīng)意識(shí)到了這點(diǎn)。電子商務(wù)網(wǎng)絡(luò)營(yíng)銷領(lǐng)先企業(yè)億瑪公司總裁柯細(xì)興曾表示,“大數(shù)據(jù)未來(lái)一定是開(kāi)放共贏的,億瑪很愿意將自己的數(shù)據(jù)開(kāi)放出來(lái),也業(yè)內(nèi)外同行交換共享,共建生態(tài)鏈。”今年9月5日,億瑪公司還在上海宣布與電子商務(wù)軟件及服務(wù)提供商上海商派(ShopEx)正式達(dá)成基于數(shù)據(jù)和業(yè)務(wù)平臺(tái)的戰(zhàn)略合作。
通過(guò)此次合作,億瑪將自身近十年積累的全網(wǎng)數(shù)據(jù)與商派的站內(nèi)數(shù)據(jù)進(jìn)行比對(duì)、挖掘、分析,能更加全面的進(jìn)行人群畫像,提升人群分析的精準(zhǔn)度,從而提升廣告精準(zhǔn)投放效果;而商派則通過(guò)與億瑪?shù)暮献鞔蟠笱a(bǔ)充其軟件的客戶營(yíng)銷功能,幫助用戶在更廣泛的互聯(lián)網(wǎng)平臺(tái)上實(shí)現(xiàn)和全店其他數(shù)據(jù)串聯(lián)融合。
三、第三方主導(dǎo)的數(shù)據(jù)交換或交易中心
1、政府、行業(yè)機(jī)構(gòu)主導(dǎo)的交換中心
由政府部門或者行業(yè)聯(lián)盟、行業(yè)協(xié)會(huì)等組織的數(shù)據(jù)交換中心。例如,為配合上海市科委 “大數(shù)據(jù)三年行動(dòng)計(jì)劃” ,上海大數(shù)據(jù)產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟正式成立,并提出將聯(lián)盟內(nèi)部單位的數(shù)據(jù)開(kāi)放共享,推動(dòng)金融、醫(yī)療、電信、零售等領(lǐng)域的大數(shù)據(jù)創(chuàng)新,具體如何評(píng)估數(shù)據(jù)價(jià)值、分配權(quán)益、完成交互,保證誠(chéng)信規(guī)等制訂由所有相關(guān)參與企業(yè)共同來(lái)完善。
更進(jìn)一步,正如寬帶資本董事長(zhǎng)田溯寧此前提出的,隨著數(shù)據(jù)成為重要的國(guó)家戰(zhàn)略資產(chǎn),未來(lái)可能會(huì)出現(xiàn)由政府主導(dǎo)的國(guó)家數(shù)據(jù)銀行,而正如國(guó)際海洋公約一樣,也有可能出現(xiàn)像全球大數(shù)據(jù)公約,這需要中國(guó)能夠抓住機(jī)會(huì),在變革中成為主導(dǎo)者和引領(lǐng)者。
作為一家從事互聯(lián)網(wǎng)數(shù)據(jù)局的公司,北京締元信公司相信,未來(lái)的數(shù)據(jù)會(huì)像現(xiàn)在的石油或者其他金屬那樣成為一種商品,在世界各地會(huì)誕生數(shù)據(jù)交易所。“你會(huì)看到這樣的場(chǎng)景,一個(gè)小公司的經(jīng)營(yíng)者拿著信用卡走進(jìn)交易所說(shuō),我想要購(gòu)買香港地區(qū)所有人刷牙習(xí)慣的數(shù)據(jù)。”締元信總裁梅濤這樣舉例。
2、企業(yè)建立的第三方數(shù)據(jù)交易平臺(tái)
阿里巴巴曾經(jīng)提出建立一個(gè)“數(shù)據(jù)交易市場(chǎng)”主張,讓任何個(gè)人和企業(yè)都可以將數(shù)據(jù)和挖掘服務(wù)拿上去進(jìn)行交易,阿里巴巴也會(huì)將自己的交易和信用數(shù)據(jù)逐步放到上面。
將數(shù)據(jù)變成商品,且可跨組織進(jìn)行買賣、交換、整合,在國(guó)外已經(jīng)有了一些先行者。InfoChimps成立的目標(biāo)就是要讓每個(gè)人都能找到自己需要的數(shù)據(jù)集。設(shè)計(jì)上,數(shù)據(jù)提供者可以將數(shù)據(jù)集上傳至InfoChimps,可以供人免費(fèi)下載,或者以一定的價(jià)格銷售。InfoChimps還提供很多API可供用戶調(diào)用,在超過(guò)一定數(shù)量的免費(fèi)API調(diào)用限額后,InfoChimps會(huì)向用戶收取一定的費(fèi)用。
2008年創(chuàng)辦的 Factual提供的多種數(shù)據(jù)集涵蓋了本地服務(wù)、娛樂(lè)、教育和醫(yī)療等多個(gè)方面,還包括了可用的政府?dāng)?shù)據(jù)。Factual不僅向大公司提供數(shù)據(jù),同時(shí)也面向規(guī)模較小的軟件開(kāi)發(fā)商。Factual按浮動(dòng)價(jià)格向公司和獨(dú)立軟件開(kāi)發(fā)商出售數(shù)據(jù),其依據(jù)是有多少信息被使用。小規(guī)模的數(shù)據(jù)提供是免費(fèi)的,大型客戶需要支付的費(fèi)用則會(huì)達(dá)到成百上千萬(wàn)美元。有些時(shí)候,F(xiàn)actual還會(huì)與其他公司進(jìn)行數(shù)據(jù)交易,目的是擴(kuò)大自身所占有的資源。包括Facebook、CitySearch、AT&T及其他一些公司都會(huì)使用Factual來(lái)獲得有關(guān)某些地方的信息。也有一些專注于幫助開(kāi)發(fā)者和第三方獲取Twitter,F(xiàn)acebook和其他社交網(wǎng)站數(shù)據(jù)資源的社交媒體數(shù)據(jù)分析公司,比如Gnip和Datasift。 DataSift從Twitter購(gòu)買了多年的數(shù)據(jù)同步授權(quán),能夠訪問(wèn)所有Twitter管道數(shù)據(jù),并將子集賣給第三方,主要是企業(yè)客戶。
3、個(gè)人數(shù)據(jù)交易平臺(tái)
一位名叫Federico Zannier美國(guó)人,從今年2月份起開(kāi)始記錄自己的網(wǎng)頁(yè)瀏覽數(shù)據(jù)、地理位置信息、鼠標(biāo)軌跡、屏幕定時(shí)截圖、攝像頭定時(shí)照片、鍵盤輸入記錄、App登錄信息等數(shù)據(jù),在短短3個(gè)月的時(shí)間內(nèi),他就積攢了超過(guò)7GB的“隱私數(shù)據(jù)”。5月份,Zannier經(jīng)將這些數(shù)據(jù)統(tǒng)計(jì)、分類匯總,放到kickstarter眾募網(wǎng)站上開(kāi)賣,截止到5月14日,這7GB數(shù)據(jù)已經(jīng)炒至1100美元。
和上面談到的企業(yè)為主的數(shù)據(jù)交易不同,還有一些數(shù)據(jù)交易公司或組織,他們的主要目標(biāo)是“個(gè)人數(shù)據(jù)”,并且是未“去隱私化”的,用戶可以在這些平臺(tái)上,將自己的隱私數(shù)據(jù)諸如收入、購(gòu)買意向、職業(yè)背景等信息出售給第三方。
例如Reputation 網(wǎng)站主要向企業(yè)和個(gè)人提供信息發(fā)現(xiàn)產(chǎn)品和多種版權(quán)數(shù)據(jù)庫(kù)。擁有超過(guò) 100 萬(wàn)用戶的數(shù)據(jù)庫(kù)。該數(shù)據(jù)中包含用戶的家庭住址、購(gòu)買習(xí)慣、職業(yè)背景、薪水和收入狀況等信息,并都可以作為隱私數(shù)據(jù)進(jìn)行交易。Reputation 網(wǎng)站還提出將發(fā)布一款新產(chǎn)品,讓用戶通過(guò)向其他公司分享自己的部分隱私數(shù)據(jù)來(lái)?yè)Q取相應(yīng)的折扣或者是其他好處。
成立于 2009 年P(guān)ersonal,其初衷是讓用戶自己決定自己的信息可以被哪些廣告商獲取。除了開(kāi)發(fā)類似于 Reputation 這樣的產(chǎn)品讓消費(fèi)者可以選擇要交易的數(shù)據(jù),獲取可以幫助用戶取得折扣或優(yōu)惠。Personal還計(jì)劃再添一個(gè)“交易市場(chǎng)”頻道,允許用戶出售他們個(gè)人信息的訪問(wèn)權(quán)。
一份最新2014-2020年IT市場(chǎng)的預(yù)測(cè)中,Gartner提出市場(chǎng)需求和激勵(lì)將不斷推動(dòng)消費(fèi)者自愿分享數(shù)據(jù),到2020年,企業(yè)和政府將無(wú)法保護(hù)75%的敏感數(shù)據(jù),并會(huì)取消保密等級(jí),允許大范圍人群、公眾訪問(wèn)。而伴隨政府和企業(yè)存儲(chǔ)和使用的數(shù)據(jù)量大規(guī)模的增加,要保護(hù)所有的數(shù)據(jù)是不現(xiàn)實(shí)的。相比較承擔(dān)保護(hù)所有數(shù)據(jù)這一無(wú)底的任務(wù),政府和企業(yè)會(huì)更專注于保護(hù)其中一小部分,并且要保護(hù)得很好。
既然大趨勢(shì)如此,我們目前應(yīng)該做的,就是要推動(dòng)上述的嘗試,用法律和市場(chǎng)手段逐步推進(jìn)數(shù)據(jù)所有權(quán)、隱私的保護(hù),以及數(shù)據(jù)交易規(guī)則和定價(jià)等問(wèn)題,大數(shù)據(jù)作為信息時(shí)代生產(chǎn)資料,國(guó)家競(jìng)爭(zhēng)的前沿、創(chuàng)新的動(dòng)力,讓它真正發(fā)揮應(yīng)有價(jià)值,數(shù)據(jù)開(kāi)放和規(guī)范流通是目前的首要任務(wù)。