基于比特的數(shù)據(jù)與實(shí)物最大的區(qū)別是數(shù)據(jù)并非是你拿走我就沒有的東西,并且硬件的價(jià)格在飛速下降,開源又使數(shù)據(jù)的訪問工具基本免費(fèi)。這幾者疊加在一起,使數(shù)據(jù)公地成為可能。
這里面很有意思的問題是如果大家更在意我拿到的東西是不是絕對(duì)值變大了那數(shù)據(jù)公地的形成可能性就大些,因?yàn)槿绻嬖跀?shù)據(jù)公地,那每個(gè)人(企業(yè))一定收獲更多,但如果大家更在意我是不是比你多,那數(shù)據(jù)公地的建設(shè)就會(huì)多很多障礙,因?yàn)楣仄鋵?shí)是讓相關(guān)人員站到同樣的競爭起點(diǎn)上。
大數(shù)據(jù)的問題,在數(shù)據(jù)的使用上是技術(shù)問題,但在數(shù)據(jù)源上其實(shí)是社會(huì)經(jīng)濟(jì)問題,后者更難,所以大數(shù)據(jù)應(yīng)用的發(fā)展不取決于技術(shù)的發(fā)展而取決于社會(huì)經(jīng)濟(jì)方式的變革速度。在有限的領(lǐng)域里,比如搜索、電商、云計(jì)算,技術(shù)已經(jīng)得到比較充分的發(fā)展,眼下來看誰付出誰受益的問題是把小數(shù)據(jù)變成大數(shù)據(jù)過程中最主要的問題。
大數(shù)據(jù)的路往那里走?
數(shù)據(jù)的內(nèi)在發(fā)展動(dòng)力是數(shù)據(jù)越全價(jià)值越大,其實(shí)這也是一種網(wǎng)絡(luò)效應(yīng),這種內(nèi)在動(dòng)力導(dǎo)致宏觀來看數(shù)據(jù)所有權(quán)的發(fā)展只有兩種趨勢:
一種是像現(xiàn)在移動(dòng)端一樣,每個(gè)人都有自己的私有數(shù)據(jù)源,接下來開始你死我活的競爭,最終有一家活下來,這也可以達(dá)成數(shù)據(jù)統(tǒng)一的終極目標(biāo)。
另一種則是在競爭中開始聯(lián)合,建設(shè)上面所說的數(shù)據(jù)公地。
如前所述行業(yè)數(shù)據(jù)和全社會(huì)的數(shù)據(jù)性質(zhì)上差別很大所以要分開來探討。
對(duì)于行業(yè)數(shù)據(jù)而言,競爭對(duì)手間彼此的坦誠合作除非有極為特別的人物出現(xiàn),否則是不太可能的。這種情況下最簡單的辦法是引入第三方。
比如說每家運(yùn)營商都握有幾乎所有網(wǎng)民的行動(dòng)數(shù)據(jù),但要想讓運(yùn)營商彼此間開誠布公的合作把這些數(shù)據(jù)整合在一起創(chuàng)造某種價(jià)值,這就很難。這時(shí)候如果有第三方介入,制定好利益分配方案那就是可能的。
如果這點(diǎn)可以達(dá)成,那唯一的關(guān)鍵點(diǎn)就是相應(yīng)的商業(yè)模式是不是可以超越數(shù)據(jù)處理的成本。這點(diǎn)必須強(qiáng)調(diào)下的是,大數(shù)據(jù)的價(jià)值密度是很稀疏的,很多東西有價(jià)值但并不一定值得做,視頻網(wǎng)站之所以賺不到錢一個(gè)關(guān)鍵原因就是帶寬和存儲(chǔ)的成本比較高,而對(duì)大數(shù)據(jù)而言商業(yè)模式找不好,情形可能比視頻網(wǎng)站還差。挖礦的成本怎么也要小于挖礦所得挖礦才有價(jià)值。
上述問題在行業(yè)數(shù)據(jù)里可能問題還不是太大,一般來講行業(yè)數(shù)據(jù)的價(jià)值密度終究會(huì)大一些,并且因?yàn)橄鄬?duì)比較垂直,總量終究有限制。所以大數(shù)據(jù)的行業(yè)應(yīng)用比較容易發(fā)展。
但對(duì)社會(huì)性的數(shù)據(jù),這在很多時(shí)候就是個(gè)問題。我們都知道樣本的全面性比數(shù)據(jù)的多少更有價(jià)值,但是如果多是確保樣本全面性的唯一手段的話,那就意味必須有全的數(shù)據(jù)做一件事情才有意義。
社會(huì)化的數(shù)據(jù)有兩種應(yīng)用方向,一種就是企業(yè)可以搞定的比如Google,一種則是屬于社會(huì)層面,很難單獨(dú)屬于某個(gè)企業(yè)的比如智慧城市相關(guān)的人的活動(dòng)數(shù)據(jù)。后者則需要上面所說的數(shù)據(jù)公地來做支撐。
從數(shù)據(jù)的視角來看,現(xiàn)在有兩種數(shù)據(jù)存放形式:一種是Google這樣的企業(yè)擁有整個(gè)社會(huì)某個(gè)橫截面上的全部數(shù)據(jù),這應(yīng)該是種特例,并且數(shù)據(jù)會(huì)局限在公開信息;一種則是被割裂的各種與人行為相關(guān)的數(shù)據(jù),比如購物相關(guān)的在電商,與人相關(guān)的在社交網(wǎng)絡(luò)和IM,線下服務(wù)相關(guān)的則在O2O企業(yè),鐵路相關(guān)的在12306等。Google這種擁有全的數(shù)據(jù),但并不擁有人的行為,所以說Google這種企業(yè)相當(dāng)于擁有整個(gè)社會(huì)的一個(gè)橫截面的數(shù)據(jù)。而所有其它企業(yè)則只擁有某個(gè)垂直領(lǐng)域的數(shù)據(jù)。
如果依賴于企業(yè)做這種數(shù)據(jù)統(tǒng)一的嘗試,在前者就會(huì)有投資200億做O2O類的舉動(dòng),因?yàn)檫@會(huì)補(bǔ)全數(shù)據(jù),在后者就會(huì)有做電商的想做社交,做社交的想做電商這類事發(fā)生。類似的故事還可以在終端上發(fā)生,所有這些行為的終極目標(biāo)都是一家企業(yè)搞定所有這些事情,但這是不可能的,這種不可能還不單是經(jīng)濟(jì)原因。而數(shù)據(jù)不能打通,那就只能在割裂的數(shù)據(jù)上做自以為是大數(shù)據(jù)的大數(shù)據(jù)。
所以說這骨子里是數(shù)據(jù)公地究竟能不能建立的問題,而要想建立數(shù)據(jù)公地,那至少要解決誰來做的問題,對(duì)此開源給出的啟示有兩點(diǎn)非常關(guān)鍵:第一這不能是個(gè)盈利組織;第二這要能獲得眾多企業(yè)的支持。因?yàn)閿?shù)據(jù)會(huì)牽涉隱私,所以同開源相比那就一定還要有比較清晰的界定數(shù)據(jù)使用的規(guī)則。