據(jù)經(jīng)濟(jì)之聲《天下公司》報(bào)道,超鏈接的時(shí)代里,數(shù)據(jù)浩瀚如海,信息撲面而來,這是資源的積累還是垃圾的堆砌?思維方式的改變,個(gè)人隱私的失控,時(shí)代運(yùn)轉(zhuǎn)的變更,哪一個(gè)才是數(shù)據(jù)的本質(zhì)?中國(guó)移動(dòng)前董事長(zhǎng)王建宙為您講述《大數(shù)據(jù)時(shí)代》。
本期嘉賓:原中國(guó)移動(dòng)通信集團(tuán)董事長(zhǎng)王建宙,中國(guó)金融博物館理事長(zhǎng)王巍主持。本期話題:《大數(shù)據(jù)時(shí)代》。
王建宙:我推薦牛津大學(xué)教授維克托·舍恩伯格寫的《大數(shù)據(jù)時(shí)代》,確實(shí)改變了我們認(rèn)識(shí)和了解世界的觀點(diǎn)和方法。書中談到的我很有體會(huì)。第一點(diǎn)叫樣本得益于總體,以前由于我們的數(shù)據(jù)太少,所以我們的數(shù)據(jù)家們比較用一些集聚抽樣的方法,我們能夠得到總體數(shù)據(jù)的情況,這個(gè)方法我們已經(jīng)用了很多年了。今天由于大數(shù)據(jù)以后,有些東西我們就不需要抽樣了,我們可以把所有的數(shù)據(jù)都拿到。
第二個(gè),我們改變了觀察數(shù)據(jù)的方法,從因果到關(guān)聯(lián),什么意思呢?我們以前要分析一個(gè)東西是從原因分析會(huì)導(dǎo)致什么結(jié)果,這是非常科學(xué)的,今后我們還會(huì)長(zhǎng)期用。但今天我們有些東西找不出原因,我們可以不需要因果關(guān)系,我們只要從關(guān)聯(lián)度就可以分析了。舉一個(gè)例子,大概三個(gè)月之前,原來摩根士丹利的分析師叫Mary Meeke,他發(fā)了一個(gè)2013年的互聯(lián)網(wǎng)報(bào)告,中間有兩張照片非常有意思,第一張照片是十幾年還是二十年前,兩只狗在一個(gè)桌面互聯(lián)網(wǎng)的屏幕前面,它們?cè)谡f,ON internet,nobody knows you are a dog——在互聯(lián)網(wǎng)當(dāng)中,沒有人知道你是一條狗。那時(shí)候是作為一種互聯(lián)網(wǎng)的開放性來宣傳的,就是說互聯(lián)網(wǎng)多開放,人人都可以發(fā)言,連狗都可以發(fā)言,而且沒人知道它是一條狗。這次Mary Meeke的報(bào)告,換了一段話,兩只狗拿著一個(gè)iPad在上網(wǎng),他說ON internet,everybody knows you are a dog——在互聯(lián)網(wǎng)上,人人都知道你是一條狗。為什么?它就是一種關(guān)聯(lián)的方法。雖然我不知道你是一條狗,但我可以看到你每天網(wǎng)購的都是狗食;第二,你發(fā)微信發(fā)出去的照片都是狗的照片,或者人的下半身的照片;第三,你搜索引擎上,你搜索的全是關(guān)于狗的標(biāo)題,所以我看不到你,但是我通過這種關(guān)聯(lián)方法,我就可以知道你是一條狗。
一組名為“互聯(lián)網(wǎng)上的一天”的調(diào)查數(shù)據(jù)顯示,每天發(fā)出電子郵件2940億封,相當(dāng)于美國(guó)兩年的紙質(zhì)信件數(shù)量;每天發(fā)出200萬篇博客,相當(dāng)《時(shí)代周刊》770年的用戶量;每天上傳到y(tǒng)outube的視頻,可以連續(xù)播放98年;每天上傳到Facebook的照片,堆起來有80個(gè)埃菲爾鐵塔那么高。這些究竟是不可或缺的數(shù)字資源,還是我們無處安放的數(shù)字垃圾呢?
王建宙:什么叫大數(shù)據(jù)?我看了很多的文章,都是說4個(gè)V,總得來說,就是強(qiáng)調(diào)數(shù)據(jù)的多,所以我們叫大數(shù)據(jù)。其實(shí)這不是大數(shù)據(jù)的本質(zhì),大數(shù)據(jù)的本質(zhì)是我們大量的數(shù)據(jù)經(jīng)過整合和分析以后,它會(huì)變成一種資源,這種資源就像石油、鐵礦、煤炭一樣具有價(jià)值,這才是大數(shù)據(jù)的價(jià)值所在。
在達(dá)沃斯,幾年前有一個(gè)討論,他說我們這個(gè)時(shí)代叫做hyper,我們當(dāng)時(shí)一起參加討論的人說,不對(duì),怎么hyper,是什么意思呢?高血壓、高血脂這種才叫hyper,我們現(xiàn)在年紀(jì)還不夠,怎么已經(jīng)叫hyper了呢?后來經(jīng)過討論以后,大家越來越覺得對(duì)了。我們這確實(shí)是一個(gè)超連接的時(shí)代,現(xiàn)在我們每一個(gè)人每時(shí)每刻都是連接在一起的,真的是達(dá)到了這個(gè)地步。
在達(dá)沃斯討論的問題,我們最最重要的數(shù)據(jù)是什么?最后大家一致認(rèn)為個(gè)人隱私保護(hù)是最重要的。我覺得個(gè)人隱私保護(hù)有兩點(diǎn):第一是運(yùn)營(yíng)商或者參與服務(wù)商的自律,就是你參加了這個(gè)服務(wù),你知道了用戶的信息,但是你一定要保守用戶的個(gè)人隱私。第二個(gè),就是要通過相關(guān)的法律來規(guī)定,一定不能利用自己所掌握的客戶資料來危害人家的個(gè)人隱私。我覺得這個(gè)問題是大數(shù)據(jù)時(shí)代一個(gè)最重要的問題。