而這個(gè)“活”,大數(shù)據(jù)的第一個(gè)特點(diǎn)是“在線”——活數(shù)據(jù)肯定是在線的?,F(xiàn)在很少有數(shù)據(jù)是可能實(shí)時(shí)被使用的。阿里有一個(gè)“奔月”計(jì)劃,就是把所有的數(shù)據(jù)都搬到云上,實(shí)現(xiàn)“實(shí)時(shí)處理”。
第二個(gè)要理解的點(diǎn),我們今天的數(shù)據(jù),跟以前不一樣的地方,未來的商業(yè)數(shù)據(jù)是自然被記錄下來的,而不再是一種收集的概念。這是一個(gè)根本的思路差別。
傳統(tǒng)的市場調(diào)查,是一個(gè)數(shù)據(jù)收集的過程,而且是樣本數(shù)據(jù),因?yàn)槟悴豢赡苁占械臄?shù)據(jù)。而互聯(lián)網(wǎng)時(shí)代的數(shù)據(jù),是全本的自然記錄。比如淘寶,有所有用戶任何時(shí)間在淘寶上瀏覽和購物的記錄,這是用戶行為在淘寶自然沉淀的數(shù)據(jù)。任何商業(yè)都很關(guān)心成本,因?yàn)殡S著云計(jì)算的發(fā)展,存儲(chǔ)和運(yùn)算的成本會(huì)越來越低。只有用這種接近零成本的方式存儲(chǔ)下的數(shù)據(jù),才能夠創(chuàng)造價(jià)值——這是一個(gè)沙里淘金的過程,沙要足夠多,最后淘出的金也相對會(huì)更多。
大數(shù)據(jù)第三個(gè)特點(diǎn):數(shù)據(jù)和業(yè)務(wù)是一個(gè)有機(jī)的閉環(huán),它會(huì)是一個(gè)正反饋的作用。以搜索為例,我們有一個(gè)全網(wǎng)數(shù)據(jù)庫,最主要的考核目標(biāo)是“實(shí)時(shí)性”,搜索依據(jù),就是要做出一個(gè)全網(wǎng)實(shí)時(shí)數(shù)據(jù)的index,同時(shí)要做出一個(gè)ranking:對所有網(wǎng)頁內(nèi)容,根據(jù)搜索要求,進(jìn)行一個(gè)排序匹配。Google最有名的研發(fā)成果就是page rank。但這個(gè)相關(guān)性是由什么決定——它是由用戶每次的點(diǎn)擊(CTR)來決定——這個(gè)是google每次計(jì)算的活數(shù)據(jù)的來源,google沒有數(shù)據(jù)收集的過程,任何一個(gè)數(shù)據(jù)的點(diǎn)擊,就成為下一個(gè)搜索實(shí)時(shí)的信息,這就是一個(gè)活數(shù)據(jù)的概念。你搜一個(gè)關(guān)鍵字,原則上,一個(gè)小時(shí)前后,得到的結(jié)果是不一樣的,因?yàn)橐粋€(gè)小時(shí)之后,數(shù)據(jù)動(dòng)態(tài)更新,已經(jīng)形成了一個(gè)新的結(jié)果。這是一個(gè)實(shí)時(shí)的在線系統(tǒng),一個(gè)完整的業(yè)務(wù)閉環(huán):對于傳統(tǒng)企業(yè)來說——你的業(yè)務(wù)在多大程度是由你的數(shù)據(jù)流決定了你的用戶體驗(yàn)。
云+端,獲得更好的用戶體驗(yàn),從云的層面說,最重要的大數(shù)據(jù)處理能力,是大數(shù)據(jù)本身的質(zhì)量,數(shù)據(jù)與用戶的互動(dòng)——這些都會(huì)影響用戶的體驗(yàn);而端的層面,比如微信,是點(diǎn)對點(diǎn)的體驗(yàn),不需要背后云的支持。
數(shù)據(jù)量的大少,并不是關(guān)鍵,關(guān)鍵是怎么要實(shí)現(xiàn)“活”數(shù)據(jù)。我以出版業(yè)為例,出版社這個(gè)業(yè)務(wù),我想要的就是一個(gè)活數(shù)據(jù)的閉環(huán)。又如家電企業(yè),他們有哪些業(yè)務(wù)是在線的?電商版塊是在線的,在線存貨和其他的存貨,未必都是一盤貨。
阿里不是一個(gè)純互聯(lián)網(wǎng)公司,我們是用互聯(lián)網(wǎng)技術(shù),提升商業(yè)的效率。很多互聯(lián)網(wǎng)公司,是一個(gè)互聯(lián)網(wǎng)技術(shù),做出一個(gè)互聯(lián)網(wǎng)產(chǎn)品。而阿里關(guān)心的,是怎么樣用互聯(lián)網(wǎng)產(chǎn)品,去解決傳統(tǒng)商業(yè)的問題。這個(gè)解決的過程,必須用到這三個(gè)互聯(lián)網(wǎng)產(chǎn)品形態(tài)來支撐它的業(yè)務(wù)體系——internet硬件,云計(jì)算社會(huì)化的計(jì)算公用服務(wù),大數(shù)據(jù)作為這個(gè)平臺(tái)流動(dòng)的最重要的資產(chǎn),web1.0-3.0作為核心的產(chǎn)品形態(tài)——云+端
===問答環(huán)節(jié)===
提問:所有的環(huán)節(jié)都是可以實(shí)現(xiàn)“數(shù)據(jù)在線”嗎?比如大量的非結(jié)構(gòu)數(shù)據(jù)?
回答:我認(rèn)為未來都可以實(shí)現(xiàn)“數(shù)據(jù)在線”。這是一個(gè)解構(gòu)和重構(gòu)的過程。
提問:未來互聯(lián)網(wǎng)產(chǎn)品的特征是去中心化嗎?
回答:淘寶目前還是中心化流量的平臺(tái)。我們在促進(jìn)用戶和商家的聯(lián)系還遠(yuǎn)遠(yuǎn)不夠。三年前,我們就說過我們想把淘寶做沒了,因?yàn)槲覀兿胱屘詫殶o處不在。三年來,大數(shù)據(jù),云計(jì)算以及移動(dòng)化發(fā)展,我們都想努力實(shí)現(xiàn)賣家和買家去中心化的交流。換句話說,這是淘寶從web.2.0向3.0過渡。08年-13年,我們完成了最好的購物垂直搜索(這也是商業(yè)價(jià)值最大的搜索)。但12年開始,淘寶講小而美和開放平臺(tái),已經(jīng)希望在構(gòu)筑用SNS的生態(tài)來建立大的商業(yè)生態(tài)系統(tǒng)。
微信的這個(gè)大生態(tài),本身是一個(gè)社交需求。到目前為止,所有的人,都沒有做到用SNS的一個(gè)產(chǎn)品理念來支撐出商業(yè)的最大化:讓買家和賣家的網(wǎng),可以更加豐富——這其實(shí)是商業(yè)生態(tài)的“毛細(xì)血管”部分。這是一個(gè)非常難的方向,也是一個(gè)巨大的商業(yè)機(jī)會(huì)。我也相信,會(huì)有越來越多的創(chuàng)業(yè)者,會(huì)試圖用這個(gè)方式來尋找商業(yè)機(jī)會(huì)。
淘寶做的就是web2.0時(shí)代的商業(yè)引擎。就算3.0時(shí)代,我們這樣2.0的一個(gè)中心化的平臺(tái),還是有它的商業(yè)價(jià)值。后浪推前浪,前浪并不一定會(huì)死在沙灘上。它可能會(huì)成為新時(shí)代一個(gè)小的元素。