大數(shù)據(jù)概念雖然非常火爆,但少有人真正理解大數(shù)據(jù)的核心內(nèi)容。一個普遍而且嚴重的誤解就是:大數(shù)據(jù) = 數(shù)據(jù)大,即大數(shù)據(jù)就是量大的數(shù)據(jù)。事實上,除了數(shù)據(jù)量大這個字面意義,大數(shù)據(jù)還有兩個更重要的特征:
1) 跨領(lǐng)域數(shù)據(jù)的交叉融合。相同領(lǐng)域數(shù)據(jù)量的增加是加法效應,不同領(lǐng)域數(shù)據(jù)的融合是乘法效應
2) 數(shù)據(jù)的流動。數(shù)據(jù)必須流動,流動產(chǎn)生價值
對于第 1) 點,百分點推薦系統(tǒng)研究中心實驗結(jié)果顯示:百分點公司有 3 家客戶,分別是從事服裝、化妝品和箱包銷售的電商,百分點向這 3 家客戶提供個性化商品推薦服務,即:百分點挖掘用戶的偏好,不同的用戶上同一家電商網(wǎng)站時,向他們展現(xiàn)不同的服裝、化妝品或箱包,從而提高電商的轉(zhuǎn)化率和客單價。我們做過兩種測試:
a) 將每家網(wǎng)站的數(shù)據(jù)隔離。當每家網(wǎng)站自身的數(shù)據(jù)量增加到以前的 4 倍時,推薦效果大約能提高 5%;
b) 將三家網(wǎng)站的數(shù)據(jù)在去除敏感信息之后進行某種融合。融合后的數(shù)據(jù)大致是與單家網(wǎng)站的數(shù)據(jù)的 3 倍,比第一種情況數(shù)據(jù)量還少。但利用融合后的數(shù)據(jù)進行數(shù)據(jù)挖掘時,推薦效果能提升 30%,而且推薦商品并未發(fā)生變化,仍然是:用戶上服飾類網(wǎng)站時只看見服裝、上化妝品網(wǎng)站時只看見化妝品、上箱包網(wǎng)站時只看見箱包。
解釋得詳細一點,上述實驗說明:對同一個消費者,如果我們要向其推薦服裝。第一種方法是我們根據(jù)他過去的 4 次購買服裝的行為來預測其下一次可能會購買的服飾;第二種方法是我們根據(jù)他過去分別購買服裝、化妝品和箱包的各 1 次行為來預測其下一次可能會購買的服飾。兩種方法的基于的用戶行數(shù)分別是 4 次和 3 次,但第二種方法的效果明顯更好。
對于第 2) 點,其實 10 多年前傳統(tǒng)企業(yè)開始做數(shù)據(jù)倉庫時,數(shù)據(jù)倉庫從業(yè)者經(jīng)常強調(diào)一個觀點:企業(yè)級數(shù)據(jù)倉庫的目標是讓不同部門的數(shù)據(jù)流動起來,各個部門數(shù)據(jù)割裂,數(shù)據(jù)的價值就得不到發(fā)揮。到了今天的互聯(lián)網(wǎng)時代,我們發(fā)現(xiàn)即使企業(yè)已經(jīng)打通了內(nèi)部各個部門之間的數(shù)據(jù),但與整個互聯(lián)網(wǎng)比起來,數(shù)據(jù)量仍然微乎其微,數(shù)據(jù)應該以互聯(lián)網(wǎng)為媒介在企業(yè)之間某種形式的流動。參照“企業(yè)級數(shù)據(jù)倉庫”的概念,現(xiàn)在已經(jīng)開始出現(xiàn)了“互聯(lián)網(wǎng)數(shù)據(jù)倉庫”的概念:就是企業(yè)通過互聯(lián)網(wǎng)渠道將與自己相關(guān)的外部數(shù)據(jù)與內(nèi)部數(shù)據(jù)進行整合,從而形成“互聯(lián)網(wǎng)數(shù)據(jù)倉庫”。百分點已經(jīng)在零售與媒體領(lǐng)域比較成功地打造了“開放數(shù)據(jù)聯(lián)盟”,該聯(lián)盟的成員可以在公允、安全的情況下基于該聯(lián)盟建立起自己的“互聯(lián)網(wǎng)數(shù)據(jù)倉庫”,從而享用海量數(shù)據(jù)的價值。
3) 大數(shù)據(jù)的應用領(lǐng)域
大數(shù)據(jù)的起源要歸功于互聯(lián)網(wǎng)與電子商務,但大數(shù)據(jù)最大的應用前景卻在傳統(tǒng)產(chǎn)業(yè)。一是因為幾乎所有傳統(tǒng)產(chǎn)業(yè)都在互聯(lián)網(wǎng)化,二是因為傳統(tǒng)產(chǎn)業(yè)仍然占據(jù)了國家 GDP 的絕大部分份額。
哪些傳統(tǒng)企業(yè)最需要大數(shù)據(jù)服務呢?至少有 3 類企業(yè):
1) 對大量消費者提供產(chǎn)品或服務的企業(yè)
2) 做小而美模式的中長尾企業(yè)
3) 面臨互聯(lián)網(wǎng)壓力之下必須轉(zhuǎn)型的傳統(tǒng)企業(yè)
第 1) 類企業(yè)都需要利用大數(shù)據(jù)精準分析不同消費者的偏好,提高營銷和服務的質(zhì)量;第 1) 類企業(yè)都需要利用大數(shù)據(jù)分析精準定位自己的客戶群;第 3) 類企業(yè)主要指哪些正在遭受來自互聯(lián)網(wǎng)的新玩家沖擊的傳統(tǒng)企業(yè),此類企業(yè)自然都需要利用互聯(lián)網(wǎng)和大數(shù)據(jù)作為自我進化的工具。當然,第 3) 類企業(yè)與前 2 類企業(yè)有重疊。
具體來講,中國最需要大數(shù)據(jù)服務的行業(yè)就是受互聯(lián)網(wǎng)沖擊最大的產(chǎn)業(yè),首先是線下零售業(yè),其次是金融業(yè)。
受電商的沖擊,國內(nèi)很多零售巨頭都增長嚴重放緩,甚至遭遇負增長,線下零售已經(jīng)到了不得不變革的危機關(guān)頭。我們也看到了銀泰百貨、王府井百貨、萬達集團這些具有創(chuàng)新意識的傳統(tǒng)巨頭開始利用互聯(lián)網(wǎng)和大數(shù)據(jù)來改造線下商業(yè)。其中銀泰百貨以手機為載體、利用 O2O 方式進行雙線數(shù)據(jù)挖掘的創(chuàng)新非常值得借鑒。