面對這些問題,行業(yè)專家、投資人和創(chuàng)業(yè)者,幾乎每一個人都有一套自己的理解和答案。
謝文在去年5月撰寫的有關(guān)大數(shù)據(jù)時代系列博文之一《數(shù)據(jù)大未必是大數(shù)據(jù)》中指出,網(wǎng)絡(luò)業(yè)中一個公司是否能稱得起擁有大數(shù)據(jù),至少要從三個維度考量,即數(shù)據(jù)規(guī)模、數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)相關(guān)性。
換句話說,如果一個網(wǎng)站擁有一億用戶,但他們在上面只干同一類的事情,譬如瀏覽新聞,買東西,或是玩游戲,那么由此產(chǎn)生的數(shù)據(jù)量雖然不小,但結(jié)構(gòu)簡單,重復性高,分析起來相對比較容易,只需根據(jù)用戶背景和使用習慣進行分組歸類即可,那根本稱不上是大數(shù)據(jù)。
同理,如果一個網(wǎng)站上的十種產(chǎn)品和服務(wù),彼此之間相互孤立,造成同一個用戶的十種網(wǎng)絡(luò)行為的數(shù)據(jù)無法有效地整合在一起,或者需要付出高昂的整合成本,從而降低了數(shù)據(jù)的可挖掘性,那么無論數(shù)據(jù)量多大,結(jié)構(gòu)多復雜,也同樣形成不了大數(shù)據(jù)。