一方面,國外初創(chuàng)公司分工明確,多數(shù)公司專注于一個(gè)細(xì)分領(lǐng)域,合作共贏是主流思想。而國內(nèi)大數(shù)據(jù)公司都想自己做整條業(yè)務(wù)線,因此競爭非常激烈。
另一方面,國外中小企業(yè)付費(fèi)意愿明顯強(qiáng)于國內(nèi),這使得國外細(xì)分領(lǐng)域的市場空間遠(yuǎn)遠(yuǎn)大于國內(nèi),初創(chuàng)公司可以依靠一眾小客戶做到幾億營收,支撐其上市。國內(nèi)公司就很難依靠一個(gè)細(xì)分領(lǐng)域的客戶支持其營收增速,必須要擴(kuò)張其業(yè)務(wù)線才能有足夠成長空間。
總而言之,國內(nèi)大數(shù)據(jù)公司要想成長為獨(dú)角獸企業(yè),難度遠(yuǎn)大于國外,數(shù)據(jù)源、數(shù)據(jù)技術(shù)和數(shù)據(jù)應(yīng)用三個(gè)環(huán)節(jié)都要有獨(dú)特競爭力。
第一, 優(yōu)質(zhì)數(shù)據(jù)源。
大多數(shù)大數(shù)據(jù)公司不具備數(shù)據(jù)源,主要依靠采集其他企業(yè)的數(shù)據(jù)。像TalkingData為APP軟件提供廣告監(jiān)測以及數(shù)據(jù)統(tǒng)計(jì)的業(yè)務(wù),從而采集到移動(dòng)設(shè)備數(shù)據(jù)。因此,有機(jī)會(huì)觸及優(yōu)質(zhì)數(shù)據(jù)源對大數(shù)據(jù)公司非常重要。
從行業(yè)來看,銀行、電信、政府的數(shù)據(jù)價(jià)值很高,這類用戶數(shù)據(jù)真實(shí)性較高,能反映用戶實(shí)際需求,而互聯(lián)網(wǎng)數(shù)據(jù)中記錄大量用戶無序行為,有價(jià)值數(shù)據(jù)密度較低;從設(shè)備來看,移動(dòng)端的數(shù)據(jù)價(jià)值要大于PC端,因?yàn)橹悄苁謾C(jī)的普及使得移動(dòng)端用戶行為數(shù)據(jù)更加活躍,同時(shí)可以追蹤用戶地理位置。
第二, 技術(shù)積累。
單純依靠數(shù)據(jù)源并不能構(gòu)筑競爭壁壘,畢竟這些數(shù)據(jù)并非大數(shù)據(jù)公司所有,躺著掙錢的事情是運(yùn)營商等數(shù)據(jù)源擁有方。除互聯(lián)網(wǎng)客戶外,大數(shù)據(jù)公司都很難將企業(yè)客戶的原始數(shù)據(jù)提取出來,只能獲取數(shù)據(jù)標(biāo)簽。
因此,大數(shù)據(jù)公司在數(shù)據(jù)處理上要有很深的積累,特別是在數(shù)據(jù)清理環(huán)節(jié),去除噪音,保留有價(jià)值的數(shù)據(jù),這部分工作對人力依賴較重,需要數(shù)據(jù)科學(xué)家去識別有效數(shù)據(jù)。
第三, 行業(yè)標(biāo)桿客戶。
有些時(shí)候,服務(wù)幾個(gè)行業(yè)標(biāo)桿客戶的價(jià)值要遠(yuǎn)遠(yuǎn)超過一支數(shù)據(jù)科學(xué)家團(tuán)隊(duì)。大數(shù)據(jù)最終還要是落地,數(shù)據(jù)與場景應(yīng)用結(jié)合發(fā)揮價(jià)值,既需要處理數(shù)據(jù)的技術(shù),又具備足夠的行業(yè)經(jīng)驗(yàn),準(zhǔn)確找到業(yè)務(wù)痛點(diǎn)。
行業(yè)標(biāo)桿客戶面對的業(yè)務(wù)問題一般都會(huì)是最前沿、最具參考價(jià)值的,服務(wù)這類客戶會(huì)讓大數(shù)據(jù)企業(yè)成長,加深對所服務(wù)行業(yè)的理解,這一點(diǎn)是大數(shù)據(jù)公司依靠自身無法提升的,這不是技術(shù)上的突破,而是經(jīng)驗(yàn)上的積累。
第四, 數(shù)據(jù)互聯(lián)。
經(jīng)過這幾年對大數(shù)據(jù)的探索,企業(yè)和大數(shù)據(jù)公司都發(fā)現(xiàn),單一數(shù)據(jù)源價(jià)值度有限,集合多渠道數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)融合能產(chǎn)生更大能量。例如,將電信數(shù)據(jù)放在銀行風(fēng)控業(yè)務(wù)場景,提高了欺詐行為識別率。
因此,很多公司都在提供DMP服務(wù),將自己的第三方數(shù)據(jù)源與企業(yè)客戶的第一方數(shù)據(jù)源對接,但實(shí)際效果并不理想。
原因主要有以下兩點(diǎn):第一,雙方的數(shù)據(jù)源重合度不高;第二,多賬戶歸一做得不好,解決不了同源跨屏問題。前者是因?yàn)閿?shù)據(jù)與應(yīng)用場景不匹配,后者主要是在技術(shù)積累不足,數(shù)據(jù)清洗不到位。
誠然,數(shù)據(jù)互聯(lián)剛剛起步,但能夠打通多個(gè)重要數(shù)據(jù)源的公司最有希望成為獨(dú)角獸。