比如說(shuō)數(shù)據(jù)拼接,其實(shí)我們有不同來(lái)源的數(shù)據(jù),任何一家都不可能擁有所有的數(shù)據(jù),我們會(huì)有不同的數(shù)據(jù),來(lái)自于我們采集的數(shù)據(jù),爬蟲(chóng)的數(shù)據(jù),來(lái)自于互聯(lián)

網(wǎng)公司各種各樣的,包括APP的數(shù)據(jù),包括RTB的數(shù)據(jù),包括行業(yè)數(shù)據(jù)。但是這些數(shù)據(jù)他們的質(zhì)量不一,表示方法也不一樣,特別是他們?nèi)狈苡行У慕y(tǒng)一標(biāo)識(shí),怎么樣能夠通過(guò)有效的技術(shù)手段去把不同的數(shù)據(jù)有效的拼接起來(lái),我覺(jué)得這是大數(shù)據(jù)面臨的一個(gè)關(guān)鍵問(wèn)題,我們?cè)谶@方面也進(jìn)行了探索。

第二個(gè)問(wèn)題是深度標(biāo)簽技術(shù),包括以前的互聯(lián)網(wǎng)廣告里面也會(huì)給每個(gè)人做畫像,也會(huì)給每個(gè)人打標(biāo)簽,但這樣的標(biāo)簽通常意義來(lái)講都是比較淺層次的標(biāo)簽,我看了什么網(wǎng)頁(yè),我可能關(guān)注了什么商品。我覺(jué)得大數(shù)據(jù)未來(lái)的發(fā)展可能我們需要去挖掘用戶行為背后的東西,比如說(shuō)真正的消費(fèi)意識(shí)是什么,你的消費(fèi)能力是什么,你在某一個(gè)事情上的偏好是什么等等,隱藏在大量日常行為背后的東西,甚至是你的一些動(dòng)機(jī),你的一些模式,我們希望把這些東西通過(guò)我們的大數(shù)據(jù)技術(shù)算法提取出來(lái),我們稱之為深度標(biāo)簽技術(shù)。