提問:這個(gè)數(shù)據(jù)量很大,以省份為試點(diǎn)?
楊明川:對(duì),但是我相信這種研究我們做的數(shù)據(jù)量已經(jīng)足夠大了,做這種研究我們一定要把全國所有人都拿出來做分析,這個(gè)沒有必要,一個(gè)城市的數(shù)據(jù)價(jià)值做出來的結(jié)果已經(jīng)足夠好了。比如我在一個(gè)城市做的話,這個(gè)人口量級(jí)可能是百萬級(jí),千萬級(jí)的。數(shù)據(jù)拼接的時(shí)候我們有一個(gè)ID關(guān)聯(lián),我們會(huì)把不同ID提取出來,做一個(gè)映射關(guān)系。比如說移動(dòng)網(wǎng)里面有一些ID的特征,打個(gè)比方,跟手機(jī)相關(guān)的一些信息,在固網(wǎng)里面會(huì)有另外的特征,比如他其他的帳號(hào)等等,其他ID的特征,這個(gè)特征和移動(dòng)網(wǎng)的一些特征做匹配,謝謝大家。
注:本文摘自數(shù)據(jù)觀入駐自媒體—燈塔大數(shù)據(jù)