電信大數(shù)據(jù)核心資產(chǎn)是海量用戶的7個(gè)維度信息。如圖3所示,這些數(shù)據(jù)可以支撐對內(nèi)和對外服務(wù)優(yōu)化,如全生命周期的用戶管理和基于位置的服務(wù)。用戶洞察的核心是圍繞用戶回答7個(gè)W的問題:who(用戶ID)、when(時(shí)間)、where(空間)、what(行為結(jié)果)、how(行為過程)、why(行為根本原因)、Web(社交)。通過7D用戶數(shù)據(jù)建模實(shí)現(xiàn)7W洞察是電信大數(shù)據(jù)分析的核心需求。

圖 3 7 維度用戶數(shù)據(jù)建模和 7W 洞察
大數(shù)據(jù)時(shí)代,建模思維逐漸從研究各種映射算法到研究數(shù)據(jù)本身,如從豐富的數(shù)據(jù)中抽取更加合理的特征表示、從數(shù)據(jù)中根據(jù)業(yè)務(wù)規(guī)則自動(dòng)定義標(biāo)簽和訓(xùn)練數(shù)據(jù)以及利用用戶營銷反饋數(shù)據(jù),自動(dòng)化整個(gè)營銷流程等。從數(shù)據(jù)出發(fā),尋求合適、好用的算法是建模的核心。清晰定義訓(xùn)練數(shù)據(jù),熟悉業(yè)務(wù)流程,才能將挖掘算法的價(jià)值發(fā)揮到最大。用戶和基站聯(lián)接行為將BSS和OSS數(shù)據(jù)打通,因此通用的用戶模型可以用二分圖表示,即一層節(jié)點(diǎn)是用戶,另一層節(jié)點(diǎn)是網(wǎng)絡(luò),兩層節(jié)點(diǎn)之間的邊表示用戶聯(lián)接網(wǎng)絡(luò)的時(shí)間??傮w而言,可以通過電信大數(shù)據(jù)的二分圖表示實(shí)現(xiàn)用戶洞察、網(wǎng)絡(luò)洞察和數(shù)據(jù)開放3個(gè)業(yè)務(wù)目標(biāo)。