2 電信大數(shù)據(jù)分析
電信大數(shù)據(jù)平臺(tái)是一個(gè)提供統(tǒng)一數(shù)據(jù)存儲(chǔ)、分析處理、數(shù)據(jù)服務(wù)的云計(jì)算平臺(tái)。如圖2所示,平臺(tái)需要融合并存儲(chǔ)來(lái)自BSS(B域)和OSS(O域)系統(tǒng)的數(shù)據(jù),提供6種通用數(shù)據(jù)的處理。BSS是商業(yè)支撐系統(tǒng),包括客戶關(guān)系、計(jì)費(fèi)、營(yíng)銷和傳統(tǒng)商業(yè)智能系統(tǒng),記錄用戶的話單、賬單、基礎(chǔ)信息和營(yíng)銷反饋記錄。BSS數(shù)據(jù)特點(diǎn)是量?。s占電信大數(shù)據(jù)總量的3%)、匯總、離線(非實(shí)時(shí)更新)、貼近用戶行為。OSS是網(wǎng)絡(luò)運(yùn)營(yíng)支撐系統(tǒng),包括基站、傳輸、固網(wǎng)和核心網(wǎng)等網(wǎng)絡(luò)單元(CS系統(tǒng)負(fù)責(zé)語(yǔ)音/短信、PS系統(tǒng)負(fù)責(zé)上網(wǎng)流量),記錄大量信令數(shù)據(jù),包括用戶聯(lián)接網(wǎng)絡(luò)體驗(yàn)、互聯(lián)網(wǎng)內(nèi)容和位置信息。OSS數(shù)據(jù)特點(diǎn)是量大(約占電信大數(shù)據(jù)總量97%,主要是位置數(shù)據(jù)和互聯(lián)網(wǎng)內(nèi)容數(shù)據(jù))、精細(xì)、實(shí)時(shí)和貼近網(wǎng)絡(luò)行為。以600萬(wàn)個(gè)活躍用戶為例,每天產(chǎn)生大約14 TB數(shù)據(jù),這些數(shù)據(jù)大部分來(lái)自O(shè)SS,通過(guò)擴(kuò)展,可估算中國(guó)12億用戶每天產(chǎn)生的數(shù)據(jù)量。盡管數(shù)據(jù)來(lái)源不同,但所有數(shù)據(jù)可抽象為六大通用數(shù)據(jù)類型,分別是時(shí)空數(shù)據(jù)、圖數(shù)據(jù)、表數(shù)據(jù)、流數(shù)據(jù)、多媒體數(shù)據(jù)和文本數(shù)據(jù)。建模算法可以面向這六大類通用數(shù)據(jù)類型進(jìn)行設(shè)計(jì)和部署。

圖 2 融合 BSS 和 OSS 數(shù)據(jù)