
圖 10 電信圖數(shù)據(jù)挖掘與社交分析
3.9 隱私保護(hù)
電信數(shù)據(jù)含有用戶的通信行為、消費(fèi)行為、互聯(lián)網(wǎng)行為、社交行為和時(shí)空行為等高隱私信息。隱私保護(hù)是需要考慮的一個(gè)核心技術(shù)。當(dāng)前隱私保護(hù)最有效的方法是差分隱私保護(hù)[5]。差分隱私將數(shù)據(jù)分析人員和分析數(shù)據(jù)隔離,保證攻擊者在有任何背景知識(shí)的情況下,都只能以極小的概率區(qū)分某個(gè)特定用戶是否在數(shù)據(jù)集中。如何將差分隱私保護(hù)緊密地結(jié)合在電信挖掘的算法中是一個(gè)值得研究的課題。從當(dāng)前實(shí)際系統(tǒng)需求分析,另外一個(gè)更加重要的隱私問(wèn)題是防止數(shù)據(jù)濫用技術(shù)的研發(fā)。當(dāng)前數(shù)據(jù)挖掘都是經(jīng)過(guò)用戶授權(quán)使用數(shù)據(jù),但是電信運(yùn)營(yíng)商為了保障數(shù)據(jù)隱私安全,要求分析人員只能在嚴(yán)格控制的內(nèi)網(wǎng)分析匿名數(shù)據(jù),從而隔絕分析人員和分析數(shù)據(jù)。而推薦系統(tǒng)等應(yīng)用需要不斷迭代的特征工程以保證最優(yōu)的挖掘效果,在這種場(chǎng)景下的分析技術(shù)尚不成熟,例如無(wú)法不斷迭代特征工程來(lái)保證推薦系統(tǒng)等應(yīng)用的最優(yōu)挖掘效果。實(shí)際商業(yè)中最緊迫的場(chǎng)景是和第三方合作,即授權(quán)第三方使用數(shù)據(jù)完成某項(xiàng)數(shù)據(jù)挖掘任務(wù)(用戶授權(quán)情況下)時(shí),如何限制分享的數(shù)據(jù)只能被用在這個(gè)特定的數(shù)據(jù)挖掘任務(wù)而不被使用在任何其他場(chǎng)景,即閱后即焚的功能。
4 結(jié)束語(yǔ)
電信大數(shù)據(jù)沉淀于通信管道內(nèi),覆蓋12億中國(guó)用戶,需要運(yùn)營(yíng)商、設(shè)備商和大數(shù)據(jù)產(chǎn)業(yè)鏈共同努力以發(fā)揮其巨大的商業(yè)價(jià)值。本文提出的9個(gè)技術(shù)挑戰(zhàn)中,一部分已經(jīng)有相對(duì)完善的解決方案,但大部分還需要研發(fā)人員和市場(chǎng)人員的努力,在數(shù)據(jù)挖掘和商業(yè)模式方面做進(jìn)一步突破。2014年是中國(guó)電信大數(shù)據(jù)元年,到2015年,電信大數(shù)據(jù)已經(jīng)在用戶洞察、網(wǎng)絡(luò)洞察和數(shù)據(jù)開(kāi)放3個(gè)業(yè)務(wù)方向上積累了不少成功的經(jīng)驗(yàn)。隨著技術(shù)進(jìn)步,電信大數(shù)據(jù)將逐漸釋放巨大的商業(yè)價(jià)值,提升用戶體驗(yàn),降低運(yùn)營(yíng)成本,催熟整個(gè)大數(shù)據(jù)產(chǎn)業(yè)鏈。