提到政策,大數(shù)據(jù)可以做的事情就更多了,比如反腐,我們有金融大數(shù)據(jù),現(xiàn)在打虎的成本蠻高的,現(xiàn)在的反腐都是主動的。很多腐敗的事件和案例,貪污受賄不會放在自己的名下,如果我們把人口的數(shù)據(jù)融合上,把行政的數(shù)據(jù),通過家人或者秘書會發(fā)現(xiàn),把工程項目的數(shù)據(jù)跟他融合在一起,可能會有更好的監(jiān)測。前段時間我們給一個政府去做多源數(shù)據(jù)的融合,他是綜合治理部門,他的數(shù)據(jù)融合的渠道有很多,和垂直系統(tǒng)的交換,還有網(wǎng)絡(luò)信息采集、共享平臺的交換,現(xiàn)在的系統(tǒng)越來越多,不同的系統(tǒng)中數(shù)據(jù)如何來共享和對接,還有空間的數(shù)據(jù),有些社區(qū)的臺賬,社區(qū)的基層工作人員報的數(shù)據(jù)可能不是網(wǎng)絡(luò)的,就像我們在銀行填申請單一樣紙版的數(shù)據(jù),包括移動終端采集的數(shù)據(jù)。對這些數(shù)據(jù)驅(qū)做建模和整理。
對于一個企業(yè)來講,我們的數(shù)據(jù)包括三方面,我們自有的數(shù)據(jù)、我們購買合作的數(shù)據(jù)和交易的數(shù)據(jù)、公開信息來源的數(shù)據(jù),把這些不同類型的數(shù)據(jù)融合在一起,這是電子商務(wù)里的一些交易數(shù)據(jù)的融合,歷史的信息、檢索日志的信息、上網(wǎng)行為的信息、地址的信息?,F(xiàn)在大部分電子商務(wù)公司還是不去搜集你的收貨信息,如果搜集這種信息的話用戶畫像就更清楚了,現(xiàn)在可以知道你什么時候在單位什么時候在家,這些數(shù)據(jù)是可以分析的。整個的多源數(shù)據(jù)融合,從理論方面有這樣一些。D-S證據(jù)和深度學(xué)習(xí)的算法,去處理一些重名的情況,對技術(shù)的問題實現(xiàn)歷史數(shù)據(jù)和外部數(shù)據(jù)的融合,線上線下的融合、傳感器硬數(shù)據(jù)與軟數(shù)據(jù)的結(jié)合,實現(xiàn)這樣一些應(yīng)用,這是整個的體系。
多源數(shù)據(jù)融合整體上是實踐驅(qū)動的領(lǐng)域,和大數(shù)據(jù)一樣。社會人文的數(shù)據(jù)和物理信號的數(shù)據(jù)同樣重要,商務(wù)領(lǐng)域更加重視多源信息進(jìn)行交叉印證與關(guān)聯(lián)分析。我的演講就到這里,謝謝!