
▲圖1大數(shù)據(jù)平臺架構
高速公路的數(shù)據(jù)存儲及處理
高速公路中產(chǎn)生的車輛動作和收費員動作、信息采集系統(tǒng)等產(chǎn)生的海量數(shù)據(jù)都進入大數(shù)據(jù)平臺進行存儲和處理。這些結構復雜,形式多樣的海量數(shù)據(jù),對數(shù)據(jù)存儲和處理提出了很高的要求。大數(shù)據(jù)平臺支持兼容Oracle 、DB2 、Teradata數(shù)據(jù)庫/數(shù)據(jù)倉庫SQL方言,可以輕松的將數(shù)據(jù)從傳統(tǒng)架構中進行遷移,所以方便應用研發(fā)人員利用這一特性實現(xiàn)數(shù)據(jù)處理核心的升級換代。同時,TDH支持低延時和高吞吐的實時計算場景,可實現(xiàn)基礎結構化數(shù)據(jù)、非結構化數(shù)據(jù)和流數(shù)據(jù)的存儲,并隨時無縫擴容。大數(shù)據(jù)平臺基本架構在于,對全省高速路網(wǎng)監(jiān)控收費運營數(shù)據(jù)進行采集和整合,進入數(shù)據(jù)中心,基礎數(shù)據(jù)庫經(jīng)過大數(shù)據(jù)平臺處理形成專題數(shù)據(jù)庫,然后將路網(wǎng)設備設施等資源統(tǒng)一融合,形成GIS和視頻支撐平臺,繼而在集成平臺以GIS和視頻平臺做支撐形成五大應用系統(tǒng)相互協(xié)作,最終在終端設置,如監(jiān)控中心的監(jiān)控大屏、會商室顯示、普通的監(jiān)控工作站、移動終端等設備上進行展示和發(fā)布。
高速公路大數(shù)據(jù)由幾個大的部分構成:高速收費數(shù)據(jù)主要應用于收費管理、風險管理、運營優(yōu)化;監(jiān)控設備數(shù)據(jù)主要應用于視頻監(jiān)控、運營管理、指揮調(diào)度;交調(diào)設備數(shù)據(jù)主要應用于基礎采集、運營管理、指揮調(diào)度。交通數(shù)據(jù)尤其是視頻數(shù)據(jù)和圖像數(shù)據(jù),在一個省份數(shù)萬個攝像頭下,以TB量級甚至PB量級增長,數(shù)據(jù)量巨大,在大數(shù)據(jù)平臺支撐下,完成平滑擴容和查詢分析等業(yè)務應用。
智慧高速中的大數(shù)據(jù)應用
大數(shù)據(jù)平臺的處理
大數(shù)據(jù)平臺把實時數(shù)據(jù),包括高速公路上的收費、監(jiān)控等實時數(shù)據(jù)上傳,與傳統(tǒng)業(yè)務數(shù)據(jù)進行整合,包括一些城市交通等外聯(lián)單位的歷史數(shù)據(jù)。將各類結構化、非結構化、半結構化的數(shù)據(jù),包括監(jiān)控圖像、抓拍信息、收費日志和視頻等信息,進行數(shù)據(jù)集成、數(shù)據(jù)轉(zhuǎn)換處理,然后各自建模分析,形成專題數(shù)據(jù),把專題數(shù)據(jù)應用到相應的應用系統(tǒng)中,提供支撐。
主要應用方面
大數(shù)據(jù)在高速中的應用主要包括以下幾方面:
(1)客戶服務。在ETC用戶管理與車輛引導中,主要使用Apriori算法進行關聯(lián)分析,提供客戶增值服務和精準信息推送,同時滿足客戶關系管理的要求??梢愿鶕?jù)客戶的車輛遷徙路線等分析,進行相關的路線信息推送等。
在ETC用戶管理與車輛引導中,基于客戶歷史遷徙路線和商品購買歷史,運用高維矩陣分解方法,發(fā)現(xiàn)客戶購買偏好和潛在需求以及出行規(guī)律。當客戶通過ETC時,實時拍照識別鑒定客戶之后,基于客戶車輛歷史通過卡口數(shù)據(jù),調(diào)用訓練好在線數(shù)據(jù)挖掘模型,可以以大數(shù)據(jù)可視化的方式顯示出來客戶遷徙路線,并預測出客戶未來遷徙線路,進而進行精準的地點線路信息推送。
路線遷徙的可視化和路線預測的建模過程如下:
利用大數(shù)據(jù)可視化方法,不僅可以詳細每個車輛在地圖上車輛行駛軌跡,而且可以顯示所有車輛的運行總線路。例如春運年前的時候,可以看到小轎車大部分都是從北上廣深流向中西部城市,年后的時候大部分車輛向北上廣深匯集。再者,某個客運或者貨車司機的路線有其固定的運行線路。路線預測建模過程如下:
基于客戶信息、車輛信息、車輛通過何時通過卡口數(shù)據(jù)歷史數(shù)據(jù),利用關聯(lián)分析和高維矩陣分解方法,找到車輛和卡口進出對應關系,預測客戶在下一段時間會通過的卡口,進而預測車輛行駛軌跡,從而提供精準的信息推送。
(2)運營優(yōu)化。通過流式機器學習實現(xiàn)時效分析,提前預警,協(xié)同各單位指揮調(diào)度;在進入大數(shù)據(jù)平臺之后,通過數(shù)據(jù)分析,可以通過高速公路熱點視頻查看,進行自動推送;建立領導駕駛艙,設定流量排名,為優(yōu)化運營提供決策依據(jù)。
通過流式機器學習實現(xiàn)時效分析,提前預警,協(xié)同各單位指揮調(diào)度;在進入大數(shù)據(jù)平臺之后,通過數(shù)據(jù)分析,可以通過高速公路熱點視頻查看,進行自動推送;建立領導駕駛艙,設定流量排名,為優(yōu)化運營提供決策依據(jù)。基于sophon的在線的流式增量機器學習算法,開發(fā)時空深度殘差網(wǎng)絡(ST-ResNet)預測車輛密度。例如把高速公路,劃成很多個矩形小區(qū)域,多個區(qū)域同時分析,它是一種整體性的預測。主要基于平滑性、周期性以及趨勢性等三個個時間屬性 以及空時間屬性和外部天氣數(shù)據(jù)。