中國IDC圈4月27日報道,互聯(lián)網(wǎng)的發(fā)展使得大數(shù)據(jù)引起人們廣泛關(guān)注?,F(xiàn)如今大數(shù)據(jù)技術(shù)早已滲透到金融、通訊等行業(yè)以及生物學、物理學等領(lǐng)域。大數(shù)據(jù)在容量、多樣性和高增速方面的爆炸式增長全面考驗著現(xiàn)代企業(yè)的數(shù)據(jù)處理和分析能力,與此同時也為各個行業(yè)帶來了準確洞察市場行為的機會。迄今為止大數(shù)據(jù)技術(shù)與產(chǎn)品有哪些創(chuàng)新,工業(yè)大數(shù)據(jù)應用面臨哪些挑戰(zhàn),金融行業(yè)大數(shù)據(jù)應用現(xiàn)狀如何等。圍繞這一系列問題,4月27日至28日,由工業(yè)和信息化部指導、中國信息通信研究院主辦的"2016大數(shù)據(jù)產(chǎn)業(yè)峰會"在北京國際會議中心盛大召開。
其中,在4月27日下午“大數(shù)據(jù)與城市交通”分論壇上,中國聯(lián)通智慧足跡數(shù)據(jù)科技有限公司總經(jīng)理李振軍發(fā)表了精彩演講。
中國聯(lián)通智慧足跡數(shù)據(jù)科技有限公司總經(jīng)理 李振軍
以下是李振軍演講實錄:
李振軍:尊敬的各位嘉賓各位嘉賓大家下午好,我在這里跟大家分享一下國內(nèi)運營商中國聯(lián)通在大數(shù)據(jù)領(lǐng)域的一些實踐和探索。我來自中國聯(lián)通的智慧足跡公司,應該說中國聯(lián)通為了做大數(shù)據(jù)業(yè)務,專門成立一個專業(yè)的大數(shù)據(jù)公司,叫智慧足跡,這個公司有幾個特點:
一是我們擁有中國聯(lián)通所有的數(shù)據(jù),打電話數(shù)據(jù),發(fā)短信數(shù)據(jù),還有上網(wǎng)數(shù)據(jù),以及終端數(shù)據(jù)等等,。在位置這塊因為跟交通有關(guān)系,位置這塊整個交通數(shù)據(jù)特點一個是時間的連續(xù)性,因為GPS數(shù)據(jù)包括互聯(lián)網(wǎng)公司不一定是連續(xù)采集。另外還有一個是空間性的完整性數(shù)據(jù)。中國聯(lián)通數(shù)據(jù)還有一個特點,就是全國集中。2012年中國聯(lián)通就開始把全國大數(shù)據(jù)集聚,這是一個非常大的好處。當然我們中國聯(lián)通數(shù)據(jù)不是只站在自己的角度看,中國聯(lián)通、中國移動、中國電信三大運營商是從用戶群這塊看大數(shù)據(jù)特點,所以在數(shù)據(jù)層面我們希望進行合作。
二是我們的專業(yè)性,我們有專業(yè)產(chǎn)品,專業(yè)團隊、專業(yè)應用。這個產(chǎn)品是什么,歐洲一個非常知名的Smart Steps的技術(shù)產(chǎn)品,國外用了五年左右。接下來我給大家對這個產(chǎn)品做簡單分享。國內(nèi)大數(shù)據(jù)來看,大數(shù)據(jù)基本上是從字面上的東西轉(zhuǎn)化成可視化的東西。但是智慧足跡產(chǎn)品往往是新的項目歸集數(shù)據(jù),建模,看數(shù)據(jù)跑的內(nèi)容。還有就是這個數(shù)據(jù)是否還原了原貌,所以我們就用了這個Smart Steps足跡這個產(chǎn)品。
我們可以看到每條線每個人的駐留和出行數(shù)據(jù)跑下來,QI以及他的傳輸路線做分析?;趧倓偽姨岬降闹袊?lián)通2.8億的數(shù)據(jù),國內(nèi)所有基于位置的寫洞察分析無外乎是人口分析、POI點分析,還有出行路線和出行方式識別分析,大家基本上都是這幾個場景。在這個場景里面我們主要做了哪些場景工作?給大家報告一下,我們定了一個點我們來數(shù)人數(shù),這個情景看起來很簡單,大家知道我們定位是基于小區(qū)的定位,這個是圓形或者是扇形,就會帶來一定的噪音,比如說廣告大屏這面是有效的客戶,背面就是無效客戶,對于他來說就是無效的噪音。傳統(tǒng)方法這個是不可信的,而我們Location加權(quán)質(zhì)心算法來保證數(shù)據(jù)的準確性。
第二個場景就是位置信息大家所用到的POI點,包括他的工作點,以及常去的商圈和活動地點,傳統(tǒng)的運營商做法是基于快照式的,這個時間這個點切入多少作為一個駐留點,而我們是20分鐘和30分鐘以及常月進行動態(tài)分析POI.
第三個點是出行路線選擇,我知道他去哪里,但是對于運營商不知道他到底走哪條路,挑戰(zhàn)很大,我們一個是基于用戶真實經(jīng)過點采集,另外根據(jù)數(shù)據(jù)匹配得出最大方位的路線。
第四塊是智慧足跡分析方式。另外比如我們這次開大會,這次大會的人從哪里來,從哪個市哪個縣來,都可以做外推。
最后一塊是基于運營商策略做小節(jié),我們用了Location邏輯,第二點多基站加權(quán)運算,第三點自動降噪較準定位,我們一個廣東省數(shù)據(jù)一天100億條,我把這個數(shù)據(jù)轉(zhuǎn)化成高價值數(shù)據(jù),我把數(shù)據(jù)就保留出來,我就可以評估五年前和兩年前的數(shù)據(jù),這是非常寶貴的財產(chǎn)。接下來我們還有車效率久,我們可以為用戶保留75%以上的成本。
第四塊我們做城市高速路況監(jiān)測,高速怎么監(jiān)測了路況?現(xiàn)階段高速公路監(jiān)測成本更高,實時成本,還有線路傳輸成本,另外還有維護成本特別大。我們中國聯(lián)通運營商把傳統(tǒng)的手段降到1/50,這個我們一周之內(nèi)就可以把整個效果做出來。這是我們整個算法結(jié)構(gòu),從數(shù)據(jù)沿途路線數(shù)據(jù)采集,到算法模型沿著高速兩端做基站,選完基站測算速度,來可以算出擁堵情況。我們會根據(jù)ETS運營商數(shù)據(jù)可以把現(xiàn)在交通部門監(jiān)測的手段串起來,從而提供更好的為老百姓出行服務。