互聯(lián)網(wǎng)的發(fā)展使得大數(shù)據(jù)引起人們廣泛關(guān)注?,F(xiàn)如今大數(shù)據(jù)技術(shù)早已滲透到金融、通訊等行業(yè)以及生物學(xué)、物理學(xué)等領(lǐng)域。大數(shù)據(jù)在容量、多樣性和高增速方面的爆炸式增長(zhǎng)全面考驗(yàn)著現(xiàn)代企業(yè)的數(shù)據(jù)處理和分析能力,與此同時(shí)也為各個(gè)行業(yè)帶來了準(zhǔn)確洞察市場(chǎng)行為的機(jī)會(huì)。迄今為止大數(shù)據(jù)技術(shù)與產(chǎn)品有哪些創(chuàng)新,工業(yè)大數(shù)據(jù)應(yīng)用面臨哪些挑戰(zhàn),金融行業(yè)大數(shù)據(jù)應(yīng)用現(xiàn)狀如何等。圍繞這一系列問題,4月27日至28日,由工業(yè)和信息化部指導(dǎo)、中國信息通信研究院主辦的"2016大數(shù)據(jù)產(chǎn)業(yè)峰會(huì)"在北京國際會(huì)議中心盛大召開。
其中,在4月27日下午“大數(shù)據(jù)與城市交通”分論壇上,城市交通節(jié)能減排檢測(cè)與評(píng)估北京市重點(diǎn)實(shí)驗(yàn)室主任、北京交通發(fā)展研究中心副主任溫慧敏發(fā)表了精彩演講。
城市交通節(jié)能減排檢測(cè)與評(píng)估北京市重點(diǎn)實(shí)驗(yàn)室主任、北京交通發(fā)展研究中心副主任溫慧敏
以下為溫慧敏演講實(shí)錄:
溫慧敏:下面我跟大家分享一下交通數(shù)據(jù)在北京的實(shí)踐與展望。在交通領(lǐng)域所謂的大數(shù)據(jù),可能跟我們傳統(tǒng)想到的數(shù)據(jù)有所差別,這個(gè)量其實(shí)沒有那么大,即使是叫大數(shù)據(jù),其實(shí)也沒有那么大。銀行、電信系統(tǒng)數(shù)據(jù)量還沒有那么大。但是為什么叫大數(shù)據(jù),像剛剛很多同行已經(jīng)說了,目前移動(dòng)互聯(lián)網(wǎng)以及電信數(shù)據(jù)能夠給交通使用的數(shù)據(jù),所以我們交通遇到很大的挑戰(zhàn),所以我們傳統(tǒng)交通數(shù)據(jù)通過數(shù)據(jù)積累,我管它叫長(zhǎng)數(shù)據(jù),我們積累了十年和二十年的數(shù)據(jù),這種情況下我們也可以叫做大數(shù)據(jù),盡管它十分鐘、五分鐘或者十五分鐘的時(shí)間量不是很大,但是積累了長(zhǎng)時(shí)間的數(shù)據(jù)量之后數(shù)據(jù)也是非??捎^的,所以我們主題叫做交通大數(shù)據(jù)在北京的實(shí)踐與展望。我想介紹一下北京交通在大數(shù)據(jù)應(yīng)用的情況,另外想介紹交通數(shù)據(jù),特別是大數(shù)據(jù)領(lǐng)域應(yīng)用的一些想法和一些展望。
我想交通的同行可能都比較熟悉我們交通的數(shù)據(jù)包含幾類:
第一個(gè)是交通基礎(chǔ)設(shè)施數(shù)據(jù),包括道路網(wǎng),車輛數(shù)據(jù)庫,以及駕駛員的數(shù)據(jù)庫,這是我們比較基礎(chǔ)的;
另一個(gè)是交通和城市活動(dòng)緊密相關(guān),城市活動(dòng)的數(shù)據(jù),包括人口,土地利用以及社會(huì)經(jīng)濟(jì)發(fā)展都是我們交通研究所必須要的基礎(chǔ)數(shù)據(jù)。同時(shí)現(xiàn)在的城市發(fā)展,以及交通,已經(jīng)和環(huán)境關(guān)系越來越密切,而氣象同時(shí)也會(huì)影響我們交通系統(tǒng)的運(yùn)行,因此交通作為非常開放和復(fù)雜的一個(gè)系統(tǒng),它涉及的社會(huì)活動(dòng),包括社會(huì)經(jīng)濟(jì)、環(huán)境等等方面的數(shù)據(jù)。對(duì)于交通數(shù)據(jù)本身有大量的運(yùn)行數(shù)據(jù),這些運(yùn)行數(shù)據(jù)是每時(shí)每刻都在產(chǎn)生的,而這些產(chǎn)生的數(shù)據(jù)我們能夠?qū)崟r(shí)捕捉到,但是有些還沒有辦法能夠捕捉到。但是目前現(xiàn)在技術(shù)的發(fā)展已經(jīng)使得我們能夠更多的捕捉到這些實(shí)時(shí)運(yùn)行的數(shù)據(jù);
還有一個(gè)我們交通的領(lǐng)域,甚至傳統(tǒng)的社會(huì)經(jīng)濟(jì)發(fā)展領(lǐng)域都很常用的一種方法就是調(diào)查,這種調(diào)查是來源于傳統(tǒng)統(tǒng)計(jì)學(xué)的理論,我們利用一定的抽樣率,利用隨機(jī)的抽樣理論,來使得我們以小的樣本來構(gòu)造我們交通方面的模型。所以我們目前面臨的我總結(jié)出來,主要就是這四大方面數(shù)據(jù)的類型。
目前北京應(yīng)該說在全國各個(gè)城市應(yīng)該數(shù)據(jù)積累做到比較超前的,包括我們流量監(jiān)測(cè)數(shù)據(jù),在2008年之前北京市數(shù)據(jù)起碼五環(huán)內(nèi)基本上快速主干道上基本上做了RBMS流量器,另外北京在2008年奧運(yùn)會(huì)之前把所有出租車都安裝GPS,這樣我們車輛就有了大量車輛定位數(shù)據(jù),而且也是持續(xù)的數(shù)據(jù)相對(duì)目前我們面臨的大數(shù)據(jù)來說是非常干凈規(guī)整的這么一個(gè)數(shù)據(jù)源。另外還有北京的電子收費(fèi)數(shù)據(jù),牌照識(shí)別數(shù)據(jù),事故數(shù)據(jù),當(dāng)然還有移動(dòng)、聯(lián)通、電信的這些數(shù)據(jù)。
另外就是調(diào)查數(shù)據(jù),我們從北京市1986年進(jìn)行軍民出行調(diào)查,詳細(xì)記錄了大概每一戶一天完整的出行日志,這樣分析整個(gè)出行者和城市出行人群的社會(huì)屬性和相互之間的關(guān)系都提供非常好的支撐,當(dāng)然還有城市背景和其他的數(shù)據(jù)。
北京市在數(shù)據(jù)這方面走的比較早,比如第一個(gè)例子就是北京市浮動(dòng)車系統(tǒng)數(shù)據(jù),但是現(xiàn)在目前浮動(dòng)車技術(shù)已經(jīng)相當(dāng)成熟,包括高德導(dǎo)航、百度等等一系列的這些公司,我相信他最起碼是剛實(shí)施這個(gè)導(dǎo)航服務(wù)之初,大部分用的還是浮動(dòng)車的數(shù)據(jù),就是出租車數(shù)據(jù)。出租車最大的優(yōu)點(diǎn)在于它很干凈,比普通的數(shù)據(jù)干凈的多,我們能夠分析他在道路運(yùn)行的數(shù)據(jù)。有了浮動(dòng)車數(shù)據(jù),我們累積了很長(zhǎng)時(shí)間,從2006年到今年的十年的數(shù)據(jù),能夠每時(shí)每刻得到整個(gè)道路狀況,這樣我們把一些發(fā)行路段,無論你怎么篩選原則,都可以得到你想要的東西。