計算機(jī)在解決各種智能問題上的進(jìn)步幅度并不大,但是十幾年量的積累,最終促成了質(zhì)變。
這個時代屬于大數(shù)據(jù)
簡單地講,當(dāng)時無論是做語音識別、機(jī)器翻譯、圖像識別,還是自然語言理解的學(xué)者,分成了界限很明確的兩派,一派堅持采用傳統(tǒng)的人工智能方法解決問題,簡單來講就是模仿人,另一派在倡導(dǎo)數(shù)據(jù)驅(qū)動方法。這兩派在不同的領(lǐng)域力量不一樣,在語音識別和自然語言理解領(lǐng)域,提倡數(shù)據(jù)驅(qū)動的派比較快地占了上風(fēng);而在圖像識別和機(jī)器翻譯方面,在較長時間里,數(shù)據(jù)驅(qū)動這一派處于下風(fēng)。
這里面主要的原因是,在圖像識別和機(jī)器翻譯領(lǐng)域,過去的數(shù)據(jù)量非常少,而這種數(shù)據(jù)的積累非常困難。圖像識別就不用講了,在互聯(lián)網(wǎng)出現(xiàn)之前,沒有一個實驗室有上百萬張圖片。在機(jī)器翻譯領(lǐng)域,所需要的數(shù)據(jù)除了一般的文本數(shù)據(jù),還需要大量的雙語(甚至是多語種)對照的數(shù)據(jù),而在互聯(lián)網(wǎng)出現(xiàn)之前,除了《圣經(jīng)》和少量聯(lián)合國文件,再也找不到類似的數(shù)據(jù)了。
在 20 世紀(jì) 90 年代互聯(lián)網(wǎng)興起之后,數(shù)據(jù)的獲取變得非常容易。從 1994 年到 2004 年的 10 年里,語音識別的錯誤率減少了一半,而機(jī)器翻譯的準(zhǔn)確性提高了一倍,其中 20% 左右的貢獻(xiàn)來自方法的改進(jìn),80% 則來自數(shù)據(jù)量的提升。雖然在每一年,計算機(jī)在解決各種智能問題上的進(jìn)步幅度并不大,但是十幾年量的積累,最終促成了質(zhì)變。
數(shù)據(jù)驅(qū)動方法從 20 世紀(jì) 70 年代開始起步,在八九十年代得到緩慢但穩(wěn)步的發(fā)展。進(jìn)入 21 世紀(jì)后,由于互聯(lián)網(wǎng)的出現(xiàn),使得可用的數(shù)據(jù)量劇增,數(shù)據(jù)驅(qū)動方法的優(yōu)勢越來越明顯,最終完成了從量變到質(zhì)變的飛躍。如今很多需要類似人類智能才能做的事情,計算機(jī)已經(jīng)可以勝任了,這得益于數(shù)據(jù)量的增加。
全世界各個領(lǐng)域數(shù)據(jù)不斷向外擴(kuò)展,漸漸形成了另外一個特點,那就是很多數(shù)據(jù)開始出現(xiàn)交叉,各個維度的數(shù)據(jù)從點和線漸漸連成了網(wǎng),或者說,數(shù)據(jù)之間的關(guān)聯(lián)性極大地增強(qiáng),在這樣的背景下,就出現(xiàn)了大數(shù)據(jù)。
智能手機(jī)和互聯(lián)網(wǎng)將繼續(xù)改變世界
大數(shù)據(jù)的時效性其實不是必需的,但是有了時效性可以做到很多過去做不到的事情,城市的智能交通管理便是一個例子。在智能手機(jī)和智能汽車(特斯拉等)出現(xiàn)之前,世界上的很多大城市雖然都有交通管理(或者控制)中心,但是它們能夠得到的交通路況信息最快也有 20 分鐘滯后。如果沒有能夠跟蹤足夠多的人出行情況的實時信息的工具,一個城市即使部署再多的采樣觀察點,再頻繁地報告各種交通事故和擁堵的情況,整體交通路況信息的實時性也不會比 2007 年有多大改進(jìn)。
但是,在能夠定位的智能手機(jī)出現(xiàn)后,這種情況得到了根本的改變。由于智能手機(jī)足夠普及并且大部分用戶開放了他們的實時位置信息(符合大數(shù)據(jù)的完備性),使得做地圖服務(wù)的公司,比如 Google 或者百度,有可能實時地得到任何一個人口密度較大的城市的人員流動信息,并且根據(jù)其流動的速度和所在的位置,很容易區(qū)分步行的人群和行進(jìn)的汽車。
由于收集信息的公司和提供地圖服務(wù)的公司是一家,因此從數(shù)據(jù)采集、數(shù)據(jù)處理,到信息發(fā)布中間的延時微乎其微,所提供的交通路況信息要及時得多。使用過 Google 地圖服務(wù)或者百度地圖服務(wù)的人,對比六七年前,都很明顯地感到了其中的差別。當(dāng)然,更及時的信息可以通過分析歷史數(shù)據(jù)來預(yù)測。一些科研小組和公司的研發(fā)部門,已經(jīng)開始利用一個城市交通狀況的歷史數(shù)據(jù),結(jié)合實時數(shù)據(jù),預(yù)測一段時間以內(nèi)(比如一個小時)該城市各條道路可能出現(xiàn)的交通狀況,并且?guī)椭鲂姓咭?guī)劃最好的出行路線。
仔細(xì)推敲英語中 bigdata 這種說法,我們不得不承認(rèn)這個提法非常準(zhǔn)確,它最重要的是傳遞了一種信息——大數(shù)據(jù)是一種思維方式的改變?,F(xiàn)在的數(shù)據(jù)量相比過去大了很多,量變帶來了質(zhì)變,思維方式、做事情的方法就應(yīng)該和以往有所不同。這其實是幫助我們理解大數(shù)據(jù)概念的一把鑰匙。在有大數(shù)據(jù)之前,計算機(jī)并不擅長解決需要人類智能來解決的問題,但是今天這些問題換個思路就可以解決了,其核心就是變智能問題為數(shù)據(jù)問題。由此,全世界開始了新的一輪技術(shù)革命——智能革命。