這么多連接帶來的結果就是數(shù)據(jù)的暴增。大數(shù)據(jù)的時代實際上由萬物互聯(lián)導致,但數(shù)據(jù)也給我們的服務和產(chǎn)品一個學習的機會。從學術研究的角度講,人工智能在過去五六十年里起起伏伏,但真正大規(guī)模的應用是從互聯(lián)網(wǎng)也就是2000年開始的,從2000年-2009年,我把這個時代叫做“潤物細無聲”,因為在互聯(lián)網(wǎng)時代,無論是搜索還是廣告都有大量的人工智能技術,但這些技術主要是一些后臺的技術,不一定那么容易被感知。
我們當前所處的時代,從2010年到2019年我用一個詞叫“于無聲處聽驚雷”,互聯(lián)網(wǎng)行業(yè)很多朋友確實都感到這種轟隆隆的雷聲。大數(shù)據(jù)的產(chǎn)生、計算能力、帶寬、深度學習這種技術的發(fā)展使得AI開始從后臺走到前臺,比如說語音識別,我記得三年前我組建百度語音識別的團隊,我們當時發(fā)現(xiàn)招不到人,我覺得很奇怪,我記得我讀大學的時候不是有很多人在從事語音識別的研究嗎?后來我一打聽,他們?nèi)哭D(zhuǎn)行了。因為在深度學習之前的時代,語音識別看不到希望,大家覺得沒法繼續(xù)做研究,但今天語音識別已經(jīng)是觸手可達,而且發(fā)展非???。包括圖像,包括自然語言的理解,包括機器人的技術都是如此。
從大數(shù)據(jù)到深度學習的人工智能
人工智能技術最近為什么這么受到重視?我覺得最重要的原因是大數(shù)據(jù),第二個原因是計算能力,第三個原因就是深度學習。最頂尖的互聯(lián)網(wǎng)公司在這個領域都有相當投入,百度在深度學習領域可以說是投資最大的公司之一。

為什么深度學習受到重視?首先第一點就是深度學習技術有一個浪漫主義的方面,就是深度學習從機制、行為等方面和大腦有一些關聯(lián)性。這點在媒體強調(diào)得比較多,但從我們的角度來講這反而是最不重要的原因。
第二點是深度學習特別適合大數(shù)據(jù)。一開始深度學習有受到生物神經(jīng)系統(tǒng)的啟發(fā),但隨后的進展主要是因為統(tǒng)計、建模、大數(shù)據(jù)和功能實現(xiàn)。
然后第三點它帶來的是一個思維觀念也就是解決問題方式的改變。過去我們一般先對數(shù)據(jù)做一些預處理,然后通過機器建模的方法去處理數(shù)據(jù),但深度學習帶來的一個改變,就是端到端的學習,希望把原始數(shù)據(jù)放到系統(tǒng)里,中間每個步驟都是用學習的方法去完成。比如說語音識別,它分為好幾個步驟,但這幾個步驟是不是去一致性的優(yōu)化?不一定。但深度學習的目標是去一致性的優(yōu)化最終的目標的。
第四點,也是一個糾正,就是很多人覺得深度學習是一個黑箱系統(tǒng),覺得你不需要太多的了解,只要去用它就好了。實際上深度學習和機器學習一樣,提供的是一套框架,一套語言系統(tǒng)。什么叫語言系統(tǒng)?比如中文就是一套語言系統(tǒng),你要寫出優(yōu)美的文章至少需要兩個條件,第一是你要掌握這種語言,第二是你對生活的感悟。套用在深度學習上也有兩個條件,第一個就是你要有駕馭這個模型和計算的能力,第二個就是對問題要有足夠的了解。
我給大家舉一些例子。深度學習最成功的一個例子是卷及神經(jīng)網(wǎng)絡,他確實和我們對視覺神經(jīng)系統(tǒng)的了解尤其是早期的視覺皮層細胞關系是非常大的。今天我們的深度學習已經(jīng)遠遠超越這些模型的結構。打個比方,他們之間為什么不一樣呢?這就好比研究鳥類如何飛行,但深度學習是像波音公司研究如何造飛機,本質(zhì)上并不一樣,今天我們的飛機可以長得完全不像鳥,更多的是空氣動力學、機械方面的東西。
從統(tǒng)計和計算的角度講,深度學習的原因其實更基礎。一個機器學習系統(tǒng),我們可能對它的誤差的每個來源去做分解,去了解和控制它,從而可以控制整體的預測誤差。一般做機器學習我們會做一些假設,我們知道所有假設都不是完美的,也就是第一個,模型的不完美。第二個問題是數(shù)據(jù)的不完美導致的,比如說數(shù)據(jù)是有限的,有偏的;第三個是計算的不完美。統(tǒng)計學通常關心前兩個問題,但在現(xiàn)實中,比如說我的一個工程師說,老大,我這個問題需要五百臺機器。我說,扯淡,我最多給你五十臺。他說,五十臺的話,我需要算半年。那我說,不行,必須今天晚上算出來。在有限的計算資源下去處理這樣的問題,我們必須要考慮這種計算的不完美。
