對(duì)于Andrew Ng,大家最熟悉的事件可能是他在谷歌期間借助深度學(xué)習(xí)讓機(jī)器通過(guò)對(duì)數(shù)百萬(wàn)份 YouTube 視頻的學(xué)習(xí)自行掌握了“貓”的概念,這成為世界深度學(xué)習(xí)領(lǐng)域廣為人知的成功案例之一,也成為對(duì)谷歌人工神經(jīng)網(wǎng)絡(luò)“DistBelief”的一次有力驗(yàn)證。
80 年代初期,當(dāng)時(shí)的人工智能研究都在試圖尋找捷徑,希望可以繞過(guò)人腦神經(jīng)網(wǎng)絡(luò)來(lái)直接模擬出行為,而不是試圖通過(guò)模仿大腦運(yùn)作來(lái)實(shí)現(xiàn)。但有兩位技術(shù)牛人一直堅(jiān)持研究模擬神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí),最終他們的算法得到了全球人工智能界和科技公司的關(guān)注和重視,他們就是深度學(xué)習(xí)的領(lǐng)軍人物、后來(lái)分別被谷歌和Facebook招致麾下的Hinton 和 LeCun。Andrew Ng在大學(xué)時(shí)期曾經(jīng)一度放棄了人工智能的研究,直到后來(lái)被Jeff Hawkins(Palm創(chuàng)始人,《人工智能的未來(lái)》作者)的HTM算法(意思是人類(lèi)智能來(lái)源于這個(gè)單一算法)所影響,重新開(kāi)始了對(duì)人工智能的研究,而他的研究方向一直是深度學(xué)習(xí)。
如今,已經(jīng)轉(zhuǎn)投百度的Andrew Ng在不久前的百度世界大會(huì)上再次強(qiáng)調(diào)了深度學(xué)習(xí)對(duì)人工智能的重要意義。從目前看來(lái),深度學(xué)習(xí)是實(shí)現(xiàn)人工智能最有效、也是取得成效最大的實(shí)施方法。Andrew Ng在演講中提到目前百度大腦的新算法就是屬于深度學(xué)習(xí),他雖然沒(méi)有具體指明該算法的領(lǐng)先程度,但卻強(qiáng)調(diào)了其在處理數(shù)據(jù)方面比傳統(tǒng)人工智能算法存在的優(yōu)越性,并可以使人工智能實(shí)現(xiàn)一種正循環(huán)。
2、奇點(diǎn)臨近——人工智能的正循環(huán)
人工智能的正循環(huán)是Andrew Ng演講中的核心要點(diǎn),在擁有深度學(xué)習(xí)算法之后,將不再懼怕海量數(shù)據(jù),反而會(huì)因?yàn)閿?shù)據(jù)的增長(zhǎng)而取得更好的效果,而這些效果將直接體現(xiàn)在圖像搜索、語(yǔ)音識(shí)別等具體的互聯(lián)網(wǎng)服務(wù)中,從而為用戶(hù)提供更好服務(wù)并吸引更多用戶(hù),這又會(huì)產(chǎn)生更多數(shù)據(jù)。
“人工智能正循環(huán)”的確令人興奮,但人工智能技術(shù)發(fā)展了幾十年,為何恰恰在今天有條件實(shí)現(xiàn)正循環(huán)?我在文章搜索引擎到人工智能的終極演進(jìn)提到了搜索引擎到人工智能演進(jìn)的幾個(gè)重點(diǎn)條件,包括搜素引擎積累的戰(zhàn)略數(shù)據(jù)、模擬神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí),從Andrew Ng的演講中已經(jīng)證實(shí)了這兩個(gè)條件的成熟,他提到“百度有海量數(shù)據(jù)”以及“百度大腦的新算法”。還有一個(gè)重要條件是“技術(shù)奇點(diǎn)的出現(xiàn)”,指在積累數(shù)據(jù)的前提下,硬件存儲(chǔ)、超級(jí)計(jì)算和模擬神經(jīng)網(wǎng)絡(luò)等相關(guān)技術(shù)的成熟。
庫(kù)茲韋爾在《奇點(diǎn)臨近》一書(shū)中提到,奇點(diǎn)思想是:人類(lèi)創(chuàng)造技術(shù)的節(jié)奏正在加速,技術(shù)的力量也正以指數(shù)級(jí)得速度在增長(zhǎng)。指數(shù)級(jí)的增長(zhǎng)是具有迷惑性的,它始于極微小的增長(zhǎng),隨后又以不可思議的速度爆炸式地增長(zhǎng)。
對(duì)于人工智能來(lái)說(shuō),深度學(xué)習(xí)的出現(xiàn)就是這樣一個(gè)奇點(diǎn)。面對(duì)海量數(shù)據(jù),深度學(xué)習(xí)算法可以做到傳統(tǒng)人工智能算法無(wú)法做到的事情,而且輸出結(jié)果會(huì)隨著數(shù)據(jù)處理量的增大而更加準(zhǔn)確。
傳統(tǒng)機(jī)器學(xué)習(xí)是通過(guò)標(biāo)記數(shù)據(jù)和有監(jiān)督學(xué)習(xí),這意味著,如果想讓機(jī)器學(xué)會(huì)如何識(shí)別某一特定對(duì)象,就必須人為干預(yù)對(duì)樣本進(jìn)行標(biāo)注,也就是說(shuō),隨著其所需處理數(shù)據(jù)量的增大,外界對(duì)其的支持和幫助也就更大,而且計(jì)算結(jié)果的準(zhǔn)確性也會(huì)受到影響。因此,對(duì)于這種傳統(tǒng)算法,越來(lái)越多的數(shù)據(jù)將成為負(fù)擔(dān),也更容易達(dá)到極限或產(chǎn)生錯(cuò)誤結(jié)果。但深度學(xué)習(xí)是從未經(jīng)標(biāo)記的數(shù)據(jù)展開(kāi)學(xué)習(xí),這更接近人腦的學(xué)習(xí)方式,可以通過(guò)訓(xùn)練之后自行掌握概念,這將大幅度提高計(jì)算機(jī)處理信息的效率。王威廉在《國(guó)際機(jī)器學(xué)習(xí)大會(huì)ICML2013參會(huì)感想》提到:“用半監(jiān)督或無(wú)監(jiān)督學(xué)習(xí)方法挖掘無(wú)標(biāo)簽的數(shù)據(jù),不僅是過(guò)去10年,還很可能是大數(shù)據(jù)時(shí)代的一個(gè)熱點(diǎn)。”拿機(jī)器視覺(jué)舉例,機(jī)器學(xué)習(xí)是通過(guò)構(gòu)建多層類(lèi)似人類(lèi)視覺(jué)神經(jīng)系統(tǒng)的算法使機(jī)器自行明白物體整體的形態(tài),而傳統(tǒng)的人工智能算法往往需要工程師人工輸入物體視覺(jué)或者聲音的信息,然后由機(jī)器學(xué)習(xí)算法來(lái)處理這些信息數(shù)據(jù)。