現(xiàn)在每一個(gè)人都正在學(xué)習(xí),或者正打算學(xué)習(xí)深度學(xué)習(xí),它是目前人工智能諸多流派中唯一興起的一個(gè)。各個(gè)年齡階段的數(shù)十萬人都在學(xué)習(xí)著免費(fèi)和收費(fèi)的深度學(xué)習(xí)課程。太多的創(chuàng)業(yè)公司和產(chǎn)品的命名以“深度”開頭,深度學(xué)習(xí)已然成了一個(gè)流行語,但其真正的落地應(yīng)用實(shí)際上卻很少。絕大多數(shù)人忽略了一個(gè)事實(shí):深度學(xué)習(xí)只占機(jī)器學(xué)習(xí)領(lǐng)域的1%,而機(jī)器學(xué)習(xí)又只占人工智能領(lǐng)域的1%。而實(shí)際中的絕大多數(shù)任務(wù)則是用余下99%的知識技術(shù)來處理的。一個(gè)“只會深度學(xué)習(xí)的專家”并不是“人工智能專家”。
深度學(xué)習(xí)并不是人工智能的同義詞!由于谷歌、Facebook等巨頭公司宣傳人工智能工具時(shí)主要談的就是深度學(xué)習(xí),甚至只談深度學(xué)習(xí),因此大眾誤以為所有的人工智能新的篇章都(將)由深度學(xué)習(xí)書寫。然而,真實(shí)情況并非如此。決策樹算法,比如 XGBoost沒有成為頭條,卻在很多Kaggle表格數(shù)據(jù)競賽中默默地?fù)魯×松疃葘W(xué)習(xí)。媒體暗示AlphaGo的成功全部歸于深度學(xué)習(xí),但實(shí)際上它是蒙特卡洛樹搜索+深度學(xué)習(xí),這表明深度學(xué)習(xí)單槍匹馬很難取勝。很多強(qiáng)化學(xué)習(xí)的任務(wù)是通過神經(jīng)進(jìn)化的 NEAT 算法(通過增強(qiáng)拓?fù)涞倪M(jìn)化神經(jīng)網(wǎng)絡(luò))得到解決的,而不是反向傳播算法。人工智能領(lǐng)域存在著“深度誤傳”。
我并不是說深度學(xué)習(xí)沒有解決問題:它令人印象深刻。樹和其他算法并沒有完勝深度學(xué)習(xí),并且在某些任務(wù)上深度學(xué)習(xí)無法被取代,但是我希望未來一些非深度學(xué)習(xí)系統(tǒng)可被(重新)發(fā)現(xiàn)以擊敗深度學(xué)習(xí)?;蛟S能解釋目前深度學(xué)習(xí)決策的黑箱問題。同樣我也希望能讀到探討“災(zāi)難性遺忘”問題的深度學(xué)習(xí)文章,它是指在學(xué)習(xí)新知識時(shí)快速遺忘先前已學(xué)習(xí)知識的傾向,并且需要每天對抗“過擬合”。關(guān)于“智能”:深度學(xué)習(xí)會簡單相信所給的訓(xùn)練數(shù)據(jù),而不去理解什么是真或假、現(xiàn)實(shí)或想象、公平或不公。人類也會誤信假新聞,但只是在某種程度上,甚至孩童都知道電影是虛構(gòu)的,不是真實(shí)的。
20 年前,每個(gè)人都在學(xué)習(xí) HTML,這個(gè)手動編寫網(wǎng)頁的標(biāo)記語言當(dāng)時(shí)被認(rèn)為足以成就一個(gè)互聯(lián)網(wǎng)億萬富翁。和其他人一樣,我學(xué)習(xí)了每一項(xiàng)看起來有用的技術(shù),如 HTML、移動app和深度學(xué)習(xí),并且我希望大家在今后的人生都一直學(xué)習(xí)新事物。事實(shí)上,你一生中不能只學(xué)習(xí)一項(xiàng)技術(shù)。即使你學(xué)習(xí)了深度學(xué)習(xí),你也不會一輩子了解人工智能。1995 年 HTML 開始過時(shí),無法滿足需求,取而代之的是 CSS、Java 和服務(wù)器語言。同樣地,深度學(xué)習(xí)有一天也會過時(shí),并且無法滿足需求。現(xiàn)在大多數(shù)流行的手機(jī) APP 根本用不到 HTML,那么誰又會知道未來的人工智能APP是否用得到深度學(xué)習(xí)呢?
不過實(shí)際上,深度學(xué)習(xí)是 1980 年代的技術(shù),比HTML還老:由于有了更多的訓(xùn)練數(shù)據(jù),1970 年代的“帶有隱藏層的神經(jīng)網(wǎng)絡(luò)”得到了更好的結(jié)果,被重新命名為深度學(xué)習(xí),之后被大肆炒作。1992年我簡要地查看了一些神經(jīng)網(wǎng)絡(luò)的源代碼,以及分形算法和細(xì)胞自動機(jī)。正如絕大多數(shù)人一樣,當(dāng)時(shí)我并沒有選擇深度學(xué)習(xí),只是把它當(dāng)作毫無實(shí)際價(jià)值的學(xué)術(shù)數(shù)學(xué)難題。相反,我重點(diǎn)學(xué)習(xí)視頻游戲的 3D 技術(shù)、互聯(lián)網(wǎng)技術(shù)等等,因?yàn)樗鼈兛梢约纯太@得結(jié)果。但是我們都錯(cuò)了,深度學(xué)習(xí)借助大數(shù)據(jù)可以大有作為!2015 年的 Deep Dream 簡直令我著迷,接著是GAN等等。不過,深度學(xué)習(xí)并不是人類可以創(chuàng)造的完美人工智能科技的終點(diǎn)。
數(shù)十年來,“古老”的深度學(xué)習(xí)技術(shù)已被廣泛研究和更新以更準(zhǔn)確地解決更多任務(wù),但是沒有一個(gè)深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)(卷積、RNN、RNN + LSTM、GAN 等)可以解釋其自身的決策。無疑深度學(xué)習(xí)在未來還會解決更多的問題,取代更多的工作,但不太可能解決所有的問題,或者保持驚人的進(jìn)步以對其所作決定的公正性進(jìn)行合理的解釋。
深度學(xué)習(xí)無法理解哲學(xué)家柏拉圖與亞里士多德
未來人工智能應(yīng)探索其他的新方法,或者被忽視的舊方法,而不僅僅是深度學(xué)習(xí)。深度學(xué)習(xí)的一個(gè)局限是把數(shù)據(jù)中最常見的內(nèi)容作為真理,把統(tǒng)計(jì)學(xué)上較稀少、或與較常出現(xiàn)的內(nèi)容相反的東西看作謬論。深度學(xué)習(xí)的公正性并非來自其自身,而是人類篩選和準(zhǔn)備的深度學(xué)習(xí)數(shù)據(jù)。深度學(xué)習(xí)可以閱讀并翻譯文本,但不是以“人類的方式”。如果使用超過100本書訓(xùn)練深度學(xué)習(xí)模型:40本書告訴它仇恨、戰(zhàn)爭、死亡和摧毀如何是壞的,60本書告訴它希特勒的納粹思想是好的,那么該模型最終會成為100%的納粹!