現(xiàn)在每一個人都在學習,或者正打算學習深度學習(DL),它是目前人工智能諸多流派中唯一興起的一個。各個年齡階段的數(shù)十萬人學習著免費和收費的深度學習課程。太多的創(chuàng)業(yè)公司和產品的命名以「深度」開頭,深度學習已然成了一個流行語,但其真正使用實際上很少。絕大多數(shù)人忽略了深度學習只占機器學習領域的 1%,而機器學習又只占到了人工智能領域的 1%。余下的 99% 則被用來處理實踐中的絕大多數(shù)任務。一個深度學習專家無法與人工智能專家劃上等號。
深度學習并不是人工智能的同義詞。谷歌、Facebook 等巨頭公司宣傳最多的人工智能工具主要是或者僅僅是深度學習,因此大眾誤以為所有的人工智能突破都(將)由深度學習實現(xiàn)。真實情況并非如此。決策樹比如 XGBoost 不會成為頭條,但卻在很多 Kaggle 表格數(shù)據(jù)競賽中低調地擊敗了深度學習。媒體暗示 AlphaGo 的成功全部歸于深度學習,但實際上它是蒙特卡洛樹搜索+深度學習,這表明深度學習單槍匹馬很難取勝。很多強化學習的任務通過神經(jīng)進化的 NEAT 而不是反向傳播得到解決。人工智能領域存在著「深度誤傳」(deep misinformation)。
我并不是說深度學習沒有解決問題:它令人印象深刻。樹和其他算法并沒有完勝深度學習,某些任務上深度學習無法被取代,但是我希望未來一些非深度學習系統(tǒng)可被(重新)發(fā)現(xiàn)以擊敗深度學習,并解決了目前無法解釋的黑箱問題。同樣我也希望讀到有關「災難性遺忘」的深度學習文章,它是指在學習新知識時快速遺忘先前已學習知識的傾向,并且需要每天對抗「過擬合」。關于「智能」:深度學習只是簡單地相信給到的訓練數(shù)據(jù),而不管什么是真與假,現(xiàn)實與想象,公平與不公。人類也會誤信假新聞,但只是在某種程度上,甚至孩童都知道電影是虛構的、不真實的。
關于更多細節(jié),如果你有時間了解,請見我的詳述文章:https://www.linkedin.com/pulse/ai-deep-learning-explained-simply-fabio-ciucci。
20 年前,每個人都在學習 HTML,這個手動寫網(wǎng)頁的標記語言當時被認為足以成就一個億萬富翁。我學習每一項看起來有用的技術,如 HTML、手機 app 和深度學習,并且邀請其他人一些學習。事實上,你一生中不是只學習一次技術。1995 年 HTML 開始過時,無法滿足需求,取而代之的是 CSS、JavaScript 和服務器語言。同樣地,深度學習有一天也會過時。大多數(shù)流行的手機 APP 根本用不到 HTML,那么,誰又會知道未來的人工智能 APP 用不用得到深度學習呢?
實際上,深度學習是 1980 年代的技術,比 HTML 還老:由于有了更多的訓練數(shù)據(jù),1970 年代的「帶有隱藏層的神經(jīng)網(wǎng)絡」獲得新生,重新命名為深度學習之后被大肆炒作。1992 年我扼要地查看了神經(jīng)網(wǎng)絡以及分形分析(fractal)和細胞自動機的源代碼。正如絕大多數(shù)人一樣,當時我并沒有選擇深度學習,只是把它當作毫無實際價值的學術數(shù)學難題。相反,我聚焦于視頻游戲的 3D 技術,因為它可以即刻獲得結果;后來我又開始關注互聯(lián)網(wǎng)等。但是我們都錯了,深度學習借助大數(shù)據(jù)可以大有作為。2015 年 Deep Dream 簡直令我著迷,接著是 GANs 等。但是,深度學習并不是人類可以創(chuàng)造的人工智能科技的終點。
數(shù)十年來,「古老」的深度學習技術已被廣泛研究和更新以更準確地解決更多任務,但是沒有一個深度學習網(wǎng)絡(卷積、RNN、RNN + LSTM、GANs 等)可以解釋其自身的決策。無疑深度學習還會解決更多的問題,取代更多的工作,但不太可能解決所有的問題,或者保持驚人的進步以自我解決黑箱問題或者為之正名。
哲學家柏拉圖與亞里士多德:深度學習無法理解他們
未來人工智能應探索其他的新方法,或者已存在卻被忽視的方法,而不僅僅是深度學習。深度學習的一個局限是把數(shù)據(jù)中最常遇見的內容作為真理,把統(tǒng)計學上較稀少的東西看作假的。深度學習的公正性并非來自其自身,而是人類篩選和準備的數(shù)據(jù)。深度學習可以閱讀并翻譯文本,但不是以人類的方式。如果使用超過 100 本書訓練深度學習模型:40 本書告訴仇恨、戰(zhàn)爭、死亡和摧毀如何是壞的,60 本書告訴希特勒的納粹思想是好的,那么該模型最終會成為 100% 的納粹!