本文所指的通用人工智能,便是可以處理通用任務的人工智能。 具體而言,我認為通用人工智能應包括以下三大特點或者說難點:
- 通用任務:既能唱歌繪畫、又能下棋寫詩,最重要的是要盡量減少對
領域知識
( Domain Knowledge )的依賴。 - 學習能力:無論是通過邏輯推理的
演繹法
來學習,或者是基于經驗和記憶的歸納法
來學習,都要通過學習來提高處理通用任務的適用性。 - 自省能力:也可以說是關于學習的學習,即
元認知
,通過自省來糾偏行為。就像泰勒展開一樣,我們大可以用低階導數來逼近函數值,而無需考慮元認知的元認知這類高階導數。
解決之道
David Silver(Alpha Go的第一作者)曾在ICML2016的 Tutorial: Deep Reinforcement Learning 講到深度增強學習的前景
General Intelligence = Reinforcement Learning + Deep Learning = Deep Reinforcement Learning – David Silver
更進一步,『Reinforcement Learning defines the objective』(RL中有什么樣的映射關系),『Deep Learning gives the mechanism』(DL如何學習給定的映射關系)。 我很同意深度增強學習便是解決通用人工智能難點的核心。 首先關于通用任務,幾乎任何任務的解決都可以看做一個從形式編碼的輸入到決策分布輸出的映射,而非線性的神經網絡便是很好的 表征
( representation )學習工具。其次,學習能力主要可分為演繹法和歸納法。增強學習就像是基于獎賞的演繹法,給定外界環(huán)境和相應的獎賞函數,我們最終產生合法的決策出來。深度學習就像是基于經驗以及記憶的歸納法,給定輸入輸出,然后通過神經網絡來學習表征。最后關于自省能力,這也是人工智能可以產生自我意識、并獨立于人類存在的關鍵。自省從某種程度可以從增強學習來習得,通過不斷試錯以及獎賞,『增強/強化』自我的決策。但這種自省又受限于其存在的世界觀,就像二維線段只能盲人摸象般地觀測到三維球體,而三維球體卻可以完整地觀測二維線段。但總之,只要定義好了世界以及獎賞,我認為相應的自省能力就是在給定環(huán)境下不斷優(yōu)化自己的學習能力(即一階導數大于零)。