谷歌公司旗下公司號稱已經(jīng)幫人工智能打通了任督二脈。
3月14日,谷歌公司旗下的人工智能公司DeepMind發(fā)布研究論文,稱其攻破了人工智能(AI)底層記憶技術(shù)上的難題,或?qū)⒛軌蛴?xùn)練AI系統(tǒng)完成多種任務(wù),而不像現(xiàn)在僅具備單項技能。
DeepMind在《美國國家科學(xué)院學(xué)報》(PNAS)上發(fā)表了題為《克服神經(jīng)網(wǎng)絡(luò)中的災(zāi)難性遺忘》(Overcoming Catastrophic Forgetting in Neural Networks)的論文,稱研究人員利用監(jiān)督學(xué)習(xí)和強化學(xué)習(xí),克服了AI研究中神經(jīng)網(wǎng)絡(luò)“災(zāi)難性遺忘”的問題,以拓寬AI系統(tǒng)的應(yīng)用面。也就是說,將來的AI可能不再被用作某一項特定用途,而是能夠在不同任務(wù)之間切換,實現(xiàn)序列學(xué)習(xí)(Sequences Learning)。
“災(zāi)難性遺忘”是認(rèn)知科學(xué)中的術(shù)語,在深度神經(jīng)網(wǎng)絡(luò)設(shè)計里,每一次被提供新的數(shù)據(jù)時,它就會自動覆蓋前一個任務(wù)學(xué)習(xí)到的知識,這是AI技術(shù)中的致命缺陷。
該論文在描述其研究意義時寫道:“深度神經(jīng)網(wǎng)絡(luò)是當(dāng)前解決一系列難題(包括語言翻譯、圖片分類、圖像生成)最成功的機器學(xué)習(xí)技術(shù)。但是,該技術(shù)不能像人類一樣有序地進行多任務(wù)學(xué)習(xí)。在本次研究中,我們提出了一項可行的解決方法,即通過計算已經(jīng)學(xué)習(xí)到的知識的重要性權(quán)重比例,并加以保護,以達到有序訓(xùn)練。”該研究的靈感來自神經(jīng)科學(xué)的突觸整合,促使多學(xué)科的再強化學(xué)習(xí)問題有序進行。
目前,AI技術(shù)還只能針對特定行業(yè)或項目運作,例如用于金融服務(wù)、法律服務(wù)、圍棋比賽等,它們都是獨立分開的系統(tǒng)。一旦DeepMind的研究實現(xiàn)應(yīng)用,AI就能實現(xiàn)跨行業(yè)、跨項目的應(yīng)用,大大提升AI系統(tǒng)的連接和服務(wù)面。
神經(jīng)科學(xué)家認(rèn)為,在人類大腦中,針對特定項目知識的神經(jīng)元之間的重要連接很少發(fā)生變化,這似乎是人類能記住特定項目知識的關(guān)鍵。于是DeepMind的研究人員基于突觸整合理論,創(chuàng)造出一種讓神經(jīng)網(wǎng)絡(luò)記憶的新方式。哺乳動物和人類的大腦固化以往獲得的技能和記憶的理論也對本次研究產(chǎn)生了啟發(fā)。
DeepMind的EWC算法幫助有序訓(xùn)練神經(jīng)網(wǎng)絡(luò)。
神經(jīng)網(wǎng)絡(luò)由多個連接組成,其連接方式與大腦神經(jīng)元的連接方式非常相似。研究人員這次研發(fā)的算法叫“彈性權(quán)重固化”(Elastic Weight Consolidation,EWC),能夠計算出每個連接對該任務(wù)知識的重要性,并賦予數(shù)學(xué)上的權(quán)重比例,再加以保護以免被修改。這種保護的強度與連接的重要性成正比,高權(quán)重賦值將減緩特定連接被改寫的速度。通過這種方式,神經(jīng)網(wǎng)絡(luò)就可以保留原有的知識,并學(xué)習(xí)新的任務(wù)。
“我們已經(jīng)證明能夠有序訓(xùn)練神經(jīng)網(wǎng)絡(luò),這一技術(shù)從前被認(rèn)為是AI研究中的底層技術(shù)限制。”該論文的第一作者,DeepMind研究員James Kirkpatrick說。
通過訓(xùn)練神經(jīng)網(wǎng)絡(luò),研究人員可以將特定項目的專業(yè)知識保留很長一段時間。選擇性地減緩一些知識被改寫的速度,可以做到讓學(xué)習(xí)有序進行。
研究人員讓算法隨機玩10款經(jīng)典的Atari游戲,每一項游戲都必須從零開始學(xué)習(xí)。DeepMind此前已經(jīng)研發(fā)出了一款能夠比人類玩家玩這些游戲玩得更好的AI系統(tǒng),但是只能一次性學(xué)會玩一個游戲。如果它之后學(xué)習(xí)玩另一個游戲,就要從頭再來。
AI學(xué)習(xí)兩項任務(wù)過程的示意圖:使用EWC算法的深層神經(jīng)網(wǎng)絡(luò)能夠?qū)W習(xí)玩一個游戲后,轉(zhuǎn)移到下一個全新的游戲。
這套新的EWC算法能夠一次性學(xué)習(xí)10個游戲,并且其平均水平跟人類水平相當(dāng)。但是研究人員也承認(rèn),其對10個游戲的平均掌握能力,不及從前針對一項游戲?qū)m椨?xùn)練的水平。
不過Kirkpatrick也表示,這項突破是否能夠提升學(xué)習(xí)效率目前尚不明確。
登陸|注冊歡迎登陸本站,認(rèn)識更多朋友,獲得更多精彩內(nèi)容推薦!