6月18日消息,據(jù)國(guó)外媒體報(bào)道,谷歌人工智能技術(shù)團(tuán)隊(duì)DeepMind日前再獲新突破,其可獨(dú)立進(jìn)行一款名為ant
soccer的游戲,DeepMind團(tuán)隊(duì)訓(xùn)練計(jì)算機(jī)在游戲中不斷試錯(cuò),最終像真實(shí)玩家一樣打入了一個(gè)進(jìn)球。
此前,DeepMind開發(fā)的AlphaGo系統(tǒng)擊敗了世界排名第一的圍棋選手李世石,獲得了全世界的關(guān)注。而這次技術(shù)突破也是谷歌人工智能技術(shù)的有力證實(shí)。據(jù)報(bào)道,DeepMind正在將相關(guān)的人工智能技術(shù)市場(chǎng)化。
谷歌DeepMind團(tuán)隊(duì)負(fù)責(zé)人戴維席爾瓦(David
Silver)指出,“我們建立了名為Gorila的分布式強(qiáng)化學(xué)習(xí)系統(tǒng),通過利用谷歌的云平臺(tái),它將對(duì)計(jì)算機(jī)的訓(xùn)練速度提高了一個(gè)數(shù)量級(jí)。目前該系統(tǒng)已經(jīng)被應(yīng)用于谷歌的系統(tǒng)推薦功能中。”
據(jù)悉,強(qiáng)化學(xué)習(xí)往往涉及機(jī)器的不斷試錯(cuò)。谷歌DeepMind團(tuán)隊(duì)將這種方法與深度學(xué)習(xí)算法相結(jié)合,可以訓(xùn)練機(jī)器神經(jīng)網(wǎng)絡(luò)對(duì)新的數(shù)據(jù)進(jìn)行推斷。
此外,席爾瓦還介紹了實(shí)驗(yàn)室的一些最新進(jìn)展,“我們還開發(fā)了關(guān)于連續(xù)控制的相關(guān)技術(shù),涉及對(duì)機(jī)器人的操作和不斷運(yùn)動(dòng),通過確定性策略梯度算法(DPG)解決對(duì)機(jī)器的連續(xù)控制,目前這種算法運(yùn)行良好。通過將異步強(qiáng)化學(xué)習(xí)與層級(jí)控制策略相結(jié)合,在沒有先驗(yàn)數(shù)據(jù)的情況下,可以解決對(duì)諸如螞蟻?zhàn)闱虻扔螒虻倪\(yùn)算。”
席爾瓦稱DeepMind將在未來數(shù)個(gè)月內(nèi)推出開源人工智能應(yīng)用Labyrinth 。(寧宇)
via:cnbc
登陸|注冊(cè)歡迎登陸本站,認(rèn)識(shí)更多朋友,獲得更多精彩內(nèi)容推薦!