大名鼎鼎的AlphaGo Zero想必大家都知道,而最近它的研發(fā)團(tuán)隊(duì)DeepMind發(fā)表了新論文,提出了全新的強(qiáng)化學(xué)習(xí)算法AlphaZero,它將在多種任務(wù)上達(dá)到超越人類的水平。
AlphaZero的開發(fā)團(tuán)隊(duì)DeepMind
AlphaZero與AlphaGo Zero相比,不僅只是少了“Go”這么簡單,具體來說,它將能夠做到8個(gè)小時(shí)訓(xùn)練擊敗李世石版本AlphaGo,12小時(shí)訓(xùn)練擊敗世界頂級的國際象棋程序 Stockfish,14小時(shí)訓(xùn)練擊敗世界頂級將棋程序Elmo,即使是強(qiáng)大的AlphaGo Zero也已不是它的對手,在接受34小時(shí)訓(xùn)練后,即可戰(zhàn)勝受訓(xùn)72小時(shí)的AlphaGo Zero,這種強(qiáng)大的自我學(xué)習(xí)能力堪稱恐怖。
學(xué)習(xí)能力統(tǒng)計(jì)
如今,機(jī)器學(xué)習(xí)能力已越來越強(qiáng)大,不知職業(yè)棋手們的心理陰影面積會有多大,從中也可以預(yù)見的事,未來在部分領(lǐng)域人工智能將取代人類已板上釘釘。