它的輸入是一個帶有注釋的完整的19×19圍棋棋盤,而神經(jīng)網(wǎng)絡(luò)輸出的是一個代表著人類專業(yè)棋手每一步走法概率分布的棋盤地圖。這充分利用了卷積神經(jīng)網(wǎng)絡(luò)的模式識別能力,而這種能力在圖像中的物體識別、人臉識別和語音識別方面的成功早就得到了證明。
2015年11月,田淵棟在International Conference>與Facebook公開發(fā)表研究進展不同,Google的研究工作顯然更加保密。
2015年12月初,Google DeepMind負責(zé)人Hassabis在接受對外采訪時,就圍棋算法問題表示自己還不能談?wù)摯耸拢?ldquo;但幾個月后,會給公眾一個大驚喜。”此時,Google已經(jīng)將“AlphaGo”的研究論文投稿至《自然》雜志。
就在《自然》刊出“AlphaGo”論文的前一天,2016年1月27日,F(xiàn)acebook對去年11月刊發(fā)的論文進行了更新。新論文描述了“Darkforest”的最新版本“Darkforest3”,該程序已經(jīng)在KGS服務(wù)器上運營了一個多月,并取得了成人組第五的排名。這個排名意味著它已經(jīng)成為全美國最好的前100名選手之一,也步入了世界最頂尖圍棋人工智能之列。
1月28日,《自然》刊出Google DeepMind “AlphaGo”的論文。而Yann LeCun在Facebook上寫道:“AlphaGo的水平比Darkforest高出了6-7個等級。”
從圍棋算法上來看,田淵棟在知乎上介紹,“AlphaGo”的策略網(wǎng)絡(luò)和“Darkforest”采取的辦法是一樣的“谷歌的做法充分利用了大數(shù)據(jù)+深度學(xué)習(xí)的優(yōu)勢,而幾乎完全沒有用到圍棋的領(lǐng)域知識,若是以后棋力再往上走,我也不會驚訝。”
“Darkforest”敗給“AlphaGo”,也因為Facebook對其的資源投入無法與Google相比。田淵棟表示,Google發(fā)表在《自然》上的文章署名作者就有20位,明顯下了血本,第一位David Silver是計算機圍棋和強化學(xué)習(xí)的頂級專家,第二作者作者Aja Huang也寫過多年圍棋軟件。而研發(fā)“AlphaGo”的小組成員只有田淵棟本人和另一位同事。此外Google可以投入的計算資源也絕非2、3人的小團隊可以比擬的。
Yann LeCun和扎克伯格還是對“Darkforest表示了高度贊揚,Yann LeCun表示:“這個項目是由我們一個小團隊僅花了幾個月時間開發(fā)出來的,沒有投入任何圍棋專家資源(除了比賽錄像數(shù)據(jù)庫),這是對機器學(xué)習(xí)威力的一次偉大證明。”
在Facebook的個人主頁上,Yann LeCun還微妙地表示,F(xiàn)acebook對研究的態(tài)度一直是“盡早發(fā)布,時常發(fā)布”,研究團隊彼此盡早交換研究成果,能夠更快促進科學(xué)進步。
對于業(yè)界熱捧“AlphaGo”的態(tài)度,也有不同聲音出現(xiàn)?!度斯ぶ悄軐W(xué)家》主編劉鋒博士1月28日在科學(xué)網(wǎng)發(fā)言,認(rèn)為從科學(xué)實驗的統(tǒng)計學(xué)角度來看,要求實驗對象必須達到一定數(shù)量,進行多次獨立實驗,才能相對確保結(jié)果的穩(wěn)定性和可靠性。“谷歌在這篇論文中出現(xiàn)了奇怪的現(xiàn)象。對其他圍棋程序選取了眾多測試對象,并進行了495次實驗,但對人類測試者,卻只選取了一位職業(yè)圍棋二段選手,而不是測試多位不同等級的圍棋選手。”
劉峰認(rèn)為,“AlphaGo”也應(yīng)該像“Darkforest”一樣,放到互聯(lián)網(wǎng)平臺接受大眾挑戰(zhàn)。“我們并不惡意推測谷歌使用強大影響力影響參與測試的圍棋選手,讓他(他們)沒有全力應(yīng)對,但這一點也的確是可能的實驗漏洞之一。”
劉峰的疑惑并非毫無道理,不少棋友認(rèn)為,這場比賽不足以體現(xiàn)樊麾的真實水平。微信公眾號《喆理圍棋》的棋手李喆六段就該疑問與樊麾進行了詢問,樊麾對此回答:“電腦是沒有心理負擔(dān)的,而人有。”
今年3月,“AlphaGo”將于世界冠軍李世石對戰(zhàn),這無疑會是一場世界矚目的戰(zhàn)役。不論“AlphaGo”是否能再次戰(zhàn)勝人類頂級職業(yè)選手,但它已經(jīng)讓我們認(rèn)識到:人工智能的神經(jīng)網(wǎng)絡(luò)運用能力遠超過早前的預(yù)期,勢必將對人類未來的生活產(chǎn)生深遠的影響。