在人工智能領(lǐng)域,谷歌和Facebook正在進行著一場比賽,而用人工智能戰(zhàn)勝職業(yè)圍棋選手,被視為這場比賽的第一局。
1月28日,《自然》雜志以封面論文形式宣布Google DeepMind公司的人工智能程序 AlphaGo以5:0的比分戰(zhàn)勝歐洲圍棋冠軍樊麾。
谷歌先勝一局。
“人工智能”概念自誕生起一直爭議不斷,但人類依舊在發(fā)展人工智能的道路上尋求不斷地突破,在各種棋類游戲中戰(zhàn)勝人類被視為人工智能“智商”的測試方式。
1997年人工智能第一次打敗人類國際象棋選手,2006年后再無人類戰(zhàn)勝過最頂尖的人工智能國際象棋選手。
而圍棋成為了科技大拿們攻堅的下一個城堡——它是典型的人工智能命題,極其困難而充滿著吸引力。
1990年代開始,就出現(xiàn)了如“手談”(中國陳志行教授開發(fā))、“Gun Go”(開源軟件組織GNU開發(fā))為代表的計算機圍棋程序,但這批程序的棋力尚不及人類業(yè)余選手初段。
21世紀,以“蒙特卡洛樹搜索”為全新思路的新程序開始在9×9的“小棋盤”實現(xiàn)突破,其中以法國的“MoGo”和“CrazyStone”為代表,棋力基本達到人類職業(yè)選手水平。
隨著新程序的思路不斷改進,“CrazyStone”和日本的“Zen”在真正的圍棋比賽上已經(jīng)能在人類職業(yè)棋手讓子的前提下贏得盤面。
近年來,隨著Google與Facebook這樣具有強大研發(fā)實力的科技大公司的加入,計算機圍棋界更加風起云涌。經(jīng)過《自然》雜志的介紹,公眾已經(jīng)熟知“AlphaGo”。相比Google此時的風光,也在開發(fā)人工智能以戰(zhàn)勝人類棋手的Facebook心里可不是好滋味。
這兩家頂尖科技公司早已展開了一場破解圍棋的人工智能競賽,F(xiàn)acebook開發(fā)的人工智能Darkforest(黑暗森林)在今年1月的KGS錦標賽獲得了第三名。1月28日下午,F(xiàn)acebook人工智能實驗室負責人Yann LeCun表示:“Darkforest被AlphaGo吊打了。”
開發(fā)圍棋人工智能的瓶頸在哪?你可能小時候看過一個宰相向國王求賞的故事:印度寒舍王要獎賞象棋發(fā)明人西薩·班·達依爾,西薩看似胃口不大,對國王請求在棋盤的第一個小格內(nèi)放一粒麥子,第二個小格放二粒,第三格放四粒,以此類推下去直到放滿64個格子。國王沒有意識到指數(shù)級增長的威力而欣然答允,然而事后才發(fā)現(xiàn)整個國庫的米都倒干凈了仍然無法填滿整個棋盤。西薩的結(jié)局是被國王殺掉了。
可以想見,指數(shù)級增長可算是大規(guī)模計算第一大“攔路虎”了。圍棋有3的361次方種局面,而可觀測到的宇宙,原子數(shù)量才10的80次方。
卡耐基梅隆大學機器人系博士、Facebook人工智能組研究員田淵棟曾說過:“圍棋難的地方在于它的估值函數(shù)非常不平滑,差一個子盤面就可能天翻地覆,同時狀態(tài)空間大,也沒有全局的結(jié)構(gòu)。這兩點加起來,迫使目前計算機只能用窮舉法并且因此進展緩慢。”
谷歌“AlphaGo”的核心是兩種不同的深度神經(jīng)網(wǎng)絡(luò)——“策略網(wǎng)絡(luò)”(policy network)和 “價值網(wǎng)絡(luò)”(value network)。“策略網(wǎng)絡(luò)”負責減少搜索的寬度,“價值網(wǎng)絡(luò)”負責減少搜索的深度,它們合作“挑選”出那些比較有前途的棋步,拋棄明顯的差棋,從而將計算量控制在程序可以完成的范圍里,重點分析那些有戲的棋著,本質(zhì)上和人類棋手所做的一樣。
Facebook的團隊也在幾個月前開始獨立研究圍棋人工智能項目,田淵棟開發(fā)的程序“Darkforest”,同樣是將卷積神經(jīng)網(wǎng)絡(luò)和蒙特卡洛樹搜索進行了有機結(jié)合。
Yann LeCun在自己的Facebook上發(fā)文介紹,第一版的“Darkforest”完全是基于卷積神經(jīng)網(wǎng)絡(luò),通過有監(jiān)督模式的訓練讓它來模仿人類選手。研究小組將大量的比賽棋盤格局輸入到卷積神經(jīng)網(wǎng)絡(luò)中,以此來訓練它預(yù)測人類選手的下一步走法。