劉佳 任紹敏
有著2500多年歷史的圍棋,一直被視作計(jì)算機(jī)最難以攻克的大眾棋類。但現(xiàn)在,這一人工智能研究領(lǐng)域的“攔路虎”,開(kāi)始遭遇強(qiáng)勁挑戰(zhàn)。
1月28日,GoogleDeepMind團(tuán)隊(duì)宣布,他們研發(fā)的人工智能(ArtificialIntelligence,下稱“AI”)程序AlphaGo,在沒(méi)有任何讓子的情況下以5∶0擊敗了歐洲圍棋冠軍職業(yè)圍棋二段樊麾,同時(shí)也擊敗了目前最好的圍棋程序中99.8%的對(duì)手。
果殼網(wǎng)新浪微博稱:“圍棋,人類已經(jīng)下不過(guò)谷歌的AI了!”多年以后,當(dāng)人類仰視AI的智慧時(shí),準(zhǔn)會(huì)想起谷歌推動(dòng)黑白子的無(wú)形的手。圍棋九段、第二屆百靈杯世界冠軍柯潔轉(zhuǎn)發(fā)了上述微博,并評(píng)論說(shuō):“震驚??!贊!雖說(shuō)看棋譜感覺(jué)水平有限……但可怕的是這還不是完全體,它是可以學(xué)習(xí)進(jìn)化的……”
AlphaGo的下一個(gè)挑戰(zhàn)將是世界頂級(jí)圍棋選手之一李世石,這場(chǎng)對(duì)戰(zhàn)將在今年3月進(jìn)行。李世石是圍棋九段高手,也是近10年來(lái)獲得世界第一頭銜最多的棋手,Google為此提供了100萬(wàn)美元作為獎(jiǎng)金。
為什么圍棋難以攻克?
1997年5月,象棋冠軍加里·卡斯帕羅夫被IBM“深藍(lán)”擊敗。今年3月,相似的歷史還會(huì)重演嗎?
“對(duì)于更加智能和靈活、具備與人類類似解決問(wèn)題能力算法的開(kāi)發(fā)工作而言,游戲無(wú)疑是一個(gè)絕佳的試驗(yàn)常”Google在官方博客中這樣寫(xiě)道。
歷史上,電腦最早掌握的第一款經(jīng)典游戲是井字游戲,這是1952年一位博士在讀生的研究項(xiàng)目;隨后是1994年電腦程序Chinook成功挑戰(zhàn)西洋跳棋游戲;3年后,IBM深藍(lán)超級(jí)計(jì)算機(jī)在國(guó)際象棋比賽中戰(zhàn)勝世界冠軍加里·卡斯帕羅夫。
除了棋盤(pán)游戲外,IBM的Watson系統(tǒng)在2011年成功挑戰(zhàn)老牌智力競(jìng)賽節(jié)目Jeopardy游戲一戰(zhàn)成名;2014年,Google自己編寫(xiě)的算法,學(xué)會(huì)了僅需輸入初始像素信息就能玩幾十種Atari游戲。
但此前,有一項(xiàng)游戲仍然是人類代表著頂尖水平,那就是圍棋。
圍棋雖然看上去規(guī)則簡(jiǎn)單,卻因?yàn)榫疃挥兴枷肷疃龋瑤讉€(gè)世紀(jì)來(lái)都牢牢抓住了人們的想象力。
Google介紹說(shuō),圍棋的搜索空間是漫無(wú)邊際的——比圍棋棋盤(pán)要大1個(gè)古戈?duì)枺〝?shù)量級(jí)單位,10的100次方,甚至比宇宙中的原子數(shù)量還要多)。因此,傳統(tǒng)的“強(qiáng)力”人工智能方法也就是“為所有可能的步數(shù)建立搜索樹(shù)”,在圍棋游戲中根本無(wú)法實(shí)現(xiàn)。
今年1月10日,卡耐基梅隆大學(xué)機(jī)器人系博士、Facebook人工智能組研究員田淵棟曾在知乎中作答稱,“圍棋難的地方在于它的估值函數(shù)非常不平滑,差一個(gè)子盤(pán)面就可能天翻地覆,同時(shí)狀態(tài)空間大,也沒(méi)有全局的結(jié)構(gòu)。這兩點(diǎn)加起來(lái),迫使目前計(jì)算機(jī)只能用窮舉法并且因此進(jìn)展緩慢。”
目前,F(xiàn)acebook的智能圍棋darkforest最新的darkfmcts3在KGS圍棋服務(wù)器上達(dá)到了5d,贏了一局Zen,輸了一局給DolBaram,被讓四子與一位韓國(guó)的職業(yè)六段一勝一負(fù)。
“現(xiàn)在的深度學(xué)習(xí)能在大量對(duì)局中找到這樣的一些規(guī)律,但仍然沒(méi)有人腦厲害。這一方面說(shuō)明我們現(xiàn)在算法的局限性,另一方面它還有巨大的發(fā)展空間。”他說(shuō)。
人工智能擊敗職業(yè)頂尖棋手真的快了嗎?
知名少兒對(duì)弈平臺(tái)新博圍棋老總陳勁松在朋友圈評(píng)論說(shuō):“三個(gè)月以后,Deeplearning也許可以打敗李世石,那也只不過(guò)是圍棋高手隊(duì)伍里面多了一個(gè)小伙伴而已,它學(xué)會(huì)了大家所有的招數(shù)。它同時(shí)還在等待學(xué)習(xí)你們發(fā)明的新的招數(shù)。”
職業(yè)二段棋手、圍棋資深教練劉軼一對(duì)《第一財(cái)經(jīng)日?qǐng)?bào)》稱,不用擔(dān)心,不會(huì)那么容易。不過(guò)他所在的朋友圈里,圍棋職業(yè)棋手們眾說(shuō)紛紜,有些認(rèn)為不可能,有些認(rèn)為指日可待了,還有聲音是“人類快被自己滅絕了”。
擊敗歐洲圍棋冠軍
那么,人工智能程序AlphaGo是如何擊敗圍棋高手的?
GoogleAlphaGo的研究者DavidSilver說(shuō),AlphaGo系統(tǒng)的關(guān)鍵是,將圍棋巨大無(wú)比的搜索空間壓縮到可控的范圍之內(nèi)。