編者按:它真的又回來了,自從2016年完虐世界頂級棋手李世石之后,它似乎一直都沒有離開我們的視線,世界圍棋界經(jīng)歷了層層震蕩、人工智能話題都從它說起、變身馬甲橫掃棋壇六十位大將……
5月23日,中國烏鎮(zhèn),已經(jīng)升級到2.0版本的谷歌人工智能AlphaGo將重燃“人機大戰(zhàn)”戰(zhàn)火,而此番來挑戰(zhàn)的將是現(xiàn)今世界棋力第一的中國圍棋選手柯潔。
文/定西
AlphaGo到底是誰?它又來自哪里?
我們首先來看看它的爸爸們,關(guān)鍵先生是戴密斯·哈薩比斯是人工智能科學(xué)家、DeepMind公司創(chuàng)始人,他4歲開始下國際象棋,8歲自學(xué)編程,13歲獲得國際象棋大師稱號,17歲進入劍橋大學(xué)攻讀計算機科學(xué)專業(yè)。在大學(xué)里,他開始學(xué)習(xí)圍棋。2005年進入倫敦大學(xué)學(xué)院攻讀神經(jīng)科學(xué)博士,選擇大腦中的海馬體作為研究對象。
兩年后,他證明了5位因為海馬體受傷而患上健忘癥的病人,在暢想未來時也會面臨障礙,并憑這項研究入訊科學(xué)》雜志的“年度突破獎”。2011年創(chuàng)辦DeepMind Technologies公司,以“解決智能”為公司的終極目標(biāo)。
還有大衛(wèi)·席爾瓦 (David Silver),他是劍橋大學(xué)計算機科學(xué)學(xué)士、碩士,加拿大阿爾伯塔大學(xué)計算機科學(xué)博士,倫敦大學(xué)學(xué)院講師,Google DeepMind研究員。除此之外,阿爾法圍棋設(shè)計團隊核心人員還有黃士杰(Aja Huang)、施恩·萊格(Shane Legg)和穆斯塔法·蘇萊曼(Mustafa Suleyman)等。
而阿爾法圍棋(AlphaGo)其實就是一款圍棋人工智能程序。
它主要的工作原理是“深度學(xué)習(xí)”。深度學(xué)習(xí)是指多層的人工神經(jīng)網(wǎng)絡(luò)和訓(xùn)練它的方法,一層神經(jīng)網(wǎng)絡(luò)會把大量矩陣數(shù)字作為輸入,通過非線性激活方法取權(quán)重,再產(chǎn)生另一個數(shù)據(jù)集合作為輸出。這就像生物神經(jīng)大腦的工作機理一樣,通過合適的矩陣數(shù)量,多層組織鏈接一起,形成神經(jīng)網(wǎng)絡(luò)“大腦”進行精準(zhǔn)復(fù)雜的處理,就像人們識別物體標(biāo)注圖片一樣。
阿爾法圍棋用到了很多新技術(shù),如神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、蒙特卡洛樹搜索法等,使其實力有了實質(zhì)性飛躍。美國臉書公司“黑暗森林”圍棋軟件的開發(fā)者田淵棟曾發(fā)表分析文章說:“阿爾法圍棋系統(tǒng)主要由幾個部分組成:
一、走棋網(wǎng)絡(luò)(Policy Network),給定當(dāng)前局面,預(yù)測/采樣下一步的走棋;
二、快速走子(Fast rollout),目標(biāo)和走棋網(wǎng)絡(luò)一樣,但在適當(dāng)犧牲走棋質(zhì)量的條件下,速度要比走棋網(wǎng)絡(luò)快1000倍;
三、估值網(wǎng)絡(luò)(Value Network),給定當(dāng)前局面,估計是白勝還是黑勝;四、蒙特卡洛樹搜索(Monte Carlo Tree Search),把以上這三個部分連起來,形成一個完整的系統(tǒng)。”
AlphaGo在那年春天一戰(zhàn)成名!
2016年3月9日至15日在韓國首爾舉行了韓國圍棋九段棋手李世石與人工智能圍棋程序“阿爾法圍棋”之間的五番棋比賽。
比賽采用中國圍棋規(guī)則,最終結(jié)果是人工智能阿爾法圍棋以總比分4比1戰(zhàn)勝人類代表李世石。
2016年3月9日,賽前猜先阿爾法圍棋猜錯,李世石選擇黑棋,率先展開布局。黑棋布局走出新型,阿爾法應(yīng)對不佳,出現(xiàn)失誤。李世石抓住電腦布局不擅長應(yīng)對新型的弱點獲得不錯的局面。但圍棋的勝負關(guān)鍵往往是中盤階段。阿爾法圍棋之后的下法變得強硬,雙方展開接觸戰(zhàn)。李世石抓住機會,圍住一塊大空,在大局上搶得先機,但他卻放出了非常業(yè)余的手法,最后李世石算清后投子認輸。
2016年3月10日,圍棋人機大戰(zhàn)展開第二局較量。阿爾法圍棋執(zhí)黑先行,李世石轉(zhuǎn)變了行棋的風(fēng)格,開局下得非常穩(wěn)健,你來我往中,黑37和41兩步尖沖令人匪夷所思,尤其是第41手,致目數(shù)大虧。中盤階段,本來形勢占優(yōu)的李世石行棋過緩,右上角的一步二路打拔被視作敗手,阿爾法圍棋的優(yōu)勢逐漸清晰起來,阿爾法2比0領(lǐng)先。
2016年3月12日,圍棋人機大戰(zhàn)展開第三局較量。李世石執(zhí)黑先行,該局開始前,還有棋迷希望李世石能夠?qū)崿F(xiàn)逆轉(zhuǎn),但阿爾法圍棋徹底摧毀了這種可能。布局階段,李世石左下掛角后走高中國流。行不到二十手,李世石局面就落入下風(fēng),圍棋人機大戰(zhàn)前三盤人類三連敗。