第四局里,李世石第78步的創(chuàng)新之舉。
我剛才談到了直覺和創(chuàng)新,直覺是一種含蓄的表達(dá),它是基于人類的經(jīng)歷和本能的一種思維形式,不需要精確計算。這一決策的準(zhǔn)確性可以通過行為進(jìn)行評判。在圍棋里很簡單,我們給系統(tǒng)輸入棋子的位置,來評估其重要性。阿爾法狗就是在模擬人類這種直覺行為。創(chuàng)新,我認(rèn)為就是在已有知識和經(jīng)驗的基礎(chǔ)上,產(chǎn)生一種原始的,創(chuàng)新的觀點(diǎn)。阿爾法狗很明顯的示范了這兩種能力。
6.神秘棋手Master究竟是不是阿爾法狗?
那么我們今天的主題是“超越人類認(rèn)知的極限”,下一步應(yīng)該是什么呢?從去年三月以來,我們一直在不斷完善和改進(jìn)阿爾法狗,大家肯定會問,既然我們已經(jīng)是世界冠軍了,還有什么可完善的? 其實(shí),我們認(rèn)為阿爾法狗還不是完美的,還需要做更多的研究。
首先,我們想要繼續(xù)研究剛才提到的和李世石的第四局的比賽,來填充知識的空白;這個問題其實(shí)已經(jīng)被解決了,我們建立了一個新的阿爾法狗分系統(tǒng),不同于主系統(tǒng),這個分支系統(tǒng)是用來困惑主系統(tǒng)的。我們也優(yōu)化了系統(tǒng)的行為,以前我們需要花至少3個月來訓(xùn)練系統(tǒng),現(xiàn)在只需要一周時間。
第二,我們需要理解阿爾法狗所采取的決定,并對其進(jìn)行解釋;阿爾法狗這樣做的原因是什么,是否符合人類的想法等等;我們通過對比人類大腦對于不同落子位置的反應(yīng)以及阿爾法狗對于棋子位置的反應(yīng),以期找到一些新的知識;本質(zhì)上就是想讓系統(tǒng)更專業(yè)。我們在網(wǎng)絡(luò)上與世界頂級的專家對決,一開始我們使用了一個假名(Master),在連勝之后被大家猜出是阿爾法狗。這些都是頂級的專家,我們至今已贏了60位大師了。如果你做個簡單的貝葉斯分析,你會發(fā)現(xiàn)阿爾法狗贏不同對手的難易也不一樣。而且,阿爾法狗也在不斷自我創(chuàng)新,比如說圖中右下角這個棋子(圓圈標(biāo)處),落在第二根線里,以往我們并不認(rèn)為這是個有效的位置。實(shí)際上,韓國有的團(tuán)隊預(yù)約了這些游戲,想研究其中新的意義和信息。
阿爾法狗自我創(chuàng)新,落在第二格線的旗子。
柯潔,既是中國的圍棋冠軍,也是目前的世界圍棋冠軍,他才19歲。他也在網(wǎng)上和阿爾法狗對決過,比賽之后他說人類已經(jīng)研究圍棋研究了幾千年了,然而人工智能卻告訴我們,我們甚至連其表皮都沒揭開。他也說人類和人工智能的聯(lián)合將會開創(chuàng)一個新紀(jì)元,將共同發(fā)現(xiàn)圍棋的真諦。異曲同工,柯潔提到了圍棋的真理,我們在這里談的是科學(xué)的真理。
紅遍網(wǎng)絡(luò)的神秘棋手Master2017年1月3日在騰訊圍棋對弈平臺贏了柯潔。
Master執(zhí)白中盤勝柯潔,Master就是AlphaGo的升級版。
那么圍棋的新紀(jì)元是否真的到來了呢?圍棋史上這樣的劃時代事件曾經(jīng)發(fā)生過兩次,第一次是發(fā)生在1600年左右的日本,20世紀(jì)30-40年代的日本,日本一位當(dāng)時非常杰出的圍棋高手吳清源提出了一個全新的關(guān)于圍棋的理論,將圍棋提升到了一個全新的境界。大家說如今,阿爾法狗帶來的是圍棋界的第三次變革。
7.為什么人工智能“下圍棋”強(qiáng)于“下象棋”?
我想解釋一下,為什么人工智能在圍棋界所作出的貢獻(xiàn),要遠(yuǎn)大于象棋界。如果我們看看當(dāng)今的世界國際象棋冠軍芒努斯·卡爾森,他其實(shí)和之前的世界冠軍沒什么大的區(qū)別,他們都很優(yōu)秀,都很聰明。但為什么當(dāng)人工智能出現(xiàn)的時候,他們可以遠(yuǎn)遠(yuǎn)超越人類?我認(rèn)為其中的原因是,國際象棋更注重戰(zhàn)術(shù),而阿爾法狗更注重戰(zhàn)略。如今世界頂級的國際象棋程序再不會犯技術(shù)性的錯誤,而在人類身上,不可能不犯錯。
第二,國際象棋有著巨大的數(shù)據(jù)庫,如果棋盤上少于9個棋子的時候,通過數(shù)學(xué)算法就可以計算出誰勝誰敗了。計算機(jī)通過成千上萬的迭代算法,就可以計算出來了。因此,當(dāng)棋盤上少于九個棋子的時候,下象棋時人類是沒有辦法獲勝的。