曾在線上快棋中取得對(duì)人類圍棋職業(yè)高手60:0戰(zhàn)績(jī)的新版“阿爾法狗”,昨天又在慢棋比賽中戰(zhàn)勝了當(dāng)今世界圍棋“第一人”柯潔。人工智能到底有多強(qiáng)大?圍棋已經(jīng)被“攻克”了嗎?人類還有希望嗎?
5月24日,澎湃新聞特約撰稿人、人工智能和大數(shù)據(jù)專家鄭宇就上述問(wèn)題展開講解:
原標(biāo)題:走出人機(jī)大戰(zhàn)五個(gè)誤區(qū):人類沒(méi)那么差,阿爾法狗不會(huì)故意輸棋
行至這一局面,柯潔連續(xù)抓頭發(fā)25秒,引現(xiàn)場(chǎng)講解一陣吐槽
5月23日,AlphaGo2.0版本在人機(jī)圍棋比賽中以四分之一子的微弱優(yōu)勢(shì)戰(zhàn)勝了柯潔,一方面繼續(xù)彰顯了人工智能的強(qiáng)大,但也讓人們對(duì)AlphaGo和人工智能有了新的認(rèn)識(shí)。
先說(shuō)出結(jié)論,再看分析:
1.在圍棋這個(gè)項(xiàng)目上AlphaGo目前走在了人類的前面,但并沒(méi)有完全攻克圍棋這項(xiàng)運(yùn)動(dòng)。它只是通過(guò)深度學(xué)習(xí)找到了一個(gè)比人類認(rèn)識(shí)更優(yōu)的解,但不是最優(yōu)解。最優(yōu)解無(wú)法找到,即便用盡地球上所有的資源。從專業(yè)的角度來(lái)講,就是用深度學(xué)習(xí)去逼近了一個(gè)強(qiáng)化學(xué)習(xí)中的價(jià)值判斷函數(shù),然后再跟蒙特卡洛搜索樹結(jié)合的方法(具體詳解可參看《鄭宇:一張圖解ALphaGo原理及弱點(diǎn)》,不再重復(fù))。既然人工智能和人類都不能找到最優(yōu)解,現(xiàn)在說(shuō)哪一方已經(jīng)完全徹底的失敗還早。
2. 人類也是在進(jìn)步的,我們也不要低估了人類后天的快速(小樣本)學(xué)習(xí)能力,這點(diǎn)AlphaGo基于現(xiàn)在的學(xué)習(xí)方法還做不到。短期來(lái)看人獲勝概率小,但長(zhǎng)遠(yuǎn)來(lái)看(未來(lái)5-10年)人還有機(jī)會(huì),因?yàn)槿艘灿泻軓?qiáng)的學(xué)習(xí)能力,可以從少量跟AlphaGo的對(duì)弈的棋局中快速學(xué)習(xí)。而即便再給AlphaGo1億副棋譜,再添加一萬(wàn)塊GPU,如果還是基于現(xiàn)有的學(xué)習(xí)體系,它進(jìn)步的速度也終將放緩,因?yàn)樾略龅钠遄V和計(jì)算資源相對(duì)于2x10171這個(gè)搜索空間來(lái)說(shuō)只是滄海一粟。我們對(duì)人腦的了解還遠(yuǎn)不如對(duì)圍棋的認(rèn)識(shí),這里面還有很大的未知數(shù)。
柯潔開局下出兩手“三·3”,已然顛覆至少二十年來(lái)的圍棋棋理(截自圍棋社交App“弈客”)
(但實(shí)際上,柯潔這樣下并不是心血來(lái)潮,他在各種職業(yè)比賽中已多次用這樣的招數(shù)與其他職業(yè)高手“過(guò)招”。最近的中國(guó)“圍甲”職業(yè)比賽中,各種“狗招”<阿爾法狗的招數(shù)>也已層出不窮,大家都在以自己的理解嘗試人工智能下出的招數(shù)。而柯潔等職業(yè)棋手的“喂招拆招”,也是中國(guó)自己的圍棋人工智能“絕藝”快速成長(zhǎng)的重要因素。)
事實(shí)上,這一招柯潔已在對(duì)人類的對(duì)局中嘗試多次(截自圍棋社交App“弈客”)
現(xiàn)就讀北大哲學(xué)系的“學(xué)者型棋手”李喆,也嘗試多種新招(截自圍棋社交App“弈客”)
3. 目前人類職業(yè)棋手跟AlphaGo的差距也就在一個(gè)貼目的水平,沒(méi)有大家想象的那么大。其實(shí)這個(gè)貼目的差距(按中國(guó)標(biāo)準(zhǔn)7目半),在職業(yè)棋手看來(lái),已經(jīng)是非常大的差距了。很多職業(yè)高手,進(jìn)入官子階段后發(fā)現(xiàn)自己還落后對(duì)方7-8目,就會(huì)主動(dòng)投子認(rèn)輸了。很多通過(guò)數(shù)子來(lái)決定勝負(fù)的比賽,輸贏往往都在1-2目之間(比如柯潔就輸給AlphaGo半目)。否則會(huì)被其他專業(yè)棋手笑話,自己落后那么多都不知道,點(diǎn)空能力太弱了。
要能真正客觀、準(zhǔn)確的看待這個(gè)問(wèn)題急需要較強(qiáng)的人工智能專業(yè)知識(shí),也需要一定的圍棋功底。下面先糾正網(wǎng)上認(rèn)知的一些誤區(qū):
誤區(qū)一:AlphaGo可以讓人類頂尖棋手4個(gè)子,AlphaGo2.0可以讓上一個(gè)版本4-5個(gè)子。
要消除這個(gè)誤解,首先要跟大家普及一下圍棋知識(shí):在圍棋里“讓對(duì)方兩個(gè)子”和“贏對(duì)方2個(gè)子”有著天壤之別。這點(diǎn)對(duì)于下圍棋的人不用多說(shuō),但我今天才意識(shí)到,很多吃瓜群眾一直以為這就是一回事。難怪網(wǎng)上會(huì)流傳以上的錯(cuò)誤言論。