之后黑棋逐漸占據(jù)上風(fēng),進(jìn)行到76手的時(shí)候我覺得AlphaGo下的實(shí)在太機(jī)械,太僵硬,有點(diǎn)暴露“機(jī)器本性”。
進(jìn)行到這里大家開始普遍看好黑棋了。接下來是本盤最有看點(diǎn)的一招:
102 是非常有個(gè)性的一步,也是柯潔(九段)指出的好棋,之后AlphaGo占到便宜以后連續(xù)兩次脫先,逐漸扭轉(zhuǎn)了局面。
之后右下角的懸念是AlphaGo右下沒有跳一路是看到目數(shù)優(yōu)勢(shì),簡(jiǎn)明處理還是沒有看到手筋,當(dāng)然我傾向于前者。
之后收官雙方都很平穩(wěn),本局唯一一次打劫也簡(jiǎn)單結(jié)束,希望之后能看到AlphaGo對(duì)于復(fù)雜劫爭(zhēng)的控制水平。
張崢
上海紐約大學(xué)計(jì)算機(jī)科學(xué)教授、前微軟亞洲研究院副院長(zhǎng)
剛剛仔細(xì)讀過AlphaGo,沒覺得有什么破綻。在自己左右手互搏中的計(jì)算價(jià)值那部分為了效率用了“快棋”策略,可能粗糙些,但下得多可以彌補(bǔ)。有網(wǎng)友提出的和李世石比賽會(huì)“偷招”這個(gè)倒不用擔(dān)心,五局的樣本對(duì)機(jī)器沒用,它不靠這個(gè),靠的是工程上高效率、策略上粗枝大葉但大方向正確。
AlphaGo勝利的概率是100%,只不過不見得是這次。“毛病”還是機(jī)器學(xué)習(xí)的老毛玻表現(xiàn)在:無法總結(jié)規(guī)律,或者說無法吐出一套規(guī)整自洽的規(guī)律;泛化能力差,無法在復(fù)盤中舉一反三,即便告訴它哪步走錯(cuò)了,恐怕它也不知道為啥,只是一氣兒死磕到撞了南墻才完事。
對(duì)谷歌如何復(fù)盤我很好奇。
如何實(shí)現(xiàn)不敗呢?AlphaGo從大量的棋譜開始練,除非有它沒見過的變化,而且遠(yuǎn)離它見過的和自己能演練到的。要下無理棋,把圍棋當(dāng)五子棋下……
但這種可能性太校歸根結(jié)底,和國(guó)際象棋變化少不一樣,問題是圍棋太古老了,以至于窮舉了太多可能,而且還讓AlphaGo看了!剩下的變化空間人是可以其樂無窮地去變化,對(duì)機(jī)器來說分分秒嗖嗖地就搜完了。這里圍棋的長(zhǎng)板變成短板,幫了AlphaGo:由于規(guī)則太簡(jiǎn)單,被機(jī)器抄了近道。
田淵棟
卡耐基梅隆大學(xué)機(jī)器人系博士、Facebook人工智能組研究員,F(xiàn)acebook人工智能圍棋程序Darkforest負(fù)責(zé)人
我圍棋水平很爛,但總的來說,可以對(duì)Alphago有所評(píng)論。第一點(diǎn),如果你覺得AlphaGo的落子水平會(huì)波動(dòng),其實(shí)它可能判斷勝率已經(jīng)很高,有時(shí)候隨便下;第二點(diǎn),蒙特卡洛樹搜索是遇強(qiáng)則強(qiáng)的,如果對(duì)手太弱的話也不會(huì)下出太強(qiáng)的手;第三點(diǎn),AlphaGo下棋每一步最后都是算整體分?jǐn)?shù)的,并非單純局部,反倒是有時(shí)候局部弱,對(duì)殺會(huì)有問題;第四點(diǎn),接下去的研究是進(jìn)入程序的黑箱里去。人工智能研究者們雖然設(shè)計(jì)學(xué)習(xí)算法,但其實(shí)不知道電腦是怎么決策的,要打開黑箱了解內(nèi)部機(jī)理,還有很長(zhǎng)的路要走。
董飛
數(shù)據(jù)科學(xué)家、Coursera數(shù)據(jù)工程師
這次是太多意外,在大家一邊倒的支持李九段的時(shí)候,也有李開復(fù)老師、余凱老師(前百度研究院副院長(zhǎng))力挺AlphaGo,認(rèn)為機(jī)器會(huì)贏。
這盤棋大致是前半段,李世石占有很多先機(jī),但后來不知道為何保守下棋,犯了一些失誤,勢(shì)力峰回路轉(zhuǎn),而AlphaGo中盤發(fā)力,180度轉(zhuǎn)彎,把李世石逼著認(rèn)輸。
我想作為一次焦點(diǎn)比賽,關(guān)注的人太多,比賽的壓力很大,李世石也似乎沒有發(fā)揮最佳水平,今天這一盤還不能完全說明問題,如果明天他接著輸了,那可以認(rèn)定人工智能真的在圍棋領(lǐng)域取得革命性突破。