來源:SME公眾號
3月9日可能會成為寫入人類史冊的一天——持續(xù)五天的谷歌AlphaGo大戰(zhàn)李世石開始,一場世界上最會下圍棋的人與人工智能的超級對弈,被全人類通過網(wǎng)絡(luò)直播共同圍觀。
在賽前,圍棋界和科學(xué)界的很多人都對這場比賽做了預(yù)測。谷歌對自己開發(fā)的機器人信心很足,聲稱根據(jù)電腦計算的結(jié)果,李世石打敗“阿爾法狗”的概率為0,。而圍棋界則多數(shù)站在李世石這一邊,中國棋圣聶衛(wèi)平認(rèn)為李世石敗北是不可能的事情。
而就在這第一場比賽中,李世石在前期優(yōu)勢的情況下不敵“阿爾法狗”,并在終局宣告認(rèn)輸。而在賽前,李世石曾自信表示自己能夠贏滿5盤。所以說flag不要亂立。
筆者認(rèn)為,李世石輸給人工智能是遲早的事情,只不過沒想到會來得這么快而已。因為“阿爾法狗”并不是像當(dāng)年的深藍(lán)一樣用窮舉法打敗人類,而是結(jié)合了深度神經(jīng)網(wǎng)絡(luò)機器學(xué)習(xí)方法和樹搜索算法。
神經(jīng)網(wǎng)絡(luò)算法在一定程度上模擬了生物神經(jīng)分層的構(gòu)架,不僅能夠不斷調(diào)整優(yōu)化各項行動的邏輯權(quán)重,還能夠進(jìn)行結(jié)果的反饋,把結(jié)果重新作為輸入進(jìn)行訓(xùn)練。谷歌的DeepMind團(tuán)隊把這項算法附加在博弈樹上,就有點像棋手進(jìn)行復(fù)盤一樣,反復(fù)加強之后可以對落子的位置形成一定的優(yōu)先級篩眩
這種做法看似依然需要大量運算,卻和先前有著極大的區(qū)別。當(dāng)機器進(jìn)行反復(fù)的訓(xùn)練后,它們對某些情況下的落子位置概率會變得很低。換句話說,它們可以跳過這些位置的運算,而非全部再計算一通。這些算法的進(jìn)步實際更加符合人類的思考和學(xué)習(xí)方式。我們?nèi)祟惒⒉皇钦莆樟巳康男畔⒑皖A(yù)測之后才能做出決策的,我們只能盡力追求在自己的能力范圍內(nèi)“滿意”的答案,而不是非要找到那個最優(yōu)的答案。
所以這就是“阿爾法狗”最厲害的地方,他不是一個機械的編碼程序,他有一個“監(jiān)督預(yù)判機制”,每走一步,他會考慮這種走法是不是更有前途,這是一種類似“想象力”的能力。、
再來說一下這盤棋本身。最開始,李世石采用了很不常見的下法,大概推測,小李因為對手是電腦,刻意做了針對,以求避開“阿爾法狗”的棋譜庫。
在中間的時候,李世石一度取得了優(yōu)勢,不少網(wǎng)友都評論道,如果李世石不出昏招就穩(wěn)贏。但后面由于一些意味不明的失誤,李世石已經(jīng)回天乏力了。
整盤棋就是右上角的打入起到了轉(zhuǎn)折性的作用,這一步也充分體現(xiàn)了算法在人類面前的巨大優(yōu)勢。在比賽限時的情況下,那一著的計算量確實是相當(dāng)大的,估計李世石也覺得那個部分有余味,但也想不到白棋就這樣長刀直入地切進(jìn)去,打出優(yōu)勢。
正如許多人所說,ai的優(yōu)勢很大一部分來自于局部計算的精細(xì),但從宏觀上講,優(yōu)勢更來自于時間的分配。像這樣計算量巨大的變招,人類去分析所花費的時間在比賽里所占的比重實在太大,再加上萬一你花了半天計算出來這里其實沒有棋可下,時間就被浪費了。因此,在比賽過程中人類會因為時間規(guī)劃的原因而永遠(yuǎn)無法做到整體優(yōu)化同時局部細(xì)致的全面分析,而這正是算法的巨大優(yōu)勢。
那位在上個世紀(jì)九十年代敗給電腦的國際象棋大師Garry Kasparov其實也表達(dá)過類似的觀點。早期象棋機器會有盲點和可加利用的弱點,而且吸引棋手的是將利用這些弱點作為目標(biāo),而不是正兒八經(jīng)對弈。對戰(zhàn)深藍(lán)時,他就沒有抵擋住這一誘惑。