在剛剛結(jié)束的圍棋人機(jī)大戰(zhàn)中,AlphaGo機(jī)器人在與韓國頂尖高手李世石之間的五番棋第一戰(zhàn)中取勝,總比分1-0落后。這是AlphaGo機(jī)器人去年戰(zhàn)勝歐洲圍棋冠軍后在人機(jī)大戰(zhàn)中的又一次勝利。
可以預(yù)見,這場世紀(jì)大戰(zhàn)之后,人類被計算機(jī)碾壓、人工智能時代來臨、人類治理驕傲即將崩塌 這些說法充斥著朋友圈與各大新聞頻道。
多年以來,人機(jī)大戰(zhàn)從來沒停止過,人工智能一直在各個領(lǐng)域不停地向人類發(fā)起挑戰(zhàn)。1997年,IBM的超級電腦 深藍(lán) 擊敗國際象棋世界冠軍卡斯帕羅夫,深藍(lán)也成為擊敗人類的最知名的人工智能。不過馬上就不是了,因?yàn)锳lphaGo準(zhǔn)備在更難的圍棋領(lǐng)域,擊敗人類!
眾所周知,圍棋的規(guī)則與勝負(fù)條件足夠復(fù)雜,其估值函數(shù)非常不平滑,差一個子盤面就可能天翻地覆,同時狀態(tài)空間大,也沒有全局的結(jié)構(gòu)。
說的再簡單一些,我們都知道國際象棋有著明確的兌子價值:
后 10分
車 5分
象 3分
馬 3分
兵 1分
圖:國際象棋算法的搜索樹
圖:圍棋算法的搜索樹
圍棋復(fù)雜度超過宇宙原子總數(shù):圍棋棋盤橫豎各有19條線,共有361個落子點(diǎn),雙方交替落子,這意味著圍棋總共可能有10^171(1后面有171個零)種可能性。這個數(shù)字到底有多大,你可能沒有感覺。我們可以告訴你,宇宙中的原子總數(shù)是10^80(1后面80個零),即使窮盡整個宇宙的物質(zhì)也不能存下圍棋的所有可能性。
而且在圍棋中,我們很難量化每一子的價值;遑論對弈過程中還需要符合 打劫 的游戲規(guī)則,并通過擠、拆、逼、封等手段獲取優(yōu)勢,其難度遠(yuǎn)高于其它項(xiàng)目。因此,棋類游戲中,圍棋成為了計算機(jī)唯一一道未能攻破的防線。
那么守護(hù)人類智力的重任,就交給你了!
不過圍棋與IT界似乎都相信,即便這次AlphaGo跪了,電腦也遲早是會在圍棋等全部博弈類游戲上贏過頂尖的人類選手。
因?yàn)槿斯ぶ悄芗夹g(shù)已經(jīng)迎來了一個新的突破 深度學(xué)習(xí)技術(shù)。
AlphaGo比此前國際象棋人工智能復(fù)雜的點(diǎn)在于:它基于深度學(xué)習(xí)進(jìn)行估值和走棋。而近幾年深度學(xué)習(xí)最大的突破之處,就是深度學(xué)習(xí)不需要人來設(shè)計算法 找特征 ;只通過大量原始數(shù)據(jù)和標(biāo)簽的對比,程序便可以自動找特征,并且并不比人差。
那這和下圍棋有什么關(guān)系?!先別急,圍棋雖說是 千古無同局 ,但在局部及開局還是有很多相似或者相同的模式會反復(fù)出現(xiàn),人工智能需要尋找并記錄的,就是這其中的特征、以及每一步之間的規(guī)律。之后,人工智能將深度學(xué)習(xí)的找特征,與蒙特卡洛搜索樹相結(jié)合
等等,蒙特卡洛搜索樹(MCTS)又是什么鬼?科幻愛好者對這個應(yīng)該詞語并不陌生,老劉的《三體》里也曾出現(xiàn)過。說得簡單一些,就是一種通過大量采樣獲取最優(yōu)解的方法;體現(xiàn)在圍棋中,就是運(yùn)用了蒙特卡洛搜索樹的人工智能,能夠看到更多步以后的局勢,不會為了眼前的利益而舍棄大局。對于機(jī)器來說,這幾乎是智的飛躍。
但《三體》里也曾表示,在樣本過多的情況下,蒙特卡洛搜索樹耗時過長,往往需要以年作為時間單位。因此,快速、精準(zhǔn)發(fā)現(xiàn)特征的深度學(xué)習(xí)技術(shù),成為其最好拍檔。于是,蒙特卡洛搜索樹搭配深度學(xué)習(xí) 利用前者枚舉棋路、利用后者發(fā)現(xiàn)特征加以分析的人工智能AlphaGo,成為了人類棋壇榮耀的最大威脅。
不只是圍棋,自從人工智能不斷趨向成熟,越來越多的傳統(tǒng)領(lǐng)域受到了挑戰(zhàn)。
人工智能VS專業(yè)醫(yī)師