創(chuàng)新工場(chǎng)董事長(zhǎng)李開復(fù)在知乎就 AlphaGo 與李世石的人機(jī)大戰(zhàn)發(fā)表了自己看法,他認(rèn)為四個(gè)月前的 AlphaGo 擊敗李世石基本不可能,不過這四個(gè)月AlphaGo 進(jìn)步很多,比賽應(yīng)該很精彩。但是,無論這次結(jié)果如何,機(jī)器 1-2年 之內(nèi)必然完勝人類。完勝人類之后呢?可以做個(gè)通用的大腦嗎?意味著機(jī)器可以思考了嗎?還有什么問題是機(jī)器無法超越人類的?
以下為李開復(fù)就 “AlphaGo 能戰(zhàn)勝李世石嗎?” 在知乎的回答原文:
先直接回答這個(gè)問題,下面再分析 AlphaGo 和人工智能的未來。我認(rèn)為 AlphaGo 這次的比賽打敗李世石比較懸,但是 1-2年 之內(nèi)必然完勝人類。
按照兩者的 Elo (圍棋等級(jí)分),可以算出去年年 底的 AlphaGo 打敗李世石的概率相當(dāng)?shù)?。如何算出的呢?AlphaGo 去年年 底的頂級(jí)分布式版本的 Elo 是 3168 (見下面第一張圖),而李世石的 Elo 大約是 3532 (全球圍棋手 Elo: Go Ratings ,見下面第二張圖)。
李開復(fù):AlphaGo 若打敗了世界冠軍,意味著什么? 李開復(fù):AlphaGo 若打敗了世界冠軍,意味著什么?
按照這兩個(gè)等級(jí)分的兩個(gè)棋手對(duì)弈,李世石每盤的勝算為 89%( ,公式見:How to Guide: Converting Elo Differences To Winning Probabilities : chess鏈接地址:https://www.reddit.com/r/chess/comments/2y6ezm/how_to_guide_converting_elo_differences_to/ 溫馨提示:訪問此鏈接需復(fù)制粘貼至瀏覽器打開,下同)。如果對(duì)弈一盤,AlphaGo 尚有 11%的獲勝的可能性,而整個(gè)比賽五盤勝出三盤或更多,AlphaGo 就只有 1.1%的可能性了。(當(dāng)然,按照原來的 10月 的 AlphaGo,只有 1.1%,不過現(xiàn)在既然大大進(jìn)步了,就不一樣了,也許今天已經(jīng)超越了:見下面第三點(diǎn))。
AlphaGo 不是打敗了歐洲冠軍嗎?有些人認(rèn)為 AlphaGo 去年底擊敗了歐洲冠軍樊麾,所以挑戰(zhàn) (前) 世界冠軍應(yīng)有希望。但是,樊麾只是職業(yè)二段 (Elo 3000 左右),而李世石是職業(yè)九段 (ELO 3532)。這兩位的差別是巨大的,完全不能混為一談。就比如說一個(gè)人乒乓球打敗了非洲冠軍,并不代表他就可以成功挑戰(zhàn)中國(guó)冠軍。
AlphaGo 有可能在這幾個(gè)月突飛猛進(jìn),進(jìn)而擊敗李世石嗎?AlphaGo 的負(fù)責(zé)人說:” 外界不知道我們這幾個(gè)月進(jìn)步了非常多 “。(來自:http://www.geekwire.com/2016/alphago-lee-sedol-whos-underdog-in-google-ai-million-go-match/)。這點(diǎn)確實(shí)有可能。AlphaGo 進(jìn)步的方法有兩個(gè):(1) 增加硬件:我們從 Nature 的文章可以看到:從 1202 個(gè) CPU 到 1920 個(gè) CPU,AlphaGo 的 ELO 只增加了 28,而且線性地增加 CPU,不會(huì)看到線性的 ELO 成長(zhǎng)。若要達(dá)到 364 ELO 積分的提升,需要的 CPU 將達(dá)到天文數(shù)字 (有篇文章估計(jì)至少要 10 萬個(gè) CPU:http://www.milesbrundage.com/blog-posts/alphago-and-ai-progress)。當(dāng)然,谷歌有錢有機(jī)器,但是純粹加機(jī)器將會(huì)碰到并行計(jì)算互相協(xié)調(diào)的瓶頸 (就是說假設(shè)有十萬萬臺(tái)機(jī)器,它們的總計(jì)算能力很強(qiáng),但是彼此的協(xié)調(diào)將成為瓶頸)。在幾個(gè)月之內(nèi)增加兩個(gè)數(shù)量級(jí)的 CPU 并調(diào)節(jié)算法,降低瓶頸,應(yīng)該不容易。(2) 增加學(xué)習(xí)功能:AlphaGo 有兩種學(xué)習(xí)功能,第一種是根據(jù)高手棋譜的學(xué)習(xí),第二種是自我對(duì)弈,自我學(xué)習(xí)。前者已經(jīng)使用了 16 萬次高手比賽,而后者也在巨大機(jī)組上訓(xùn)練了 8 天。這方面肯定會(huì)有進(jìn)步,但是要超越世界冠軍可能不容易。最后,換一種分析方式:如果從過去深藍(lán)擊敗世界冠軍的 “成長(zhǎng)過程” 來看,深藍(lán)大約 1993年 達(dá)到職業(yè)大師水平,4年 后才在一場(chǎng)六盤的比賽中擊敗世界冠軍 (大約 500Elo 積分點(diǎn)的提升)。今天的 AlphaGo 應(yīng)該和 1993年 的深藍(lán)相似,剛進(jìn)入職業(yè)大師水平。若要擊敗世界冠軍,雖然未必需要 4年 的時(shí)間,但是幾個(gè)月似乎不夠。
還有什么以上未考慮的因素,導(dǎo)致 AlphaGo 獲勝嗎?如果谷歌刻意未出全力和樊麾對(duì)抗,或者有其它學(xué)習(xí)或并行計(jì)算方面超越了 Nature 里面的描述,那 AlphaGo 完全有可能獲勝。
(有最新的消息:李世石預(yù)計(jì)自己會(huì)大勝,不是 5﹣0 就是 4﹣1,他的目標(biāo)是達(dá)到 5:0,一盤都不輸。AlphaGo 負(fù)責(zé)人認(rèn)為有 50%概率可以戰(zhàn)勝李世石,因?yàn)樽罱膫€(gè)月進(jìn)步非常大。)
既然寫了這么多,就對(duì)這個(gè)題目再發(fā)表一些看法:
AlphaGo 是什么?在今年一月的 Nature (http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html ) 有 AlphaGo 的詳細(xì)介紹,AlphaGo 是一套為了圍棋優(yōu)化的設(shè)計(jì)周密的深度學(xué)習(xí)引擎,使用了神經(jīng)網(wǎng)路加上 MCTS (Monte Carlo tree search),并且用上了巨大的谷歌云計(jì)算資源,結(jié)合 CPU+GPU,加上從高手棋譜和自我學(xué)習(xí)的功能。這套系統(tǒng)比以前的圍棋系統(tǒng)提高了接近 1000 分的 Elo,從業(yè)余 5 段提升到可以擊敗職業(yè) 2 段的水平,超越了前人對(duì)圍棋領(lǐng)域的預(yù)測(cè),更達(dá)到了人工智能領(lǐng)域的重大里程碑。
AlphaGo 是科學(xué)的創(chuàng)新突破嗎?AlphaGo 是一套設(shè)計(jì)精密的卓越工程,也達(dá)到了歷史性的業(yè)界里程碑,不過 Nature 文章中并沒有新的 “發(fā)明”,AlphaGo 的特點(diǎn)在于:不同機(jī)器學(xué)習(xí)技術(shù)的整合 (例如:reinforcement learning, deep neural network, policy+value network, MCTS 的整合可謂創(chuàng)新)、棋譜學(xué)習(xí)和自我學(xué)習(xí)的整合、相對(duì)非常可擴(kuò)張的 architecture (讓其充分利用谷歌的計(jì)算資源)、CPU+GPU 并行發(fā)揮優(yōu)勢(shì)的整合。這套 “工程” 不但有世界頂級(jí)的機(jī)器學(xué)習(xí)技術(shù),也有非常高效的代碼,并且充分發(fā)揮了谷歌世界最宏偉的計(jì)算資源 (不僅僅是比賽使用,訓(xùn)練 AlphaGo 時(shí)也同樣關(guān)鍵)。
AlphaGo 的跳躍式成長(zhǎng)來自幾個(gè)因素:1) 15-20 名世界頂級(jí)的計(jì)算機(jī)科學(xué)家和機(jī)器學(xué)習(xí)專家 (這是圍棋領(lǐng)域從未有的豪華團(tuán)隊(duì):也許你覺得這不算什么,但是要考慮到這類專家的稀缺性),2) 前面一點(diǎn)提到的技術(shù)、創(chuàng)新、整合和優(yōu)化。3) 全世界最浩大的谷歌后臺(tái)計(jì)算平臺(tái),供給團(tuán)隊(duì)使用,4) 整合 CPU+GPU 的計(jì)算能力。
AlphaGo 是個(gè)通用的大腦,可以用在任何領(lǐng)域嗎?AlphaGo 里面的深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、MCTS,和 AlphaGo 的擴(kuò)張能力計(jì)算能力都是通用的技術(shù)。AlphaGo 的成功也驗(yàn)證了這些技術(shù)的可擴(kuò)展性。但是,AlphaGo 其實(shí)做了相當(dāng)多的圍棋領(lǐng)域的優(yōu)化;除了上述的系統(tǒng)調(diào)整整合之外,里面甚至還有人工設(shè)定和調(diào)節(jié)的一些參數(shù)。AlphaGo 的團(tuán)隊(duì)在 Nature 上也說:AlphaGo 不是完全自我對(duì)弈 end-to-end 的學(xué)習(xí) (如之前同一個(gè)團(tuán)隊(duì)做 Atari AI,用 end-to-end,沒有任何人工干預(yù)學(xué)習(xí)打電動(dòng)游戲)。如果 AlphaGo 今天要進(jìn)入一個(gè)新的應(yīng)用領(lǐng)域,用 AlphaGo 的底層技術(shù)和 AlphaGo 的團(tuán)隊(duì),應(yīng)該可以更快更有效地開發(fā)出解決方案。這也就是 AlphaGo 真正優(yōu)于深藍(lán)的地方。但是上述的開發(fā)也要相當(dāng)?shù)臅r(shí)間,并且要世界上非常稀缺的深度計(jì)算科學(xué)家 (現(xiàn)在年待遇行情已達(dá) 250 萬美金)。所以,AlphaGo 還不能算是一個(gè)通用技術(shù)平臺(tái),不是一個(gè)工程師可以經(jīng)過調(diào)動(dòng) API 可以使用的,而且還距離比較遠(yuǎn)。
如果這次 AlphaGo 沒有打敗李世石,那還要多久呢?IBM 深藍(lán)從進(jìn)入大師級(jí)別到比賽擊敗世界冠軍花了四年。AlphaGo 應(yīng)該會(huì)比深藍(lán)更快提升自己,因?yàn)樯钏{(lán)需要新版本的硬件,和針對(duì) Kasparov 的人工調(diào)節(jié)優(yōu)化,而 AlphaGo 是基于谷歌的硬件計(jì)算平臺(tái),和相對(duì)通用的深度學(xué)習(xí)算法。所以,幾個(gè)月太短,4年 太長(zhǎng),就預(yù)計(jì) 1-2年 之間吧。
從國(guó)際象棋到圍棋,到底是不是巨大的突破呢?肯定是的,在這篇文章里面 (在國(guó)際象棋領(lǐng)域,電腦已經(jīng)可以戰(zhàn)勝人腦,那么圍棋領(lǐng)域電腦還差多遠(yuǎn)?鏈接:https://www.zhihu.com/question/21714457 ),第一位回答者分析了圍棋的復(fù)雜度為 而國(guó)際象棋則只有 。在 1997年 深藍(lán)擊敗世界冠軍時(shí),大家都認(rèn)為:深藍(lán)使用的是人工調(diào)整的評(píng)估函數(shù),而且是用特殊設(shè)計(jì)的硬件和” 暴力 “的搜索 (brute-force) 地征服了國(guó)際象棋級(jí)別的復(fù)雜度,但是圍棋是不能靠窮舉的,因?yàn)樗乃阉魈珡V (每步的選擇有幾百而非幾十) 也太深 (一盤棋有幾百步而非幾十步)。而 AlphaGo 的發(fā)展讓我們看到了,過去二十年的發(fā)展,機(jī)器學(xué)習(xí) + 并行計(jì)算 + 海量數(shù)據(jù)是可以克服這些數(shù)字上的挑戰(zhàn)的,至少足以超越最頂尖的人類。
AlphaGo 若打敗了世界冠軍,就意味著計(jì)算機(jī)超越人腦?或者可以思考了嗎?
我的回答:
在可以憑邏輯分析推算的問題上,機(jī)器即將遠(yuǎn)遠(yuǎn)把人類拋在后面。機(jī)器速度會(huì)越來越快,學(xué)習(xí)能力會(huì)越來越強(qiáng),數(shù)據(jù)會(huì)越來越多。當(dāng)年,大家討論 “國(guó)際象棋輸給機(jī)器不算什么,圍棋才是真正的智慧” 只是我們?nèi)祟惥S護(hù)自己尊嚴(yán)但是不實(shí)際的幻想!今天,我們?cè)撁鎸?duì)現(xiàn)實(shí)了!
在大數(shù)據(jù) + 機(jī)器學(xué)習(xí) + 大規(guī)模并行計(jì)算的時(shí)代,我們將看到無數(shù)的商機(jī)和產(chǎn)品,能夠在預(yù)測(cè)、分析、推薦等方面,產(chǎn)生巨大的商業(yè)和用戶價(jià)值。不過,這些解決方案和人類相比,其實(shí)沒有什么意義,因?yàn)槿瞬钐h(yuǎn)了 (比如說:推薦引擎將能推薦你最可能會(huì)買的產(chǎn)品、想吃的菜,想認(rèn)識(shí)的人;自動(dòng)交易能得到更高的投資回報(bào)和風(fēng)險(xiǎn)比例……)。
在感知方面,人類也將會(huì)被機(jī)器超越。今天的語(yǔ)音識(shí)別,人臉識(shí)別,未來的自動(dòng)駕駛,都是例子。
但是,對(duì)于那些科幻片的粉絲們:以上都還是冷冰冰的技術(shù),機(jī)器人是否會(huì)人性化?這還是未知的。畢竟,在情感、喜怒哀樂、七情六欲、人文藝術(shù)、美和愛、價(jià)值觀等方面,機(jī)器離人還差的很遠(yuǎn),甚至連基礎(chǔ)都沒有。對(duì)人工智能的研究者,這是下一個(gè)挑戰(zhàn)。對(duì)我們?nèi)祟悾谙聜€(gè)突破之前,我們還是多發(fā)展右腦吧!
P.S. - 也許有人好奇,為什么這個(gè)話題我說了這么多,因?yàn)樵?1986年,我在讀書時(shí),曾經(jīng)開發(fā)了一套黑白棋系統(tǒng) (復(fù)雜度),擊敗了黑白棋的世界團(tuán)體冠軍,而當(dāng)年的那套系統(tǒng)也有 (非常粗淺的) 自我學(xué)習(xí)的能力。有興趣的網(wǎng)友可以在這里看到我當(dāng)年的文章:A pattern classification approach to evaluation function learning (鏈接:http://www.sciencedirect.com/science/article/pii/0004370288900768) 。
原創(chuàng)文章,作者:創(chuàng)新工場(chǎng),出處:http://36kr.com/p/5044292.html