AlphaGo的跳躍式成長來自幾個(gè)因素:1)15-20名世界頂級(jí)的計(jì)算機(jī)科學(xué)家和機(jī)器學(xué)習(xí)專家(這是圍棋領(lǐng)域從未有的豪華團(tuán)隊(duì):也許你覺得這不算什么,但是要考慮到這類專家的稀缺性),2)前面一點(diǎn)提到的技術(shù)、創(chuàng)新、整合和優(yōu)化。3)全世界最浩大的谷歌后臺(tái)計(jì)算平臺(tái),供給團(tuán)隊(duì)使用,4)整合CPU+GPU的計(jì)算能力。
AlphaGo是個(gè)通用的大腦,可以用在任何領(lǐng)域嗎?AlphaGo里面的深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、MCTS,和AlphaGo的擴(kuò)張能力計(jì)算能力都是通用的技術(shù)。AlphaGo的成功也驗(yàn)證了這些技術(shù)的可擴(kuò)展性。但是,AlphaGo其實(shí)做了相當(dāng)多的圍棋領(lǐng)域的優(yōu)化;除了上述的系統(tǒng)調(diào)整整合之外,里面甚至還有人工設(shè)定和調(diào)節(jié)的一些參數(shù)。AlphaGo的團(tuán)隊(duì)在Nature上也說:AlphaGo不是完全自我對(duì)弈end-to-end的學(xué)習(xí)(如之前同一個(gè)團(tuán)隊(duì)做Atari AI,用end-to-end,沒有任何人工干預(yù)學(xué)習(xí)打電動(dòng)游戲)。如果AlphaGo今天要進(jìn)入一個(gè)新的應(yīng)用領(lǐng)域,用AlphaGo的底層技術(shù)和AlphaGo的團(tuán)隊(duì),應(yīng)該可以更快更有效地開發(fā)出解決方案。這也就是AlphaGo真正優(yōu)于深藍(lán)的地方。但是上述的開發(fā)也要相當(dāng)?shù)臅r(shí)間,并且要世界上非常稀缺的深度計(jì)算科學(xué)家(現(xiàn)在年待遇行情已達(dá)250萬美金)。所以,AlphaGo還不能算是一個(gè)通用技術(shù)平臺(tái),不是一個(gè)工程師可以經(jīng)過調(diào)動(dòng)API可以使用的,而且還距離比較遠(yuǎn)。
如果這次AlphaGo沒有打敗李世乭,那還要多久呢?IBM深藍(lán)從進(jìn)入大師級(jí)別到比賽擊敗世界冠軍花了四年。AlphaGo應(yīng)該會(huì)比深藍(lán)更快提升自己,因?yàn)樯钏{(lán)需要新版本的硬件,和針對(duì)Kasparov的人工調(diào)節(jié)優(yōu)化,而AlphaGo是基于谷歌的硬件計(jì)算平臺(tái),和相對(duì)通用的深度學(xué)習(xí)算法。所以,幾個(gè)月太短,4年太長,就預(yù)計(jì)1-2年之間吧。
從國際象棋到圍棋,到底是不是巨大的突破呢?肯定是的,在這篇文章里面(在國際象棋領(lǐng)域,電腦已經(jīng)可以戰(zhàn)勝人腦,那么圍棋領(lǐng)域電腦還差多遠(yuǎn)? - 計(jì)算機(jī) ),第一位回答者分析了圍棋的復(fù)雜度為10^{172} 而國際象棋則只有10^{46} 。在1997年深藍(lán)擊敗世界冠軍時(shí),大家都認(rèn)為:深藍(lán)使用的是人工調(diào)整的評(píng)估函數(shù),而且是用特殊設(shè)計(jì)的硬件和”暴力“的搜索 (brute-force) 地征服了國際象棋級(jí)別的復(fù)雜度,但是圍棋是不能靠窮舉的,因?yàn)樗乃阉魈珡V(每步的選擇有幾百而非幾十)也太深(一盤棋有幾百步而非幾十步)。而AlphaGo的發(fā)展讓我們看到了,過去二十年的發(fā)展,機(jī)器學(xué)習(xí)+并行計(jì)算+海量數(shù)據(jù)是可以克服這些數(shù)字上的挑戰(zhàn)的,至少足以超越最頂尖的人類。
AlphaGo 若打敗了世界冠軍,就意味著計(jì)算機(jī)超越人腦?或者可以思考了嗎?我的回答:
在可以憑邏輯分析推算的問題上,機(jī)器即將遠(yuǎn)遠(yuǎn)把人類拋在后面。機(jī)器速度會(huì)越來越快,學(xué)習(xí)能力會(huì)越來越強(qiáng),數(shù)據(jù)會(huì)越來越多。當(dāng)年,大家討論“國際象棋輸給機(jī)器不算什么,圍棋才是真正的智慧”只是我們?nèi)祟惥S護(hù)自己尊嚴(yán)但是不實(shí)際的幻想!今天,我們?cè)撁鎸?duì)現(xiàn)實(shí)了!
在大數(shù)據(jù)+機(jī)器學(xué)習(xí)+大規(guī)模并行計(jì)算的時(shí)代,我們將看到無數(shù)的商機(jī)和產(chǎn)品,能夠在預(yù)測、分析、推薦等方面,產(chǎn)生巨大的商業(yè)和用戶價(jià)值。不過,這些解決方案和人類相比,其實(shí)沒有什么意義,因?yàn)槿瞬钐h(yuǎn)了(比如說:推薦引擎將能推薦你最可能會(huì)買的產(chǎn)品、想吃的菜,想認(rèn)識(shí)的人;自動(dòng)交易能得到更高的投資回報(bào)和風(fēng)險(xiǎn)比例。。。)。
在感知方面,人類也將會(huì)被機(jī)器超越。今天的語音識(shí)別,人臉識(shí)別,未來的自動(dòng)駕駛,都是例子。
但是,對(duì)于那些科幻片的粉絲們:以上都還是冷冰冰的技術(shù),機(jī)器人是否會(huì)人性化?這還是未知的。畢竟,在情感、喜怒哀樂、七情六欲、人文藝術(shù)、美和愛、價(jià)值觀等方面,機(jī)器離人還差的很遠(yuǎn),甚至連基礎(chǔ)都沒有。對(duì)人工智能的研究者,這是下一個(gè)挑戰(zhàn)。對(duì)我們?nèi)祟?,在下個(gè)突破之前,我們還是多發(fā)展右腦吧!
P.S. - 也許有人好奇,為什么這個(gè)話題我說了這么多,因?yàn)樵?986年,我在讀書時(shí),曾經(jīng)開發(fā)了一套黑白棋系統(tǒng)(復(fù)雜度10^{28} ),擊敗了黑白棋的世界團(tuán)體冠軍,而當(dāng)年的那套系統(tǒng)也有(非常粗淺的)自我學(xué)習(xí)的能力。有興趣的網(wǎng)友可以在這里看到我當(dāng)年的文章:A pattern classification approach to evaluation function learning ) 。