雖然計算機在各個方面屢次向人類智慧發(fā)起挑戰(zhàn),但在圍棋方面,計算機專家卻忌諱莫深——這是因為大多數(shù)棋類游戲,計算機都可以通過“暴力”方式,推算出所有的取勝方案。而在體現(xiàn)東方智慧的圍棋上,一盤棋可以長達150個回合,每回合又有250種下子可能,因此排列組合下來的棋型總數(shù)甚至超過宇宙中的原子數(shù),因此,“暴力破解”并不適用。
顯然,谷歌公司研發(fā)的軟件“阿爾法圍棋”不會使用“暴力”的方式——據(jù)稱,該研發(fā)團隊能讓“阿爾法圍棋”根據(jù)棋盤上的形勢選出較有勝算的方案,換句話說就是讓軟件像人類一樣思考。這聽起來不可思議,但是“阿爾法圍棋”的確與“深藍”有著顯著的區(qū)別。
實際上,“阿爾法圍棋”背后是谷歌公司開發(fā)的“神經(jīng)網(wǎng)絡(luò)”系統(tǒng)——它并不是一臺超級計算機,而是一個由許多個數(shù)據(jù)中心作為節(jié)點相連,每個節(jié)點內(nèi)有著多臺超級計算機組成的網(wǎng)絡(luò)——就跟人腦的架構(gòu)一樣,由上百億個神經(jīng)元相連。“阿爾法圍棋”只不過是這個“神經(jīng)網(wǎng)絡(luò)”系統(tǒng)專門針對圍棋開發(fā)的一個程序。
自我博弈
玩視頻游戲擊敗職業(yè)玩家
“阿爾法圍棋”的強大在于,雖然有了類似于人腦的“神經(jīng)網(wǎng)絡(luò)”系統(tǒng)作為網(wǎng)絡(luò)基礎(chǔ),但是讓“阿爾法圍棋”擁有人工智能主體的還是被稱為“深度強化學(xué)習(xí)”的算法——它還能通過大量數(shù)據(jù)分析以及自我博弈,尋找比棋譜更多的技巧來擊敗人類。
“深度強化學(xué)習(xí)”算法到底如何運作?美國谷歌公司旗下的人工智能公司“深度思維”并沒有公開,不過在一年前的2月,該研發(fā)團隊在全球頂級科學(xué)期刊《自然》雜志上刊登的一篇論文中這樣描述,“深度強化學(xué)習(xí)”的靈感來源于心理學(xué)中的行為主義理論,即有機體如何在環(huán)境給予的獎勵或懲罰的刺激下,逐步形成對刺激的預(yù)期,產(chǎn)生能獲得最大利益的習(xí)慣性行為。
其實,在挑戰(zhàn)人類之前,“阿爾法圍棋”進行過多次試錯——研究人員讓該系統(tǒng)教自己玩49種經(jīng)典的視頻游戲,其中包括許多不同的類型,比如橫向的射擊游戲,還有一對一的格斗游戲,以及賽車游戲等等。讓人驚奇的是,該系統(tǒng)僅僅依靠對游戲視頻的觀察,在兩三盤游戲后,操作控制器的能力就突飛猛進——在49種游戲中的23種,擊敗了人類職業(yè)玩家。
去年10月,“阿爾法圍棋”就向人類圍棋選手發(fā)起了挑戰(zhàn),結(jié)果以5∶0戰(zhàn)勝了歐洲圍棋冠軍樊麾,這也是人工智能程序首次在不讓子的情況下戰(zhàn)勝人類圍棋選手。而在這場與韓國棋手李世石大戰(zhàn)之前,“阿爾法圍棋”的研發(fā)負(fù)責(zé)人、同時“深度思維”公司創(chuàng)始人的哈薩比斯,在接受采訪時就表達出足夠的信心,“人類或許一年能玩1000局,但機器一天就能玩數(shù)百萬局。雖然不少人認(rèn)為我們獲勝的幾率只有5%……但是我們的系統(tǒng)進步很快,就在我們談話時,它正在進步。”
“阿爾法圍棋”背后的“大神”
當(dāng)神經(jīng)科學(xué)的科學(xué)家玩起了計算機……
在2014年1月之前,很少有人了解到“深度思維”這家位于英國倫敦的人工智能公司,也很少有人了解創(chuàng)始人哈薩比斯。直到在谷歌公司和臉譜公司兩家科技巨頭為“深度思維”展開過激烈競爭,并最終被谷歌公司以5億英鎊的高價收購之后,這家公司才走向大眾視線——“深度思維”公司在其官網(wǎng)上寫道:“深度思維”致力于用研究深度學(xué)習(xí)的方式去真正了解人類的智慧。
對于“深度思維”公司和谷歌公司來說,打造“阿爾法圍棋”并不是終點,他們希望將機器學(xué)習(xí)和神經(jīng)科學(xué)進行結(jié)合,進而更好地幫助人類理解大腦。在“深度思維”公司創(chuàng)始人哈薩比斯看來,生物學(xué)是進一步發(fā)展人工智能研究的關(guān)鍵。
跨界達人
從象棋天才到神經(jīng)科學(xué)博士
將生物學(xué)和計算機科學(xué)進行跨界,世界上恐怕也沒有人想象過。但粗略看下哈薩比斯的簡歷,你就能發(fā)現(xiàn)其中的端倪——從電子游戲、計算機編程,再到認(rèn)知神經(jīng)科學(xué)和人工智能,他似乎有著無窮無盡的興趣。