阿爾法圍棋贏得最后一局 與李世石戰(zhàn)成4:1
(來源:~~)
核心提示:為了弄清這些棋局中蘊含的決勝策略,系統(tǒng)使用了一種名為“深層學(xué)習(xí)”的超凡方法,能夠梳理出模式并一下抓住重點,而不會迷失在信息海洋中。
參考消息網(wǎng)3月19日報道 美媒稱,“阿爾法圍棋”這個由谷歌旗下“深層思維”公司創(chuàng)建的人工智能系統(tǒng),在人機圍棋大賽中以四比一的成績擊敗了圍棋冠軍李世石。這場人機大賽究竟重要在哪里?畢竟1997年國際象棋冠軍加里·卡斯帕羅夫就敗在了國際商用機器公司的“深藍(lán)”計算機手下。那么為何說“阿爾法圍棋”的勝利具有特別重要的意義呢?
據(jù)美國《紐約時報》網(wǎng)站3月16日文章稱,和國際象棋一樣,圍棋是高度復(fù)雜的戰(zhàn)略游戲,無法依靠機會和運氣取勝。然而和象棋不同的是,沒人能解釋高段位圍棋該如何下。事實上,甚至連圍棋大師都無法完全搞懂自己為什么會下得一手好棋。從駕車到辨認(rèn)面孔,這種不自知是存在于人類諸多能力中的一種普遍現(xiàn)象。英國哲學(xué)家、科學(xué)家邁克爾·波拉尼描繪這種奇異的狀態(tài)時說:“我們知道的要比我們能表達的多。”人們將這種現(xiàn)象稱為“波拉尼的悖論”。
文章稱,“波拉尼的悖論”并沒有妨礙人民使用電腦來完成一些復(fù)雜工作。這些活動的編程需要極高的精確度,以命令電腦具體該做什么。而給電腦編程的老方法在應(yīng)用方面非常受限,在很多領(lǐng)域都行不通。
“深藍(lán)”之所以能夠有超人的絕佳表現(xiàn),幾乎純粹是靠運算能力:它被輸入了數(shù)百萬個國際象棋案例,因此能在眾多可能性中進行篩選,從而確定下一步棋的最佳位置。然而圍棋落子的可能性要多得多,即便是運算速度最快的電腦都無法模擬哪怕其中一小部分。
文章稱,“阿爾法圍棋”生動地詮釋了新方法的威力。這個方法是創(chuàng)建一個幾乎完全靠自學(xué),并通過觀察成功與失敗案例來掌握得勝技巧的系統(tǒng)。
“阿爾法圍棋”確實使用了模擬的方式和傳統(tǒng)搜索算法來幫它下了幾步棋,但真正的突破則在于它能夠克服“波拉尼的悖論”。之所以能做到這點,是因為它既能通過具體案例,也能通過自身經(jīng)驗來得出決勝戰(zhàn)略。這些案例取材于2500年圍棋史上出自圍棋大師之手的無數(shù)經(jīng)典棋局。為了弄清這些棋局中蘊含的決勝策略,系統(tǒng)使用了一種名為“深層學(xué)習(xí)”的超凡方法,能夠梳理出模式并一下抓住重點,而不會迷失在信息海洋中。
文章稱,對于人腦來說,學(xué)習(xí)是一個在神經(jīng)元之間形成并加強關(guān)聯(lián)的過程。“深層學(xué)習(xí)”系統(tǒng)采取了類似方式,因而被稱作“神經(jīng)網(wǎng)絡(luò)”。它在軟件中建立起數(shù)十億節(jié)點和關(guān)聯(lián),使用案例“訓(xùn)練集”來強化刺激(正在下的棋)和反應(yīng)(下一步棋)間的關(guān)聯(lián),而后再對系統(tǒng)進行新刺激,并觀察其反應(yīng)。通過另一種名叫“強化學(xué)習(xí)”的技術(shù),“阿爾法圍棋”還和自己下了數(shù)百萬盤棋,以記住有效走法和戰(zhàn)略。
“深層學(xué)習(xí)”和“強化學(xué)習(xí)”并非新生事物,然而直到最近,我們才認(rèn)清其威力以及其所能到達的境地。
文章稱,雖然還有很長的路要走,但其意義深遠(yuǎn)。未來數(shù)年內(nèi),技術(shù)帶來的變革將會波及人類經(jīng)濟。了解并解決科技迅速發(fā)展所帶來的社會挑戰(zhàn)仍是人類所面臨的任務(wù),沒有機器能夠替代我們完成。
登陸|注冊歡迎登陸本站,認(rèn)識更多朋友,獲得更多精彩內(nèi)容推薦!