20 年前,IBM 的深藍(lán)戰(zhàn)勝了國際象棋冠軍卡斯帕羅夫,讓人們感受到了計算機的強大。20 年后的今天,計算機的下棋能力更是突飛猛進(jìn)了。不過,盡管計算機的速度越來越快,它下棋的方法卻沒有什么變化,基本還是靠蠻力,就是說,它會快速搜索所有可能的棋步,然后做出最好的選擇。
與計算機相比,人類有著不同的思維方式。通過對棋局的判斷,人類能夠找出最有利的選擇。據(jù) Technologyreview 網(wǎng)站報道,倫敦皇家大學(xué)的 Matthew Lai 把人工智能技術(shù)用于象棋引擎的構(gòu)建。他開發(fā)的象棋引擎 Giraffe 能夠像人類一樣思考。與傳統(tǒng)象棋引擎完全不同,Giraffe 可以對棋局做出判斷,自己學(xué)習(xí)下棋技巧。
自完成之日起,Giraffe 下棋的水平就等同于最好的傳統(tǒng)象棋引擎。與人類相比,它的水平等同于國際棋聯(lián)的“國際象棋大師”。Giraffe 背后的技術(shù)是神經(jīng)網(wǎng)絡(luò)。在處理信息的方式上,神經(jīng)網(wǎng)絡(luò)是模仿人腦的。它擁有許多層的節(jié)點,而且,通過訓(xùn)練,這些節(jié)點的連接方式會發(fā)生改變。
在訓(xùn)練神經(jīng)網(wǎng)絡(luò)的時候,Lai 采用了來自真實比賽的數(shù)據(jù),確保棋局是合理而且可能出現(xiàn)的,同時,他也使用了許多不常見的棋局。這是因為,雖然通常不出現(xiàn)在比賽中,但是,它們可以縮短計算機內(nèi)部檢索的時間。從計算機象棋游戲的數(shù)據(jù)庫中,Lai 隨機選擇了 500 萬個棋局,然后,他為每個棋局增加了一個合理的棋步,最終生成 1750 萬個棋局。最后,他讓 Giraffe 自己下棋,改善其判斷能力,更重要的是,讓其能夠擁有自我學(xué)習(xí)的能力。
Lai 使用了一套名為 Strategic Test Suite 的標(biāo)準(zhǔn)數(shù)據(jù)庫測試 Giraffe。這套測試的最高分?jǐn)?shù)是 15000 分。在自主學(xué)習(xí)階段,Giraffe 很快就達(dá)到了 6000 分,72 小時之內(nèi)達(dá)到 9700 分。這已經(jīng)趕上目前最好的象棋引擎了。
當(dāng)然,Giraffe 也有自己的缺點。神經(jīng)網(wǎng)絡(luò)的運算速度比較慢,因此,與其它象棋引擎相比,Giraffe 搜索速度要慢上 10 倍。盡管如此,它仍然是有競爭力的。“與現(xiàn)在的多數(shù)象棋引擎不同,Giraffe 的優(yōu)勢不是來自于非常的遠(yuǎn)見,而是精確評估棋局的能力。人類能夠很自然地理解復(fù)雜的位置概念,但是,象棋引擎長期以來都缺乏這種能力,” Lai 說,“這在開局和殘局階段特別重要。在這兩個階段,它的表現(xiàn)特別好。”
圖片來自 fansshare
登陸|注冊歡迎登陸本站,認(rèn)識更多朋友,獲得更多精彩內(nèi)容推薦!