外媒稱,本月早些時候,在匹茲堡的河流賭場,幾位世界頂尖的撲克牌玩家與一款名為“克勞迪科”的人工智能程序在一場無限注德州撲克比賽中展開一對一廝殺。
據(jù)美國趣味科學(xué)網(wǎng)站5月19日報道,經(jīng)過為期兩周8萬手牌的角逐,人類玩家贏得了比人工智能更多的籌碼,但其數(shù)量還不夠多,不足以從科學(xué)上被認(rèn)定為有效。
科學(xué)家說,過不了多久,會打撲克的人工智能就能戰(zhàn)勝人類。
“克勞迪科”設(shè)計小組負(fù)責(zé)人、卡內(nèi)基-梅隆大學(xué)計算機(jī)科學(xué)家圖奧馬斯·桑德霍爾姆說:“我猜想,(會打撲克的人工智能)將在1至5年內(nèi)變得比世界上最優(yōu)秀的人還要強(qiáng)大。”但他表示,盡管人工智能的能力與最優(yōu)秀真人玩家的能力越來越接近,但仍然需要比現(xiàn)在多得多的手牌數(shù)才能真正宣布(人工智能)程序獲勝。
人工智能最為人熟知的成績是,由國際商用機(jī)器公司(IBM)開發(fā)的、會下國際象棋的電腦“深藍(lán)”戰(zhàn)勝了當(dāng)時的世界冠軍加里·卡斯帕羅夫。
但是,與國際象棋不同,撲克是一種信息不完全的比賽:玩家并不知道其他玩家的布局和戰(zhàn)略。桑德霍爾姆說:“撲克與真實(shí)世界的相關(guān)度遠(yuǎn)高于國際象棋。”
撲克最重要的策略之一就是虛張聲勢的技巧,即一位玩家在手里沒有最好的牌時下注或是加注,以達(dá)到使對方受到蒙騙、從而棄牌的目的。桑德霍爾姆說,“人們通常會認(rèn)為虛張聲勢是一種心理現(xiàn)象”,但它“還是一種策略現(xiàn)象”。
桑德霍爾姆和同事并沒有對“克勞迪科”的打牌策略進(jìn)行預(yù)先設(shè)定。他們編寫了一些運(yùn)算法則,這些法則通過設(shè)法找到“納什均衡”來自動計算出策略。博弈論的納什均衡理念是由美國數(shù)學(xué)家約翰·納什提出的。在一場非合作博弈中,如果每個參與者都在把其他參與者的決定考慮進(jìn)去后才作出對自己最有利的決定,那么這些參與者就達(dá)到了納什均衡。
“克勞迪科”的打牌智慧或許令人印象深刻,但桑德霍爾姆及其同事說,他們開發(fā)人工智能并不僅僅是為了在一場撲克牌比賽中勝出。使“克勞迪科”擅長打牌的那些能力同樣也能夠應(yīng)用于從拍賣到網(wǎng)絡(luò)安全的所有領(lǐng)域。