在AlphaGo(阿爾法狗)沖進(jìn)圍棋世界,瘋狂碾壓人類高手之后,人工智能(AI)又殺入了新的領(lǐng)域——德州撲克。
卡內(nèi)基梅隆大學(xué)研發(fā)了一款名為“冷撲大師”的撲克比賽機(jī)器人。在近日于中國海南舉行的德州撲克人機(jī)大戰(zhàn)中,歷經(jīng)五天的比賽和36000手對陣之后,“冷撲大師”最終以792,327的籌碼獲勝,贏得了29萬美元的獎金。
“冷撲大師”的對手方是名為龍之隊的人類德?lián)渑剖?。這支隊伍是由2016年世界德州撲克大賽WSOP金手鏈獲得者、前人人網(wǎng)副總裁杜悅領(lǐng)頭,組員有許朝軍、張淮、童舟、朱亞希等六位資深華人德?lián)渑剖帧?/p>
這并非機(jī)器人首次贏得德?lián)浔荣惖膭倮?ldquo;冷撲大師”的前身是Libratus,這款機(jī)器人曾于1月在匹茲堡的120000手無上限德?lián)湟粚σ槐荣愔袚魯∷拿敿墦淇送婕遥A得170萬籌碼,每百手勝率超過14個大盲。
去年,另一個叫作DeepStack的撲克機(jī)器人在與11名人類玩家的無限注德?lián)湟粚σ粚?zhàn)中,打敗了10人。這個AI機(jī)器人由阿爾伯塔大學(xué)、布拉格捷克理工大學(xué)和布拉格查理大學(xué)的計算機(jī)科學(xué)家們聯(lián)合研制。
“冷撲大師”創(chuàng)造者之一、卡內(nèi)基梅隆大學(xué)計算機(jī)科學(xué)教授Tuomas Sandholm說:“我希望探索人工智能在撲克以及其他應(yīng)用領(lǐng)域里各種不同的商業(yè)機(jī)會。”
“冷撲大師”與AlphaGo的異同
從技術(shù)角度來說,德?lián)渑c圍棋不同之處在于,圍棋是“完全信息博弈”,通過觀察棋盤,就能立刻知道博弈所處的完整狀態(tài)。而德?lián)鋭t是一種“不完全信息博弈”。
和人類一樣,“冷撲大師”在翻牌前只能看到自己的牌,它必須自己算牌,根據(jù)出牌序列、對手風(fēng)格、對手位置和籌碼深度等等因素來反推對手手中的牌,從而計算各自的勝率。而且,在德?lián)浔荣愔?,運氣是個關(guān)鍵因素。
杜悅評價道:“冷撲大師的出牌全部基于科學(xué)的計算。而且,冷撲大師永遠(yuǎn)理性。不能保持頭腦冷靜卻是人類選手的最大缺陷。”
海南人機(jī)大戰(zhàn)發(fā)起者、創(chuàng)新工場董事長兼CEO李開復(fù)表示,和人工智能玩德州撲克,人類代表隊預(yù)期的勝算率是10%。
正如與AlphaGo對陣的李世石所說,“人會有心理上的搖擺,即使知道準(zhǔn)確的答案,在下子那一刻還是有可能會選擇另一條路, 考慮其他的選擇。但AlphaGo不會有任何動搖,這就是我所面對的最大困難。”
李世石甚至表示:“面對毫無感情的對手是非常難受的事情,這讓我有種再也不想跟它比賽的感覺。”他承認(rèn),如果再有機(jī)會跟AlphaGo對弈,情況一定也會非常艱難。
德?lián)銩I技術(shù)尚未成熟
目前來看,雖然AlphaGo在圍棋界已經(jīng)算得上大師級別,但能夠?qū)膿淇说腁I技術(shù)還遠(yuǎn)談不上成熟。
杜悅表示,必須弄清楚的是,龍之隊和冷撲大師的對戰(zhàn)形式是一對一,最后計算累計成績。在現(xiàn)實生活中,徳撲是多人游戲,而眼下AI還玩不轉(zhuǎn)多人形式。“跟單挑相比,多人游戲在計算復(fù)雜度上不是一個量級的,而是指數(shù)級的增長。所以,在可預(yù)見的未來,我們應(yīng)該不會看到最頂尖的機(jī)器人在多人桌上出現(xiàn)。”
但他同時還稱,人工智能一旦能夠戰(zhàn)勝人類頂級玩家,就證明它的理論和模型是對的,在成熟的AI面前,“人類沒有絲毫的勝算” 。
“人工智能的到來不可避免。人機(jī)共存時代,人類會和機(jī)器互相幫助,也會互相競爭。”
登陸|注冊歡迎登陸本站,認(rèn)識更多朋友,獲得更多精彩內(nèi)容推薦!