1997年5月,IBM與世界國(guó)際象棋冠軍加里·卡斯帕羅夫?qū)Q。
2.如何讓機(jī)器聽(tīng)從人類的命令?
大家可能想問(wèn)機(jī)器是如何聽(tīng)從人類的命令的,其實(shí)并不是機(jī)器或者算法本身,而是一群聰明的編程者智慧的結(jié)晶。他們與每一位國(guó)際象棋大師對(duì)話,汲取他們的經(jīng)驗(yàn),把其轉(zhuǎn)化成代碼和規(guī)則,組建了人類最強(qiáng)的象棋大師團(tuán)隊(duì)。但是這樣的系統(tǒng)僅限于象棋,不能用于其他游戲。對(duì)于新的游戲,你需要重新開(kāi)始編程。在某種程度上,這些技術(shù)仍然不夠完美,并不是傳統(tǒng)意義上的完全人工智能,其中所缺失的就是普適性和學(xué)習(xí)性。我們想通過(guò)“增強(qiáng)學(xué)習(xí)”來(lái)解決這一難題。在這里我解釋一下增強(qiáng)學(xué)習(xí),我相信很多人都了解這個(gè)算法。
首先,想像一下有一個(gè)主體,在AI領(lǐng)域我們稱我們的人工智能系統(tǒng)為主體,它需要了解自己所處的環(huán)境,并盡力找出自己要達(dá)到的目的。這里的環(huán)境可以指真實(shí)事件,可以是機(jī)器人,也可以是虛擬世界,比如游戲環(huán)境;主體通過(guò)兩種方式與周?chē)h(huán)境接觸;它先通過(guò)觀察熟悉環(huán)境,我們起初通過(guò)視覺(jué),也可以通過(guò)聽(tīng)覺(jué)、觸覺(jué)等,我們也在發(fā)展多感覺(jué)的系統(tǒng);
第二個(gè)任務(wù),就是在此基礎(chǔ)上,建模并找出最佳選擇。這可能涉及到對(duì)未來(lái)的預(yù)期,想像,以及假設(shè)檢驗(yàn)。這個(gè)主體經(jīng)常處在真實(shí)環(huán)境中,當(dāng)時(shí)間節(jié)點(diǎn)到了的時(shí)候,系統(tǒng)需要輸出當(dāng)前找到的最佳方案。這個(gè)方案可能或多或少會(huì)改變所處環(huán)境,從而進(jìn)一步驅(qū)動(dòng)觀察的結(jié)果,并反饋給主體。
簡(jiǎn)單來(lái)說(shuō),這就是增強(qiáng)學(xué)習(xí)的原則,示意圖雖然簡(jiǎn)單,但是其中卻涉及了極其復(fù)雜的算法和原理。如果我們能夠解決大部分問(wèn)題,我們就能夠搭建普適人工智能。這是因?yàn)閮蓚€(gè)主要原因:首先,從數(shù)學(xué)角度來(lái)講,我的合伙人,一名博士,他搭建了一個(gè)系統(tǒng)叫‘AI-XI’,用這個(gè)模型,他證明了在計(jì)算機(jī)硬件條件和時(shí)間無(wú)限的情況下,搭建一個(gè)普適人工智能,需要的信息。另外,從生物角度來(lái)講,動(dòng)物和人類等,人類的大腦是多巴胺控制的,它在執(zhí)行增強(qiáng)學(xué)習(xí)的行為。因此,不論是從數(shù)學(xué)的角度,還是生物的角度,增強(qiáng)學(xué)習(xí)是一個(gè)有效的解決人工智能問(wèn)題的工具。
3.為什么圍棋是人工智能難解之謎?
接下來(lái),我要主要講講我們最近的技術(shù),那就是去年誕生的阿爾法狗;希望在座的大家了解這個(gè)游戲,并嘗試玩玩,這是個(gè)非常棒的游戲。圍棋使用方形格狀棋盤(pán)及黑白二色圓形棋子進(jìn)行對(duì)弈,棋盤(pán)上有縱橫各19條直線將棋盤(pán)分成361個(gè)交叉點(diǎn),棋子走在交叉點(diǎn)上,雙方交替行棋,以圍地多者為勝。圍棋規(guī)則沒(méi)有多復(fù)雜,我可以在五分鐘之內(nèi)教給大家。這張圖展示的就是一局已結(jié)束,整個(gè)棋盤(pán)基本布滿棋子,然后數(shù)一下你的棋子圈出的空間以及對(duì)方棋子圈出的空間,誰(shuí)的空間大,誰(shuí)就獲勝。在圖示的這場(chǎng)勢(shì)均力敵的比賽中,白棋一格之差險(xiǎn)勝。
白棋以一格之差險(xiǎn)勝。
其實(shí),了解這個(gè)游戲的最終目的非常難,因?yàn)樗⒉幌裣笃迥菢樱兄苯用鞔_的目標(biāo),在圍棋里,完全是憑直覺(jué)的,甚至連如何決定游戲結(jié)束對(duì)于初學(xué)者來(lái)說(shuō),都很難。圍棋是個(gè)歷史悠久的游戲,有著3000多年的歷史,起源于中國(guó),在亞洲,圍棋有著很深的文化意義。孔子還曾指出,圍棋是每一個(gè)真正的學(xué)者都應(yīng)該掌握的四大技能之一(琴棋書(shū)畫(huà)),所以在亞洲圍棋是種藝術(shù),專家們都會(huì)玩。
如今,這個(gè)游戲更加流行,有4000萬(wàn)人在玩圍棋,超過(guò)2000多個(gè)頂級(jí)專家,如果你在4-5歲的時(shí)候就展示了圍棋的天賦,這些小孩將會(huì)被選中,并進(jìn)入特殊的專業(yè)圍棋學(xué)校,在那里,學(xué)生從6歲起,每天花12個(gè)小時(shí)學(xué)習(xí)圍棋,一周七天,天天如此。直到你成為這個(gè)領(lǐng)域的專家,才可以離開(kāi)學(xué)校畢業(yè)。這些專家基本是投入人生全部的精力,去揣摩學(xué)習(xí)掌握這門(mén)技巧,我認(rèn)為圍棋也許是最優(yōu)雅的一種游戲了。
像我說(shuō)的那樣,這個(gè)游戲只有兩個(gè)非常簡(jiǎn)單的規(guī)則,而其復(fù)雜性卻是難以想象的,一共有10170 (10的170次方) 種可能性,這個(gè)數(shù)字比整個(gè)宇宙中的原子數(shù)1080(10的80次方)都多的去了,是沒(méi)有辦法窮舉出圍棋所有的可能結(jié)果的。我們需要一種更加聰明的方法。你也許會(huì)問(wèn)為什么計(jì)算機(jī)進(jìn)行圍棋的游戲會(huì)如此困難,1997年,IBM的人工智能DeepBlue(深藍(lán))打敗了當(dāng)時(shí)的象棋世界冠軍GarryKasparov,圍棋一直是人工智能領(lǐng)域的難解之謎。我們能否做出一個(gè)算法來(lái)與世界圍棋冠軍競(jìng)爭(zhēng)呢?要做到這一點(diǎn),有兩個(gè)大的挑戰(zhàn):