這個(gè)問題也常常關(guān)聯(lián)著AI表征中的另一個(gè)問題,比如常識(shí)問題。我們都知道所謂的阿西莫夫的機(jī)器人三律令,即機(jī)器人不得傷害人類(人類遇到危險(xiǎn)它也必須設(shè)法解救),必須服從人給予它的命令,盡可能保護(hù)自己的生存。但實(shí)際上,這三定律是很難作為機(jī)器人的指令存在的,因?yàn)樗鼈儾⒉皇且?guī)則明晰、可以有效操作的指令。比如,救人這條律令,在不同的情境下有不同的執(zhí)行手段。當(dāng)一個(gè)人上吊的時(shí)候,救他的辦法是剪斷繩子;但當(dāng)一個(gè)人在五層樓的窗戶下拉著一條繩子呼救的時(shí)候,救他的辦法就是拉起而不是剪斷那條繩子。于是,讓人三律令工作起來,就必須對(duì)大量的背景知識(shí)進(jìn)行形式化??上У氖?,1980年代AI第二次浪潮中的專家系統(tǒng)和知識(shí)表征工程,就是因?yàn)闊o法處理常識(shí)表征的問題而最終失敗。
(2)AI的另一個(gè)難題就是中文屋論證以及由此衍生出來的符號(hào)奠基問題。心靈哲學(xué)家塞爾設(shè)計(jì)過這樣一個(gè)思想實(shí)驗(yàn),他假定自己被關(guān)在一個(gè)密閉的屋子中,屋子中有一本英文說明手冊(cè),它描述了如何根據(jù)漢字的字形(而不是語義),給出一個(gè)中文問題對(duì)應(yīng)的中文答案。中文屋中的塞爾從窗口接收中文問題,然后根據(jù)這本英文手冊(cè),給出相應(yīng)的中文答案。從中文屋外面的人看來,似乎塞爾是懂得中文的。但實(shí)際上,塞爾根本不理解這些中文問題和答案的任何意義。在塞爾看來,數(shù)字計(jì)算機(jī)就類似于中文屋中的塞爾,它只是根據(jù)物理和句法規(guī)則來進(jìn)行符號(hào)串的加工處理,卻完全不理解這些符號(hào)的意義。即便計(jì)算機(jī)表現(xiàn)出了和人類相似的智能行為,但計(jì)算機(jī)的工作歸根結(jié)底是對(duì)符號(hào)的處理,但這些符號(hào)的意義也并不是計(jì)算機(jī)所能理解或自主生成的,而是依賴于它們?cè)谌祟愵^腦中的意義。
圖片來源:《視讀人工智能》,第50頁。
后來認(rèn)知科學(xué)家哈納德在塞爾的基礎(chǔ)上,提出了所謂的符號(hào)奠基問題:如何讓一個(gè)人工系統(tǒng)自主地產(chǎn)生符號(hào)的意義,而不需要人類的外部或預(yù)先的賦予。這個(gè)問題其實(shí)也就是如何讓AI可以自主地從世界中識(shí)別出特征量,最終自主地產(chǎn)生與這種特征量對(duì)應(yīng)的符號(hào)。“深度學(xué)習(xí)”試圖解決這個(gè)問題,但其解法并不那么令人滿意。
(3)現(xiàn)象意識(shí)問題也是人工智能的難題。前面所述的框架問題和符號(hào)奠基問題,實(shí)際上涉及的都是如何在一個(gè)形式系統(tǒng)中模擬人類的表征活動(dòng)。但即便這些表征活動(dòng)都可以被人工智能所模擬,人類意識(shí)是否可以還原為表征過程,也是一個(gè)頗富爭議的問題。意識(shí)的表征主義理論認(rèn)為,所有的意識(shí)過程都可以還原為表征過程,但是對(duì)于那些出身于或同情現(xiàn)象學(xué)傳統(tǒng)的心靈哲學(xué)家而言,意識(shí)包含人類心智中不可消除的主觀意識(shí)體驗(yàn)。我們一般將這種第一人稱體驗(yàn)稱之為感受質(zhì)或現(xiàn)象意識(shí)。心靈哲學(xué)家內(nèi)格爾寫過一篇有名的文章《成為一只蝙蝠是一種什么體驗(yàn)?》,在他看來,即便我們掌握了關(guān)于蝙蝠的所有神經(jīng)生物學(xué)知識(shí),仍然無法確切地知道蝙蝠的內(nèi)在意識(shí)體驗(yàn)。查爾莫斯也有過類似的假定,比如我們可以假定存在這樣一個(gè)僵尸,它的一切活動(dòng)都表現(xiàn)得像人類一樣,然而,它卻缺乏人類最本質(zhì)的現(xiàn)象意識(shí)體驗(yàn)。在他們看來,意識(shí)體驗(yàn)是無法用表征過程來模擬的。如果這個(gè)理論成立的話,表征與意識(shí)就是兩個(gè)不同的概念,即便強(qiáng)人工智能是可能的,那么它也并不必然就具有意識(shí)。
二、Alphago真的智能了嗎?
那么,Alphago是否就真的那么具有革命性,成為AI發(fā)展的一個(gè)里程碑呢?實(shí)際上,Alphago并沒有采用任何新的算法,從而也就共享了這些傳統(tǒng)算法的局限。
Alphago的基本設(shè)計(jì)思路是,基于監(jiān)督式學(xué)習(xí)與強(qiáng)化學(xué)習(xí)兩種模式,通過構(gòu)造兩個(gè)神經(jīng)網(wǎng)絡(luò)即決策網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)來評(píng)估棋盤位置和決定走子動(dòng)作。Deepmind的工程師首先采用監(jiān)督式學(xué)習(xí),根據(jù)大量的人類棋局?jǐn)?shù)據(jù)訓(xùn)練了一個(gè)策略網(wǎng)絡(luò),它可以從這些棋局中學(xué)習(xí)人類棋手的走子定式之后。但學(xué)會(huì)這些定式并不能成為高手,還需要對(duì)走子之后的棋局作出評(píng)估,從而選擇最佳的走法。為此,Deepmind采用了強(qiáng)化學(xué)習(xí)的辦法,根據(jù)之前訓(xùn)練出來的策略網(wǎng)絡(luò)不斷地自我對(duì)弈(人類棋局的數(shù)據(jù)遠(yuǎn)遠(yuǎn)不夠了),訓(xùn)練了一個(gè)強(qiáng)化學(xué)習(xí)的策略網(wǎng)絡(luò),它的學(xué)習(xí)目標(biāo)不再是模擬人類棋手的走法,而是學(xué)習(xí)如何贏棋。Alphago最具創(chuàng)新性的地方在于,它根據(jù)這些自我對(duì)弈的數(shù)據(jù),訓(xùn)練了一個(gè)估值網(wǎng)絡(luò),可以對(duì)整個(gè)盤面的優(yōu)劣作出評(píng)估。與人類對(duì)弈的時(shí)候,Alphago應(yīng)用了蒙特卡洛搜索樹來整合這些神經(jīng)網(wǎng)絡(luò)。首先,策略網(wǎng)絡(luò)可以搜索出各種走法,然后估值網(wǎng)絡(luò)來對(duì)這些盤面的勝率進(jìn)行評(píng)估,最終決定走法。相比于傳統(tǒng)的單純暴力搜索,因?yàn)椴呗跃W(wǎng)絡(luò)形成了定式走法,估值網(wǎng)絡(luò)在對(duì)這些走法進(jìn)行評(píng)估刪減,最終可以大大減少搜索的寬度和深度。