圖靈測(cè)試與人工智能的關(guān)系可以用集合的概念進(jìn)行闡述,如上圖所示。從圖中可以看到“所有人類(lèi)行為”對(duì)應(yīng)的集合“和所有智能行為”對(duì)應(yīng)的集合有交集但又互有不同。雖然“在全部智能行為”中有部分能力是人類(lèi)靠自身力量無(wú)法完全實(shí)現(xiàn),但人類(lèi)可以被認(rèn)為是有智能標(biāo)準(zhǔn)體,因此,能達(dá)到“人類(lèi)水平”的部分 也就是兩個(gè)集合交集的那個(gè)部分就應(yīng)該被認(rèn)作是“擁有智能”的特征。而且,人類(lèi)的所有行為并不總是和智能相關(guān)。圖靈測(cè)試要求機(jī)器全面模擬“所有人類(lèi)行為”,其中既包括人類(lèi)“智能”的部分,也包括人類(lèi)的“非智能”行為,由此可得出結(jié)論通過(guò)圖靈測(cè)試是 “擁有智能”的一個(gè)有效的充分條件,而非必要條件或充要條件?!疽陨蟽?nèi)容引用微軟研究院】
作為最被廣泛應(yīng)用的人工智能測(cè)試方法,圖靈測(cè)試經(jīng)常用來(lái)檢驗(yàn)機(jī)器是否具備人的智能,但總體看,圖靈測(cè)試的方法受人為因素干擾太多,嚴(yán)重依賴(lài)于裁判者和被測(cè)試者的主觀(guān)判斷,因此往往有人在沒(méi)有得到嚴(yán)格驗(yàn)證的情況下宣稱(chēng)其程序通過(guò)圖靈測(cè)試,例如2014年6月英國(guó)雷丁大學(xué)客座教授凱文沃維克宣稱(chēng)一款名為“尤金 古特曼(Eugene Goostman)”的計(jì)算機(jī)軟件通過(guò)了測(cè)試[30],但是測(cè)試結(jié)果充滿(mǎn)爭(zhēng)議,例如機(jī)器人只要能夠通過(guò)30%的評(píng)判標(biāo)準(zhǔn)即可被判定通過(guò)圖靈測(cè)試,另外這個(gè)計(jì)算機(jī)軟件通過(guò)扮演一名年僅13歲,且第二外語(yǔ)為英語(yǔ)的男孩讓參與測(cè)試的裁判大幅度降低了測(cè)試難度。
中國(guó)科學(xué)院自動(dòng)化所研究員王飛躍在“關(guān)于人工智能九個(gè)問(wèn)題”中也對(duì)圖靈測(cè)試存在的問(wèn)題進(jìn)行了討論,他的意見(jiàn)主要有以下兩點(diǎn):
(1)第一點(diǎn)是人類(lèi)的智能并不是一個(gè)單一的對(duì)象,而是有多個(gè)類(lèi)別組成,同樣人工智能對(duì)應(yīng)也是多類(lèi)別組成。圖靈測(cè)試究竟測(cè)試的那些類(lèi)別并不明確,從實(shí)踐上看,目前圖靈測(cè)試僅僅局限在語(yǔ)言智能等特定小領(lǐng)域里,不具備代表性。
(2)圖靈測(cè)試并不是考官對(duì)一臺(tái)計(jì)算機(jī)測(cè)試后就可以宣布其是否擁有智能,圖靈測(cè)試的本意是指一個(gè)廣義的人類(lèi)做個(gè)為整體的考官,其測(cè)試的時(shí)間段也不是具體的一段時(shí)間而是廣義的時(shí)間段,即所有的人類(lèi)在所有時(shí)間都分辨不出人與機(jī)器之后,才算其人類(lèi)智能與人工智能等價(jià)。
從上述討論可以看出,圖靈實(shí)驗(yàn)只對(duì)人工智能系統(tǒng)是否具有人類(lèi)智能回答“是”或“否”,并不對(duì)人工智能系統(tǒng)的發(fā)展水平進(jìn)行定量分析,而且測(cè)試的智能或智力種類(lèi)還過(guò)于單一;在測(cè)試方法上存在漏洞,容易被測(cè)試者找到漏洞從而產(chǎn)生作弊行為,從上述存在的問(wèn)題看,圖靈實(shí)驗(yàn)?zāi)壳斑€無(wú)法承擔(dān)定量分析智能系統(tǒng)智力發(fā)展水平的需求。
二,解決人工智能威脅論爭(zhēng)論的四個(gè)困難
總體看,目前包括圖靈測(cè)試在內(nèi)的各種方案中還存在無(wú)法定量分析人工智能發(fā)展水平的問(wèn)題,只能定性的判斷一個(gè)人工智能系統(tǒng)是否和人一樣擁有同等水平的智力。但這個(gè)系統(tǒng)和人類(lèi)智慧進(jìn)行對(duì)比,高低程度如何,發(fā)展速度與人類(lèi)智慧發(fā)展速度比率如何,上述中研究沒(méi)有涉及到可具體執(zhí)行的思路和方案。我們認(rèn)為這些問(wèn)題長(zhǎng)時(shí)間存在,主要與下面提到的四點(diǎn)困難有關(guān)。
(1)第一個(gè)困難是沒(méi)有統(tǒng)一的模型和測(cè)試方法對(duì)不同的人工智能系統(tǒng)進(jìn)行測(cè)試。人工智能無(wú)論從理論研究還是從應(yīng)用實(shí)踐都存在眾多分支和發(fā)展方向。在理論上人工智能分為三大學(xué)派,如符號(hào)主義(Symbolicism)或計(jì)算機(jī)學(xué)派(Computerism);連結(jié)主義或生理學(xué)派(Physiologism);行為主義(Actionism)或控制論學(xué)派(Cyberneticsism)等。在應(yīng)用實(shí)踐上,人工智能可以應(yīng)用的方向包括符號(hào)計(jì)算、模式識(shí)別、機(jī)器翻譯、機(jī)器學(xué)習(xí)、問(wèn)題求解、邏輯推理與定理證明、自然語(yǔ)言處理、分布式人工智能、計(jì)算機(jī)視覺(jué)、智能信息檢索、專(zhuān)家系統(tǒng)等等。
每種具體的人工智能系統(tǒng)往往只具備一個(gè)或若干上述提到的功能。例如IBM的深藍(lán)強(qiáng)于計(jì)算能力,在國(guó)際象棋方面可以與人類(lèi)對(duì)手一決高下;沃森系統(tǒng)擁有龐大知識(shí)庫(kù)系統(tǒng),因此可以在常識(shí)問(wèn)答比賽中擊敗人類(lèi)選手。因?yàn)闆](méi)有統(tǒng)一的模型可以涵蓋這些人工智能系統(tǒng),就無(wú)法形成統(tǒng)一的測(cè)試方法進(jìn)行測(cè)試和比較。如圖1.2所示,人工智能系統(tǒng)A 在計(jì)算能力上得分為100,人工智能系統(tǒng)B 在計(jì)算機(jī)視覺(jué)識(shí)別上得分為80,人工智能系統(tǒng)C在機(jī)器翻譯測(cè)試得分為90分,我們?nèi)匀粺o(wú)法得出結(jié)論A的智力能力高于C,C的智力能力高于B的結(jié)論。