不過(guò),神經(jīng)網(wǎng)絡(luò)為新的AI領(lǐng)域構(gòu)筑了一部分基礎(chǔ)。一些繼續(xù)在ANNs上奮斗的研究者終于意識(shí)到這些網(wǎng)絡(luò)可以被認(rèn)為是在統(tǒng)計(jì)和概率方面對(duì)外部世界的重現(xiàn)。與“突觸”和“動(dòng)作電位”這些生理學(xué)上的稱呼不同,他們稱之為“參數(shù)化”和“隨機(jī)變量”。田納邦說(shuō),“現(xiàn)在,ANNs聽(tīng)起來(lái)更像一個(gè)龐大的概率模型而不是一顆大腦。”
然后在1988年,加州大學(xué)洛杉磯校區(qū)的朱迪亞·珀兒寫了一本里程碑式的書《智能系統(tǒng)的或然性推理》,里面詳細(xì)地描述了AI的全新方案。支持這本書的理論是湯瑪斯·貝葉斯提出的一個(gè)原理。湯瑪斯·貝葉斯 是18世紀(jì)的一名英國(guó)數(shù)學(xué)家和牧師,他把以事件Q發(fā)生為前提下事件P發(fā)生的條件概率和以事件P發(fā)生為前提下事件Q發(fā)生的條件概率聯(lián)系起來(lái)。這個(gè)原理提供了一個(gè)在原因和結(jié)果間來(lái)回推導(dǎo)的方法。“如果你能對(duì)感興趣的不同事物用那樣的方式描述,那么貝葉斯推論的數(shù)學(xué)方法會(huì)教你如何通過(guò)觀察結(jié)果,然后逆推各種不同起因的可能性,”田納邦如是說(shuō)。
新方案的關(guān)鍵就是貝葉斯網(wǎng)絡(luò),一個(gè)由各種隨機(jī)變量組成的模型,在這個(gè)模型里每個(gè)變量的概率分布都取決于其他變量。給定一個(gè)或多個(gè)變量的值,通過(guò)貝葉斯網(wǎng)絡(luò)則可推導(dǎo)出其他變量的概率分布,換言之,得出他們的可能值 。假定這些變量表示癥狀、疾病和檢查結(jié)果,給出檢查結(jié)果(一種濾過(guò)性病毒感染)和癥狀(發(fā)熱和咳嗽),則可給可能潛在的病因賦予不同的幾率(流感,很可能;肺炎,不太可能)。
二十世紀(jì)九十年代中期,包括羅素在內(nèi)的研究員開(kāi)始開(kāi)發(fā)算法,使貝葉斯網(wǎng)絡(luò)能利用和學(xué)習(xí)現(xiàn)有的數(shù)據(jù)。這很大程度上跟人類基于早期理解的學(xué)習(xí)方式相同,新的算法卻能通過(guò)更少的數(shù)據(jù)來(lái)學(xué)習(xí)更復(fù)雜和更準(zhǔn)確的模型。對(duì)ANNs來(lái)說(shuō),這是前進(jìn)的一大步,因?yàn)闊o(wú)需考慮先驗(yàn)知識(shí),可以從頭學(xué)習(xí)解決新的問(wèn)題。
搜獵核武器
人們開(kāi)始逐漸理解各種努力和嘗試,去創(chuàng)造為現(xiàn)實(shí)世界而設(shè)的人工智能。一個(gè)貝葉斯網(wǎng)絡(luò)中,各種參數(shù)是概率的分布,如果我們對(duì)這個(gè)世界知道得越多,這些分布值越有用。與一階邏輯下構(gòu)建的網(wǎng)絡(luò)不同,不完整的知識(shí)并不會(huì)導(dǎo)致貝葉斯網(wǎng)絡(luò)迅速崩潰。
盡管這樣,邏輯也并非無(wú)用武之地。事實(shí)證明貝葉斯網(wǎng)絡(luò)本身并不充分,因?yàn)樗辉试S以簡(jiǎn)單片段任意構(gòu)建復(fù)雜結(jié)構(gòu),取而代之的是一個(gè)由綜合的邏輯程序和貝葉斯網(wǎng)絡(luò)組成的,進(jìn)入熱門話題領(lǐng)域的概率性程序。
這種新AI的最前端是少數(shù)合并基礎(chǔ)元素和所有靜止研究工具的計(jì)算機(jī)語(yǔ)言,其中有Church語(yǔ)言,由古德曼、田納邦和同事開(kāi)發(fā),以某計(jì)算機(jī)程序邏輯的開(kāi)創(chuàng)者阿隆索·丘奇命名。多明戈斯的團(tuán)隊(duì)開(kāi)發(fā)了馬爾科夫邏輯網(wǎng)絡(luò),融合了邏輯型網(wǎng)絡(luò)和與貝葉斯網(wǎng)絡(luò)相似的馬爾科夫網(wǎng)絡(luò)。羅素則和他的同事使用了一個(gè)直接明了的名字,叫“貝葉斯邏輯”(BLOG).
最近在奧地利維也納召開(kāi)的聯(lián)合國(guó)全面禁止核試條約組織(CTBTO)大會(huì)上,羅素展示了Church語(yǔ)言的表達(dá)能力。CTBTO邀請(qǐng)了羅素,因?yàn)樗麄冾A(yù)感到新的AI技術(shù)可能有助于監(jiān)測(cè)核爆炸。聽(tīng)過(guò)一上午的關(guān)于監(jiān)測(cè)地震背景下遠(yuǎn)距離核爆引發(fā)的地震特征、穿過(guò)地球的信號(hào)傳播異常和世界地震站的噪音探測(cè)器的演示報(bào)告后,羅素開(kāi)始著手用概率程序的設(shè)計(jì)(神經(jīng)信息處理系統(tǒng)前沿,卷23,麻省理工學(xué)院出版Advances in Neural Information Processing Systems, vol 23, MIT Press)。他說(shuō),“在午飯時(shí)間,我已能為整個(gè)問(wèn)題編寫一個(gè)完整的模型。”,這個(gè)模型足足有半頁(yè)之長(zhǎng)。
這類模型能整合先驗(yàn)知識(shí),例如,對(duì)印度尼西亞蘇門塔臘和英國(guó)伯明翰地區(qū)發(fā)生地震的幾率做比較。CTBTO同時(shí)要求任何一個(gè)系統(tǒng)首先假定發(fā)生在地球上任何地方的核爆幾率均等,然后才使用來(lái)自CTBTO監(jiān)測(cè)站接收的真實(shí)信號(hào)數(shù)據(jù)。AI系統(tǒng)要做的就是獲取所有數(shù)據(jù),對(duì)每組數(shù)據(jù)最可能的解釋作出推斷。
挑戰(zhàn)就在其中。像BLOG這樣的語(yǔ)言是由所謂的通用推理機(jī)組成的。已知某個(gè)現(xiàn)實(shí)問(wèn)題的模型和眾多變量及概率分布,推理機(jī)只能計(jì)算某種情況的可能性,例如,在已知期望事件的事前幾率和新地震數(shù)據(jù)下,推斷一次在中東發(fā)生的核爆。但是如果變量改成代表癥狀和疾病,那么它就必定能做出醫(yī)學(xué)診斷。換言之,其中的算法必須是非常普遍的,這也意味著這些算法極其低效。