二 本體論語(yǔ)義學(xué)關(guān)于語(yǔ)義加工系統(tǒng)的構(gòu)想
要回答機(jī)器的語(yǔ)義加工何以可能,完成機(jī)器對(duì)人類自然語(yǔ)言加工的模擬,首先必須解決的問(wèn)題是:人的自然語(yǔ)言加工何以可能?根據(jù)本體論語(yǔ)義學(xué)家的研究,所以可能的條件不外是:人類有將它與語(yǔ)言關(guān)聯(lián)起來(lái)的能力,有別的技能,有情感和意志之類的非理性方面,因?yàn)槿藗冑x予語(yǔ)詞的意義常帶有情感色彩。另外,就是活動(dòng)的目的、計(jì)劃及程序,最后就是各種知識(shí)資源。
本體論語(yǔ)義學(xué)認(rèn)為,人類之所以能理解和產(chǎn)生意義,最重要的條件就是人類有一種本體論圖式。正是借助它,任何語(yǔ)言一進(jìn)到心靈之中就有了自己的歸屬,被安放進(jìn)所屬的類別之中,如聽(tīng)到了“紅”一詞,人們馬上有這樣的歸類:它指的是屬性,與“綠”“藍(lán)”等屬一類,為物體所具有,因而不是物體,等等而是基本概念與范疇。尼倫伯格等人說(shuō):“本體論語(yǔ)義學(xué)試圖探討的是人們?cè)趦?nèi)省式和反思式地看待概念時(shí)對(duì)這些概念的運(yùn)用。人們常常談?wù)搶傩?。虛?gòu)的實(shí)在(獨(dú)角獸或赫爾墨斯)和抽象的實(shí)質(zhì),把它們當(dāng)作存在的。不過(guò)對(duì)于我們來(lái)說(shuō),決定把它們放在本體論之中不是根源于這樣的事實(shí),即這些實(shí)在是用自然的語(yǔ)言指稱的,而是因?yàn)槲覀兿嘈牛河捎谌藗冊(cè)谒麄兊挠钪嬷杏羞@些概念因而語(yǔ)言才指稱它們。”[10]因此,在語(yǔ)義機(jī)模型中,我們首先要建立的就是這種本體論圖式。根據(jù)他們的看法,“本體論提供的是描述一種語(yǔ)言的詞匯單元的意義所需的原語(yǔ)言,以及說(shuō)明編碼在自然語(yǔ)言表征中的意義所需的原語(yǔ)言。而要提供這些東西,本體論必須包含有對(duì)概念的定義,這些概念可理解為世界上的事物和事件類別的反映。從結(jié)構(gòu)上說(shuō),本體論是一系列的構(gòu)架,或一系列被命令的屬性-價(jià)值對(duì)子。”[11]它為要表征的詞項(xiàng)的意義作本體論的定位,即說(shuō)明它屬于哪一類存在,其特點(diǎn)、性質(zhì)、邊界條件是什么。例如當(dāng)有一詞“pay”輸入進(jìn)來(lái),首先就要經(jīng)過(guò)本體論這一環(huán)節(jié),換言之,該詞首先要被表征為一個(gè)本體論概念,要被放進(jìn)本體論的概念體系之中,一當(dāng)這樣做了,它的屬性、值便被規(guī)定了。有了本體論概念框架,在這種靜態(tài)知識(shí)資源上就可以不斷生成各種含有意義表征的動(dòng)態(tài)知識(shí)資源。動(dòng)態(tài)的知識(shí)資源是在應(yīng)用所提出的任務(wù)、要求的基礎(chǔ)上所產(chǎn)生的知識(shí)。
有了關(guān)于人類加工自然語(yǔ)言所需條件比較清楚和量化的認(rèn)識(shí),就有可能通過(guò)建立相應(yīng)的網(wǎng)絡(luò)讓計(jì)算機(jī)也獲得這樣的條件,進(jìn)而讓機(jī)器表現(xiàn)出對(duì)意義的敏感,最終具有語(yǔ)義加工能力。本體論語(yǔ)義學(xué)相信:這不是沒(méi)有可能的,至少有巨大的開發(fā)前景。對(duì)此,本體語(yǔ)義學(xué)進(jìn)行大膽地嘗試,并建構(gòu)出典型的語(yǔ)義加工模型。其具體操作就是:先讓加工器具備靜態(tài)和動(dòng)態(tài)的知識(shí)知源,然后讓其有相應(yīng)的加工能力。在實(shí)踐的基礎(chǔ)上,尼倫伯格等人通過(guò)分析公認(rèn)的自然語(yǔ)言加工Stratified模型,詳細(xì)說(shuō)明了機(jī)器進(jìn)行語(yǔ)義加工的基本原理與過(guò)程。
在尼倫伯格等人看來(lái),智能主體要理解文本意義離不開至少六個(gè)基本環(huán)節(jié)的加工。第一步是文本分析,即要對(duì)輸入的文本產(chǎn)生一個(gè)表征了文本的意義的正式表達(dá)式。由這任務(wù)所決定,它必須有分析器和生成器。從文本分析過(guò)程來(lái)說(shuō),文本要輸入到系統(tǒng)之中,首先要經(jīng)過(guò)“前加工”將文本加以重新標(biāo)記,并區(qū)別分析不同語(yǔ)言、不同體裁和風(fēng)格的不同文本,以便讓文本能為系統(tǒng)所分析。第二步是對(duì)標(biāo)記過(guò)的文本動(dòng)用生態(tài)學(xué)、形態(tài)學(xué)、語(yǔ)法學(xué)、詞匯學(xué)的靜態(tài)知識(shí)資源作形態(tài)學(xué)分析,形成關(guān)于文本單詞的引用形式分辨。例如碰到“書”這個(gè)詞的輸入,形態(tài)學(xué)分析會(huì)這樣來(lái)分析:“book,名詞,復(fù)數(shù)”,“book,動(dòng)詞,現(xiàn)在時(shí),第三人稱,單數(shù)”等。第三步就會(huì)把它們送給詞匯學(xué)分析器,并激活這一分析器的入口。這個(gè)入口包含有許多類型的知識(shí)和信息,如關(guān)于句法的信息,關(guān)于詞匯語(yǔ)義學(xué)的信息,其作用是檢查、凈化形態(tài)學(xué)分析的結(jié)果。例如英文文本中可能夾雜有法、德、意等語(yǔ)言的單詞,還有一些模棱兩可的單詞,更麻煩的是,有些詞在詞匯分析器中沒(méi)有出現(xiàn)過(guò),因此無(wú)法予以檢查。在這些情況下,就要予以查檢、甄別,如對(duì)不熟悉的詞,它有一些處理的步驟和辦法。第四步是句法分析。第五步是決定基本的語(yǔ)義從屬關(guān)系,例如建立未來(lái)的意義表征的命題結(jié)構(gòu),確定哪些因素將成為這些命題的主題,并決定該命題的屬性位置。