Hosseni 2014訓(xùn)練一個(gè)分類器判斷一個(gè)動(dòng)詞屬于加/減
最后,計(jì)算機(jī)需要具有一定有關(guān)現(xiàn)實(shí)世界的常識(shí)去理解自然語(yǔ)言里面一些隱式的指代。比如圓周率為3.14,速度乘以時(shí)間等于路程等等。在雞兔同籠問(wèn)題中,雞有兩條腿、兔有四條腿是隱式包含的條件,只有知道這些常識(shí)才能正確的解答問(wèn)題。
歷史與現(xiàn)狀
智能答題系統(tǒng)最早可以回溯到20世紀(jì)60年代。1964年提出的STUDENT(Bobrow 1964)系統(tǒng)可以視作早期答題人工智能實(shí)現(xiàn)的代表:輸入有規(guī)定的描述方式的數(shù)學(xué)題,人工定義一組關(guān)鍵詞和關(guān)系(如EQUAL, SUM, PRODUCT),把自然語(yǔ)言(linguistic form)通過(guò)模式匹配映射到對(duì)應(yīng)的函數(shù)關(guān)系表達(dá)。例如句子“the number of advertisements is 45”可轉(zhuǎn)化為函數(shù)表達(dá)方式(EQUAL (NUMBER OF ADVERTISMENTS)45)。之后的CARPS系統(tǒng)(Charniak 1968)能夠把自然語(yǔ)言表示成為成樹(shù)狀結(jié)構(gòu),再匹配生成公式解答,此外它嵌入了很多數(shù)學(xué)模型的知識(shí),如面積、體積、維度等等。但CARPS系統(tǒng)僅限于解決比率問(wèn)題 (ratio problem)。
2008年之前多數(shù)關(guān)于智能答題系統(tǒng)的工作都是基于預(yù)定義的模式匹配規(guī)則,這類工作主有兩個(gè)主要的缺點(diǎn):(1)定義的規(guī)則覆蓋率小,能解決的問(wèn)題十分有限,而在真實(shí)場(chǎng)景下數(shù)學(xué)題目的描述往往是比較自由、不太受限的;(2)評(píng)測(cè)比較模糊,這些系統(tǒng)很少給出評(píng)測(cè)結(jié)果以驗(yàn)證其有效性。
在這之后有了很多不同的嘗試。比如SoMaTePs系統(tǒng)(Liguda & Pfeiffer 2012)嘗試用擴(kuò)張語(yǔ)義網(wǎng)(Augmented Semantic Network)表示數(shù)學(xué)題,抽取題目的對(duì)象(object)作為節(jié)點(diǎn),節(jié)點(diǎn)之間的關(guān)系包括加減乘除。ARIS系統(tǒng)(Hosseini 2014)讓機(jī)器學(xué)習(xí)題目中的動(dòng)詞,并對(duì)這些動(dòng)詞進(jìn)行加減二分類,把數(shù)學(xué)題看作以動(dòng)詞為關(guān)系的狀態(tài)轉(zhuǎn)移圖,但這個(gè)方法目前只解決一元加減問(wèn)題,不考慮乘除。
MIT于2014年在國(guó)際計(jì)算語(yǔ)言年會(huì)(ACL 2014, Kushman 2014) 上提出了一種基于統(tǒng)計(jì)學(xué)習(xí)的方法(命名為KAZB),引入了模板的概念 (比如“1+1”和 “1+2”同屬于一個(gè)模板x = a + b) 。根據(jù)公式的標(biāo)注把數(shù)學(xué)題歸類成不同的題型,抽取題目中不同層次的特征(如有關(guān)詞匯、詞性以及語(yǔ)法等),使用統(tǒng)計(jì)學(xué)習(xí)技術(shù)自動(dòng)判斷題型。但是此類方法的一個(gè)缺點(diǎn)為:無(wú)法解決訓(xùn)練集之外的題型。比如訓(xùn)練集只出現(xiàn)過(guò)兩個(gè)數(shù)相加,機(jī)器無(wú)法泛化解答三個(gè)數(shù)相加的問(wèn)題。之后百度ZDC(Zhou et al. 2015),微軟研究院 (Upadhyay 2016)的研究團(tuán)隊(duì)也在同樣的方法框架下分別做了不同的優(yōu)化改進(jìn)。在一個(gè)開(kāi)放的評(píng)測(cè)數(shù)據(jù)集上(即ALG514,含有514道題),三個(gè)系統(tǒng)準(zhǔn)確率在上分別是68.7%,78.7%以及83%。
隨后,華盛頓大學(xué)的ALGES系統(tǒng)(Koncel-Kedziorski et al. 2015)定義了Qset的概念(一個(gè)Qset包括Quantity,Entity,Adjective等屬性)。首先抽取一道問(wèn)題的Qset,利用線性整數(shù)規(guī)劃把Qset和加減乘除生成可能的公式,再選出最有可能的公式解出答案。目前限定于一元一次方程。他們同時(shí)構(gòu)建了一個(gè)508道題的數(shù)據(jù)集,系統(tǒng)獲得的準(zhǔn)確率在72%左右。
艾倫人工智能研究所除了考慮數(shù)學(xué)文字題之外,還有關(guān)于幾何看圖題的研究。GEOS (Seo et al. 2015) 根據(jù)幾何數(shù)學(xué)定義了一組數(shù)學(xué)概念以及函數(shù),對(duì)圖和文字分別構(gòu)建了不同的分析器(parser)。他們?cè)?86道SAT的數(shù)學(xué)題上獲得的準(zhǔn)確率大概是60%左右。
下表對(duì)以上一些具有代表性的系統(tǒng)做出了總結(jié)。給出一道數(shù)學(xué)題文字描述,系統(tǒng)需要涵蓋三大部分:自然語(yǔ)言理解,語(yǔ)義表達(dá)和映射以及數(shù)學(xué)推理得出解決公式和答案。
應(yīng)用場(chǎng)景
作為一種有趣的人工智能問(wèn)題,數(shù)學(xué)解題相關(guān)的研究和努力不僅有助于推動(dòng)機(jī)器智能的進(jìn)步,同時(shí)也會(huì)在眾多實(shí)際應(yīng)用場(chǎng)景中產(chǎn)生價(jià)值。
>>>> 線上教育
近幾年興起的中小學(xué)生學(xué)習(xí)平臺(tái),該類應(yīng)用普遍會(huì)支持如下功能——學(xué)生可以采取對(duì)準(zhǔn)題目拍照,或者文字語(yǔ)音方式來(lái)輸入數(shù)學(xué)題,學(xué)習(xí)平臺(tái)識(shí)別題目并給出解題思路。由于此類平臺(tái)具有龐大的題庫(kù),因此可以通過(guò)識(shí)別匹配題目來(lái)實(shí)現(xiàn)上功能。該應(yīng)用的用戶量已經(jīng)突破一億,在教育市場(chǎng)份額巨大。但是這些平臺(tái)中所有的題目需要人工預(yù)設(shè)解題思路,受限于此,題庫(kù)的擴(kuò)展存在一定約束。人工智能數(shù)學(xué)解題的成功解決將會(huì)大大提升此類平臺(tái)。