讓機(jī)器以一種“常識(shí)”的方式自行思考是計(jì)算領(lǐng)域的“圣杯”。美國(guó)卡內(nèi)基·梅隆大學(xué)研究人員正嘗試著給計(jì)算機(jī)植入人工智能的數(shù)字化“種子”——讓計(jì)算機(jī)系統(tǒng)不斷觀看各種圖畫,并自己決定它看到的內(nèi)容都是什么意思。研究小組將在12月4日澳大利亞悉尼召開的美國(guó)電氣與電子工程師協(xié)會(huì)(IEEE)國(guó)際機(jī)器人視覺大會(huì)報(bào)告他們的成果。
從今年7月開始,在卡內(nèi)基·梅隆大學(xué),一個(gè)名為“尼爾”(NEIL)的計(jì)算機(jī)程序就在24小時(shí)不停地從互聯(lián)網(wǎng)上搜尋圖像。其中有幾個(gè)關(guān)鍵小步驟,就是它要自己決定這些圖像之間的相互關(guān)系,盡可能自行理解它們,以此建立起我們所謂的“常識(shí)”。
常識(shí)與聯(lián)想
“尼爾”是“無休止圖像學(xué)習(xí)”(NeverEndingImageLearning)的縮寫,其在兩個(gè)計(jì)算機(jī)組群上運(yùn)行,包括200個(gè)處理器核。隨著它的視圖數(shù)據(jù)越來越多,積累的“常識(shí)”也越來越多。常識(shí)是人們似乎知道卻不曾明說的信息,比如汽車通常是跑在公路上,建筑物往往是垂直的,鴨子看起來很像鵝等。
“任何智能都要有常識(shí)來幫它作決策。”卡內(nèi)基·梅隆機(jī)器人研究所教授阿比納伍·古普塔說,讓一臺(tái)計(jì)算機(jī)自己聯(lián)想,對(duì)它來說是完全不同的挑戰(zhàn)。比起編制一臺(tái)超級(jí)計(jì)算機(jī)程序來說,圓滿迅速地完成一項(xiàng)任務(wù)更難以應(yīng)付。比如1985年卡內(nèi)基·梅隆研究人員編制下棋程序讓一臺(tái)計(jì)算機(jī)下棋;12年后,計(jì)算機(jī)打敗了國(guó)際象棋冠軍加里·卡斯帕羅夫。
麻省理工大學(xué)人工智能專家凱瑟琳·哈瓦希說,人類能不斷利用“不言而喻的假定這一巨大庫(kù)存”來作決策,而計(jì)算機(jī)卻不能。對(duì)一些人類能迅速作出反應(yīng)的問題,計(jì)算機(jī)卻要花更長(zhǎng)時(shí)間才能算出來。“長(zhǎng)頸鹿能坐上你的汽車嗎?我們甚至不用思考就能得出答案。”她說,因?yàn)槲覀儗?duì)長(zhǎng)頸鹿的身體大小有一種常識(shí)。
隨著程序運(yùn)行,“尼爾”逐漸能給圖像做次級(jí)分類,比如三輪車可以分為小孩用、大人用,還能裝上發(fā)動(dòng)機(jī)變成三輪摩托;汽車有不同的商標(biāo)和樣式等。然后它慢慢注意到事物之間的聯(lián)系:斑馬往往出現(xiàn)在大草原上,老虎看起來有點(diǎn)像斑馬,股票交易所大樓通常擠滿了人。
在短短4個(gè)月里,“尼爾”的200個(gè)處理器核已經(jīng)分析了3百萬幅圖像,從其中50萬幅中識(shí)別出了1500種物體,1200個(gè)場(chǎng)景,并把相關(guān)的點(diǎn)連接起來做了2500個(gè)關(guān)系聯(lián)想。“尼爾”生成的聯(lián)想有些是錯(cuò)的,比如“犀牛是一種羚羊”,而有些很奇怪,如“演員在監(jiān)獄牢房里”或“新聞主播看起來像巴拉克·奧巴馬”。
“我爬,我看,我學(xué)習(xí)”
“圖像是學(xué)習(xí)視覺性質(zhì)的最佳方法,”阿比納伍·古普塔說,“圖像也包括了與這個(gè)世界有關(guān)的許多常識(shí)信息。人類自己學(xué)習(xí)了這一點(diǎn),對(duì)于‘尼爾’,我們希望它也能像我們一樣。”
伊利諾伊大學(xué)芝加哥分校計(jì)算機(jī)科學(xué)系主任、人工智能專家羅伯特·斯洛恩說,“尼爾”的方法會(huì)產(chǎn)生有趣的結(jié)果,因?yàn)橹挥谜Z(yǔ)言去教一臺(tái)計(jì)算機(jī)“會(huì)帶來各種問題”,“如果它們對(duì)著不管什么地方看到的動(dòng)物,都不停地說‘斑馬、斑馬、斑馬’,我會(huì)對(duì)這一幕印象深刻。”
機(jī)器人學(xué)博士生阿比納伍·希瑞瓦斯塔伍說,“尼爾”有時(shí)也會(huì)出錯(cuò),所以還需要有人工參與。比如谷歌圖像搜索可能會(huì)“誤導(dǎo)”它,讓它以為“pink”(意為粉紅色)是一位歌星的名字,而不是一種顏色。
“人們不一定總是知道該怎么去教計(jì)算機(jī),以及教它們學(xué)什么,但發(fā)現(xiàn)它什么時(shí)候出錯(cuò),人們是很擅長(zhǎng)的。”希瑞瓦斯塔伍說,人們會(huì)告訴“尼爾”,物體、場(chǎng)景等屬于哪一類,以便研究分析。
有時(shí)候,“尼爾”的預(yù)測(cè)能力也讓研究人員震驚。在搜尋“蘋果”時(shí),不僅給出了水果圖,還有蘋果電腦;搜索F-18時(shí)不僅發(fā)現(xiàn)了戰(zhàn)斗機(jī),還有F-18級(jí)雙體船,這是古普塔和他的陸地小組所不知道的。