下面是示意圖,選擇得分為 9 的最下面那條路線,顯然結(jié)果最好(能夠拿到 3 頂帽子)。
實(shí)際上,類似的思路也被用于游戲環(huán)境中的規(guī)劃問(wèn)題,但 Facebook 研究人員表示,這種方法此前還從未被用于語(yǔ)言研究,原因是可以選擇的行動(dòng)數(shù)量過(guò)于巨大。
為了提高效率,F(xiàn)AIR 研究人員首先生成了一小部分備選的表述(utterance),然后重復(fù)模擬未來(lái)的整個(gè)對(duì)話,從而估算這種表述成功的程度。FAIR 開(kāi)發(fā)的這種模型,預(yù)測(cè)準(zhǔn)確率足夠高,從而在好幾個(gè)方面極大提升了談判策略:
更努力地談判(Negotiating harder):新的智能體能與人類進(jìn)行更長(zhǎng)時(shí)間的對(duì)話,不會(huì)那么快就成交。模型會(huì)一直談判一直談判,直到達(dá)成協(xié)議。
有策略地談判(Intelligent maneuvers):在一些案例中,智能體在最開(kāi)始會(huì)對(duì)自己不感興趣的東西裝作很感興趣,之后把這些東西放棄,顯得自己做出了妥協(xié)——人在談判時(shí)也常常使用這種策略。FAIR 研究人員表示,這不是編程實(shí)現(xiàn)的,而是 bot 自己觀察后認(rèn)為這是一種實(shí)現(xiàn)目的的好方法。
生成新的句子(Producing novel sentences):神經(jīng)網(wǎng)絡(luò)往往傾向于重復(fù)訓(xùn)練數(shù)據(jù)中見(jiàn)過(guò)的句子,但在這項(xiàng)研究中,模型在必要時(shí)生成了新的句子。
從 Facebook 官博上給出的例子(見(jiàn)下),這個(gè)談判 AI 開(kāi)發(fā)還是成功的:
AI 用人類不懂的方式溝通非常正常,難的是讓 AI“說(shuō)人話”
現(xiàn)在,F(xiàn)acebook 確實(shí)關(guān)閉了這個(gè)對(duì)話項(xiàng)目,但并不是因?yàn)樗麄儗?duì)創(chuàng)造出可能不受控制的智能體感到恐慌。
在 FastCo 的報(bào)道中,F(xiàn)AIR 另一名研究員 Mike Lewis 說(shuō),他們決定關(guān)閉對(duì)話,因?yàn)?ldquo;我們感興趣的是做能夠與人類對(duì)話的 bot”,而不是 bot 互相間能夠很有效率地進(jìn)行對(duì)話,“我們要求 bot 相互之間的對(duì)話要能夠被人理解”。
但在這個(gè)媒體浮夸的時(shí)代,新聞報(bào)道所做的可能與這些機(jī)器人并沒(méi)什么不同,這個(gè)故事從關(guān)注機(jī)器學(xué)習(xí)技術(shù)的短期實(shí)現(xiàn)潛力,演變成制造恐慌的末日故事。
實(shí)際上,正如 Dhruv Batra 所說(shuō),AI 之間“交流”是非常普通的一個(gè)現(xiàn)象,只要你把兩個(gè)機(jī)器學(xué)習(xí)設(shè)備放在一起,并讓它們相互學(xué)習(xí),都會(huì)出現(xiàn)這樣的現(xiàn)象。值得一提的是,假如 bot 之間簡(jiǎn)略的“語(yǔ)言”可以解釋,出來(lái)的對(duì)話也就能夠理解,并且完全不像之前的那么可怕。
這類機(jī)器學(xué)習(xí)技術(shù)可能讓智能設(shè)備或系統(tǒng)更高效地相互交流。如果說(shuō)這些成果引出一些問(wèn)題,就是一旦這樣的系統(tǒng)出錯(cuò),debug 會(huì)非常不容易!但這完全不是說(shuō)人工智能脫離了人類的控制。
上海交通大學(xué)教授、斯坦福 AI Lab 博士后盧策吾在接受新智元采訪時(shí)表示,這件事情告訴我們,沒(méi)有很 solid 和 novel 的工作,PR 需謹(jǐn)慎,可能對(duì)自己和機(jī)構(gòu)都是副作用。研究計(jì)算機(jī)是否能(非監(jiān)督地)獨(dú)立產(chǎn)生自己的語(yǔ)言,這件事情本身是非常有意義的科學(xué)探索,因?yàn)檫@是檢驗(yàn)計(jì)算機(jī)是否理解人類高級(jí)語(yǔ)義和抽象概念的好方法。
他也建議大家有興趣的話,可以看一下Noam Chomsky 的經(jīng)典討論,這樣更能把語(yǔ)言產(chǎn)生這件事的高度提高一下。
“這就像一個(gè)與世隔絕的部落,AI 獨(dú)立產(chǎn)生了自己語(yǔ)言,雖然符號(hào)表達(dá)和我們不一樣,但是我們一翻譯,發(fā)現(xiàn)它們有和我們一樣的高級(jí)語(yǔ)義,比如“朋友”,“愛(ài)情”等等,我會(huì)說(shuō)他們真的理解這些概念,具有人類的高級(jí)智能。”盧策吾告訴新智元。
目前,計(jì)算機(jī)能識(shí)別“貓”,“狗”,“汽車”,但計(jì)算機(jī)真的理解這個(gè)概念嗎?盧策吾認(rèn)為不一定,更多是像模式識(shí)別(pattern recognition)。“例如,有一輛外形奇怪的車,在訓(xùn)練集合里沒(méi)出現(xiàn)過(guò),計(jì)算機(jī)馬上就掛了,因?yàn)橛?jì)算機(jī)沒(méi)有‘什么是車’這個(gè)概念,而是記下一般情況下車的長(zhǎng)相。”盧策吾說(shuō):“這樣就看出,目前計(jì)算機(jī)沒(méi)有真正全面地理解人類概念,還是比較低級(jí)別的 AI。如果計(jì)算機(jī)真的理解人類概念,其對(duì)現(xiàn)實(shí)世界的改造威力將會(huì)大上好幾個(gè)量級(jí)。”