在深度學(xué)習(xí)的時(shí)代,研究和工程已經(jīng)有融合的趨勢(shì),因此FAIR這兩方面的大牛都有。工作氣氛上來(lái)說(shuō),組內(nèi)較平等,討論自由,基本沒(méi)有傳統(tǒng)的上下級(jí)觀念。若是任何人有有趣的想法,大家都會(huì)傾聽(tīng)并且作出評(píng)論。要是想法正確,Yann也會(huì)喜歡。
沒(méi)有人逼著干活,但大家都在努力干活。
黑暗森林VS阿爾法Go誰(shuí)會(huì)贏?
據(jù)田淵棟的介紹,兩家公司在圍棋對(duì)弈項(xiàng)目里使用的人工智能技術(shù)有一定的重合性,但谷歌在快速走子(Fast rollout)和估值網(wǎng)絡(luò)(Value Network)兩方面有所加強(qiáng),F(xiàn)acebook的研究則是以開(kāi)源軟件Pachi的缺省策略 (default policy)部分替代了快速走子的功能。
澎湃新聞:看到你從走棋網(wǎng)絡(luò)、快速走子、估值網(wǎng)絡(luò)、蒙特卡羅樹(shù)搜索等四個(gè)方面對(duì)AlphaGo進(jìn)行了分析,在這四個(gè)方面,您覺(jué)得谷歌哪個(gè)方面做得最好,與你們的差異在那里?
田淵棟:AlphaGo這個(gè)系統(tǒng)主要由幾個(gè)部分組成:一是走棋網(wǎng)絡(luò)(Policy Network),即給定當(dāng)前局面,預(yù)測(cè)/采樣下一步的走棋。二是快速走子(Fast rollout),和目標(biāo)一是一樣的,但在適當(dāng)犧牲走棋質(zhì)量的條件下,速度要比1快1000倍。三是估值網(wǎng)絡(luò)(Value Network),給定當(dāng)前局面,估計(jì)是白子勝還是黑子勝。四是蒙特卡羅樹(shù)搜索(Monte Carlo Tree Search,MCTS),把以上這三個(gè)部分連起來(lái),形成一個(gè)完整的系統(tǒng)。
我們的DarkForest和AlphaGo同樣是用蒙特卡羅樹(shù)搜索搭建的系統(tǒng)。只是相較AlphaGo而言,在訓(xùn)練時(shí)加強(qiáng)了走棋網(wǎng)絡(luò),少了快速走子和估值網(wǎng)絡(luò),然后以開(kāi)源軟件Pachi的缺省策略(default policy)部分替代了快速走子的功能。
另外,據(jù)他們的文章所言,AlphaGo整個(gè)系統(tǒng)在單機(jī)上已具有了職業(yè)水平,若是谷歌愿意開(kāi)幾萬(wàn)臺(tái)機(jī)器和李世石對(duì)決,相信比賽會(huì)非常精彩。
澎湃新聞:Facebook人工智能實(shí)驗(yàn)室主管Yann LeCun一直希望各家人工智能平臺(tái)能做到開(kāi)源,這樣有利于人工智能的發(fā)展,你是否也贊同這種觀點(diǎn)?為什么?
田淵棟:我十分贊同,只有充分交流才能讓大家發(fā)展得更快更好。深度學(xué)習(xí)近兩年的大進(jìn)展很大程度上得益于像torch和caffe這樣開(kāi)源的計(jì)算平臺(tái),讓其它人能很快復(fù)現(xiàn)前人結(jié)果并加以改進(jìn)。
澎湃新聞:相較alphaGo取得的成績(jī),darkforest的下一步目標(biāo)是什么?不斷改進(jìn)版本后,你們希望自己的圍棋AI能達(dá)到什么樣的水平?
田淵棟:目前還在改進(jìn)中,會(huì)參加三月在日本的比賽。之后的目標(biāo)暫不公開(kāi),我也在思考中。
澎湃新聞:此次alphaGo與李世石,你是看好alphaGo還是李世石?無(wú)論結(jié)果如何,我們應(yīng)該如何看待這樣一場(chǎng)對(duì)決?
田淵棟:我不做預(yù)測(cè),我只說(shuō)很期待。
澎湃新聞:谷歌和Facebook成立人工智能實(shí)驗(yàn)室、通過(guò)收購(gòu)公司,布局人工智能,作為一名人工智能研究人員,你認(rèn)為這兩個(gè)公司是不是已經(jīng)代表硅谷人工智能研究領(lǐng)域的最高水平?
田淵棟:可以說(shuō)這兩個(gè)實(shí)驗(yàn)室網(wǎng)羅了全球人工智能領(lǐng)域最頂尖的研究和工程方面的人才,并且還在繼續(xù)網(wǎng)羅中。我們今年還會(huì)招挺多人,歡迎大家投簡(jiǎn)歷。
“我對(duì)人工智能持樂(lè)觀態(tài)度,但大家期望先不要太高”
科學(xué)技術(shù)的進(jìn)步帶來(lái)了人類生活質(zhì)量的提高,同時(shí)也在改變?nèi)祟?。面?duì)這些改變,有些人看到的是恐懼。他們擔(dān)心當(dāng)機(jī)器變得越來(lái)越智能,甚至?xí)^(guò)人類時(shí),會(huì)變成可怕的惡魔。基于此,霍金、特斯拉CEO馬斯克還成立了防范人工智能威脅聯(lián)盟。
但田淵棟個(gè)人對(duì)人工智能持樂(lè)觀態(tài)度。因?yàn)榫湍壳暗娜斯ぶ悄馨l(fā)展水平而言,還存在很多問(wèn)題,在創(chuàng)造性工作,處理突發(fā)事件,分析未知事件等方面還遠(yuǎn)不如人類。
澎湃新聞:你曾評(píng)論說(shuō)“到目前為止,人工智能系統(tǒng)要達(dá)到人類水平,還是需要大量樣本的訓(xùn)練的??梢哉f(shuō),沒(méi)有千年來(lái)眾多棋手在圍棋上的積累,就沒(méi)有圍棋AI的今天。”需要依賴于數(shù)據(jù)輸入,這是不是人工智能一直未突破的瓶頸之一?如何才能找到解決方法?
田淵棟:數(shù)據(jù)是現(xiàn)代基于統(tǒng)計(jì)推斷的人工智能的發(fā)動(dòng)機(jī),沒(méi)有數(shù)據(jù)大家就只能回到70年代的專家系統(tǒng)的老路里去了。關(guān)于如何突破,所有的人工智能專家都在努力中,我現(xiàn)在隨便說(shuō)兩個(gè)未經(jīng)實(shí)驗(yàn)驗(yàn)證的解決方案,不免貽笑大方,這里就不展開(kāi)了。方法論上說(shuō),給頂尖人才充分的自由度和大量的資源,讓他們作不停的努力和嘗試,容許犯錯(cuò),鼓勵(lì)創(chuàng)新,就會(huì)看到進(jìn)展的。