Facebook人工智能研究部門(FAIR)負(fù)責(zé)人Yann LeCun
錢童心
當(dāng)今世界人工智能領(lǐng)域,有三位頂級(jí)專家被業(yè)內(nèi)奉為“神一樣的人物”,其中兩位來自加拿大,一位來自法國(guó)。他們分別是加拿大多倫多大學(xué)的Geoffrey Hinton和蒙特利爾大學(xué)的終身教授Yoshua Bengio,以及Facebook人工智能研究部門(FAIR)負(fù)責(zé)人Yann LeCun(下稱“LeCun”)——這位來自巴黎的學(xué)者目前擔(dān)任紐約大學(xué)終身教授,他還是紐約大學(xué)數(shù)據(jù)科學(xué)中心的創(chuàng)始人。
Yann LeCun在今年3月走進(jìn)中國(guó)的大學(xué),在清華大學(xué)和上海紐約大學(xué)分別進(jìn)行了兩場(chǎng)人工智能的頂尖對(duì)話,并接受了第一財(cái)經(jīng)記者的獨(dú)家專訪。
讓機(jī)器擁有常識(shí)
LeCun是法國(guó)學(xué)界非常引以為豪的科學(xué)家,也是在美國(guó)科技巨頭公司中擔(dān)任要職的為數(shù)不多的法國(guó)人。雖然同為“極客”,但法國(guó)人獨(dú)特的氣質(zhì)讓LeCun和很多美國(guó)科學(xué)家相比,看起來更加隨意、富有親和力。
1987年LeCun從巴黎第六代大學(xué)的計(jì)算機(jī)系畢業(yè)后,就去了多倫多大學(xué)讀博士后,師從“神經(jīng)網(wǎng)絡(luò)之父”GeoffreyHinton,Hinton也是將深度學(xué)習(xí)技術(shù)帶入谷歌的人。博士后研究結(jié)束后,LeCun就一直工作生活在美國(guó),先后任職于貝爾實(shí)驗(yàn)室、AT&T等大公司。2008年他創(chuàng)立了一家從事大數(shù)據(jù)挖掘的咨詢公司YLC,直到目前,他還擔(dān)任他所創(chuàng)立的另一家從事音樂制作和教育公司的首席科學(xué)官。
目前LeCun領(lǐng)導(dǎo)著Facebook人工智能研究部門近百人的團(tuán)隊(duì)。他的工作是推進(jìn)人工智能的基礎(chǔ)科學(xué)與技術(shù)研究;通過實(shí)驗(yàn)來發(fā)展人工智能技術(shù)在各個(gè)領(lǐng)域中的實(shí)際應(yīng)用,如計(jì)算機(jī)視覺、人機(jī)對(duì)話系統(tǒng)、虛擬助手、語音識(shí)別和自然語言處理(NLP)等。
“人工智能的背后存在很多基礎(chǔ)科學(xué),它們也許并不面向應(yīng)用,你的研究可能只是通向?qū)χ悄芎腿斯ぶ悄艿睦斫狻?rdquo;LeCun對(duì)第一財(cái)經(jīng)記者表示。
LeCun開辟了將神經(jīng)網(wǎng)絡(luò)運(yùn)用于機(jī)器視覺的先例。五年前,其帶領(lǐng)研究人員在圖像識(shí)別的準(zhǔn)確性上,取得了巨大的突破,這背后的技術(shù)——人工神經(jīng)網(wǎng)絡(luò),促成了近年來人工智能的繁榮,也使得谷歌和Facebook得以讓人們?cè)谧约旱南鄡?cè)中使用搜索功能,并促成了一批使用面部識(shí)別的應(yīng)用程序問世。
訓(xùn)練機(jī)器如何學(xué)習(xí)是LeCun的團(tuán)隊(duì)最重要的工作。過去很長(zhǎng)一段時(shí)間,他們給機(jī)器“喂”了成千上萬張圖片,來教會(huì)機(jī)器區(qū)分諸如“汽車”和“小狗”。不過LeCun在這個(gè)過程中也拋出了新的問題:當(dāng)有大量可用樣本(比如桌椅、貓狗和人)時(shí),訓(xùn)練機(jī)器沒有問題;但如果機(jī)器從來沒有見過這些實(shí)物,它還能識(shí)別出樣本嗎?
LeCun表示,人工智能發(fā)展的一大難題就是怎么樣才能讓機(jī)器掌握人類常識(shí),這是讓機(jī)器和人類自然互動(dòng)的關(guān)鍵。想要做到這一點(diǎn),它需要擁有一個(gè)內(nèi)在模型,以具備預(yù)測(cè)的能力。LeCun用一個(gè)公式簡(jiǎn)潔地概括了這種人工智能系統(tǒng):預(yù)測(cè)+規(guī)劃=推理。而研究人員現(xiàn)在要做的,就是不需依賴人類訓(xùn)練,讓機(jī)器學(xué)會(huì)自己構(gòu)建這個(gè)內(nèi)在模型。
“人們花了很多年來研究如何給圖片和視頻自動(dòng)加入字幕或描述,從目前的技術(shù)來看,確實(shí)也已經(jīng)出現(xiàn)了令人印象深刻的實(shí)現(xiàn)方式。”LeCun對(duì)第一財(cái)經(jīng)記者表示,“但實(shí)際上,它們并沒有看起來的那么令人驚艷,那些機(jī)器的專業(yè)上很大程度受限于人們訓(xùn)練它的環(huán)境。你如果向機(jī)器展現(xiàn)非常規(guī)的情況,大多數(shù)機(jī)器就會(huì)不知所措,因?yàn)樗鼈儾痪邆涑WR(shí)。”
LeCun認(rèn)為,在機(jī)器視覺領(lǐng)域還有很大的進(jìn)步空間,機(jī)器視覺的下一個(gè)突破將會(huì)是以自主觀察世界的方式進(jìn)行學(xué)習(xí),比如通過觀看視頻來進(jìn)行學(xué)習(xí)。這也意味著未來計(jì)算機(jī)可能會(huì)像嬰兒學(xué)習(xí)那樣掌握常識(shí)性的知識(shí)。
關(guān)于機(jī)器視覺如何與常識(shí)相聯(lián)系,LeCun說,就連Facebook內(nèi)部也有很大分歧。“一些人認(rèn)為可以與智能系統(tǒng)只進(jìn)行語言交流,但是語言是一個(gè)相當(dāng)?shù)蛶?lowbandwidth)的渠道,信息密度很低。語言之所以能承載很多信息,是因?yàn)槿藗儞碛写罅康谋尘爸R(shí),也就是常識(shí),來幫助他們理解這些信息。”LeCun解釋道。