錢童心
當今世界人工智能領域,有三位頂級專家被業(yè)內奉為“神一樣的人物”,其中兩位來自加拿大,一位來自法國。他們分別是加拿大多倫多大學的GeoffreyHinton和蒙特利爾大學的終身教授YoshuaBengio,以及Facebook人工智能研究部門(FAIR)負責人YannLeCun(下稱“LeCun”)——這位來自巴黎的學者目前擔任紐約大學終身教授,他還是紐約大學數(shù)據(jù)科學中心的創(chuàng)始人。
YannLeCun在今年3月走進中國的大學,在清華大學和上海紐約大學分別進行了兩場人工智能的頂尖對話,并接受了第一財經記者的獨家專訪。
讓機器擁有常識
LeCun是法國學界非常引以為豪的科學家,也是在美國科技巨頭公司中擔任要職的為數(shù)不多的法國人。雖然同為“極客”,但法國人獨特的氣質讓LeCun和很多美國科學家相比,看起來更加隨意、富有親和力。
1987年LeCun從巴黎第六代大學的計算機系畢業(yè)后,就去了多倫多大學讀博士后,師從“神經網絡之父”GeoffreyHinton,Hinton也是將深度學習技術帶入谷歌的人。博士后研究結束后,LeCun就一直工作生活在美國,先后任職于貝爾實驗室、AT&T等大公司。2008年他創(chuàng)立了一家從事大數(shù)據(jù)挖掘的咨詢公司YLC,直到目前,他還擔任他所創(chuàng)立的另一家從事音樂制作和教育公司的首席科學官。
目前LeCun領導著Facebook人工智能研究部門近百人的團隊。他的工作是推進人工智能的基礎科學與技術研究;通過實驗來發(fā)展人工智能技術在各個領域中的實際應用,如計算機視覺、人機對話系統(tǒng)、虛擬助手、語音識別和自然語言處理(NLP)等。
“人工智能的背后存在很多基礎科學,它們也許并不面向應用,你的研究可能只是通向對智能和人工智能的理解。”LeCun對第一財經記者表示。
LeCun開辟了將神經網絡運用于機器視覺的先例。五年前,其帶領研究人員在圖像識別的準確性上,取得了巨大的突破,這背后的技術——人工神經網絡,促成了近年來人工智能的繁榮,也使得谷歌和Facebook得以讓人們在自己的相冊中使用搜索功能,并促成了一批使用面部識別的應用程序問世。
訓練機器如何學習是LeCun的團隊最重要的工作。過去很長一段時間,他們給機器“喂”了成千上萬張圖片,來教會機器區(qū)分諸如“汽車”和“小狗”。不過LeCun在這個過程中也拋出了新的問題:當有大量可用樣本(比如桌椅、貓狗和人)時,訓練機器沒有問題;但如果機器從來沒有見過這些實物,它還能識別出樣本嗎?
LeCun表示,人工智能發(fā)展的一大難題就是怎么樣才能讓機器掌握人類常識,這是讓機器和人類自然互動的關鍵。想要做到這一點,它需要擁有一個內在模型,以具備預測的能力。LeCun用一個公式簡潔地概括了這種人工智能系統(tǒng):預測+規(guī)劃=推理。而研究人員現(xiàn)在要做的,就是不需依賴人類訓練,讓機器學會自己構建這個內在模型。
“人們花了很多年來研究如何給圖片和視頻自動加入字幕或描述,從目前的技術來看,確實也已經出現(xiàn)了令人印象深刻的實現(xiàn)方式。”LeCun對第一財經記者表示,“但實際上,它們并沒有看起來的那么令人驚艷,那些機器的專業(yè)上很大程度受限于人們訓練它的環(huán)境。你如果向機器展現(xiàn)非常規(guī)的情況,大多數(shù)機器就會不知所措,因為它們不具備常識。”
LeCun認為,在機器視覺領域還有很大的進步空間,機器視覺的下一個突破將會是以自主觀察世界的方式進行學習,比如通過觀看視頻來進行學習。這也意味著未來計算機可能會像嬰兒學習那樣掌握常識性的知識。
關于機器視覺如何與常識相聯(lián)系,LeCun說,就連Facebook內部也有很大分歧。“一些人認為可以與智能系統(tǒng)只進行語言交流,但是語言是一個相當?shù)蛶挘╨owbandwidth)的渠道,信息密度很低。語言之所以能承載很多信息,是因為人們擁有大量的背景知識,也就是常識,來幫助他們理解這些信息。”LeCun解釋道。