新浪科技:神經(jīng)網(wǎng)絡(luò)需要大量的數(shù)據(jù)訓(xùn)練才有成效,回到無人車領(lǐng)域,比方撞車、緊急情況等情況,就很難有大量的數(shù)據(jù)讓網(wǎng)絡(luò)學習,您怎么看待這個問題?
余凱:沒錯,這面臨到未來的一個趨勢,是一個“小數(shù)據(jù)學習”的問題。這個趨勢要有一個完全不同的思路,而不是盲目的灌數(shù)據(jù),因為大量采集的數(shù)據(jù)都是正常路況的數(shù)據(jù),而這種緊急情況的數(shù)據(jù)是沒有的,所以這對深度學習是一個挑戰(zhàn)。
這就要加入更多的因果推理,因果推理的這個框架衍生出來的就是貝葉斯網(wǎng)絡(luò),這個是加州大學洛杉磯分校Judea Pearl教授,在80年代就已經(jīng)很著名的成果,曾經(jīng)在人工智能這個領(lǐng)域是非常主流,后來由于神經(jīng)網(wǎng)絡(luò)的發(fā)展大家淡忘了。
但是歷史總是回旋往復(fù)地往上去發(fā)展。就像80年代的時候,深度神經(jīng)網(wǎng)絡(luò)其實當時也非常主流,但是90年代就被人給淡忘了。我認為80年代被Judea Pearl提出來的“因果推理”,現(xiàn)在應(yīng)該被提上議事日程。
過去十年深度神經(jīng)網(wǎng)絡(luò)發(fā)展,讓我們在感知這個領(lǐng)域突飛猛進。但是所有的這些人工智能,包括自動駕駛,其實感知都是為了決策來服務(wù),所以最終要走到?jīng)Q策。
一旦走到?jīng)Q策的話,所謂這些小數(shù)據(jù)、這種緊急情況,實際上是要根據(jù)這個情況然后做一個決策,就是在很多的狀態(tài)空間里面,去找到風險最小的一個路徑。這里面其實是各種的因果推理,不是識別。
深度神經(jīng)網(wǎng)絡(luò)是識別,如果是因果推理,就需要有一個因果推理的框架來做這個事情。
地平線的核心團隊,包括我自己的背景,都是在人工智能這個領(lǐng)域工作了很長時間,所以我們能夠以一個更高的視角來看這個問題,不僅僅是當前熱什么咱們就做什么,因為當時熱的東西一定會過去。
新浪科技:剛剛結(jié)束的AAAI17上,大會收錄的論文,來自中國的投稿數(shù)量第一次超過美國,這個數(shù)字能說明什么?以前也有統(tǒng)計說人工智能領(lǐng)域中國人很厲害。
余凱:中國整個來講對人工智能的關(guān)注度越來越高。但論文中雖然有很多從名字能看出來是中國人,但大部分估計還是在美國的留學生或者華裔學者。數(shù)字還不能說明問題。因為中國本土的科研這塊其實還是有差距的,有蠻大差距。
我們整個創(chuàng)新的土壤,相對來講還比較偏急功近利。
新浪科技:您之前也批評過說有一些AI企業(yè)有抄襲或者比較急功近利的情況。
余凱:對,真正愿意平心靜氣,去做比較長遠的、創(chuàng)新性研究的人和企業(yè)在中國還比較少。華人學者在這個領(lǐng)域的規(guī)模越來越大,這也是正常的,因為我們的人口基數(shù)大,但是有沒有更多的創(chuàng)新性的東西在這里面出來。
好像據(jù)說今年 Best Paper 什么之類的其實并不是華人,所以我們還是有空間繼續(xù)去努力。未來我還是很樂觀,華人在整個人工智能領(lǐng)域的影響力,最后會變得非常領(lǐng)先。
新浪科技:很多企業(yè)都說,人工智能的專業(yè)人才不好招。您在實踐中,也會遇到這樣的困擾么?您又是怎么解決的?
余凱:我們?nèi)ツ暝?月份有一次大規(guī)模的巡回校招,收了一批頂尖的學生,我對這個還是比較滿意,我們會進行內(nèi)部培訓(xùn)。
包括我以前在百度的時候,當時成立深度學習研究院,那個時候中國大學沒有培養(yǎng)什么人工智能、深度學習方面的人才,基本上很多都是我們自己培養(yǎng),后來很多人在百度或者其他公司里成為頂尖的中堅力量。所以我們可以去培養(yǎng)。
我們有個計劃,所有我們今年校招錄取的學生,夏天的時候把他們?nèi)珟У焦韫热?,進行為期半個月的一個培訓(xùn),我會請世界頂尖的專家來給他們講課。
新浪科技:您是看中什么樣的條件去招這些應(yīng)屆生、去招這些未畢業(yè)的學生的話,是需要他的邏輯好或者是工程能力強、還是就是得數(shù)學好?
余凱:我看中的,還是所謂德才兼?zhèn)洹?/p>
德,就是合作的能力,還有對整個使命感,對未來世界的好奇。人工智能改變世界的這么一個使命感跟好奇心,不斷學習的這種愿望,我覺得這個是這個人的一個基本面。其次的話,在數(shù)學、在編程這些方面,應(yīng)該有相當不錯素養(yǎng)。