5月21日,在音樂,科技與藝術相結(jié)合的MTA天漠音樂節(jié),投身CV領域創(chuàng)業(yè)的中科院計算所山世光教授,從計算機視覺的視角與我們分享了這一輪人工智能熱潮的特點,以及他本人投身創(chuàng)業(yè)后的一些進展。
首先,山世光教授從事實層面列舉了我們應用計算機視覺技術的一些例子,計算機也已經(jīng)開始能夠執(zhí)行像我們小時候進行的“看圖說話”的語言任務,這就是自動圖題技術。而最典型的應用可能就是時下諸多公司參與的自動駕駛。此外,近五年來,計算機分類識別物體的錯誤率基本上都是以每年下降一半的速度在提升。
而計算機視覺技術的進步,得益于3大引擎的推動作用:1.GPU的普及所帶來的計算能力的提升;2.大數(shù)據(jù)的運用;3.深度學習算法的復興。
針對人工智能的探討,永遠引人入勝的話題還包括人類和智能的比較。對這一類問題,山世光教授也分享了他的認識。
他引用了李開復老師在公開發(fā)表過場合的觀點:10年后,人工智能會取代世界上很多職業(yè),50%的工作都可能被取代,其中包括翻譯、記者、助理,包括保安、司機、銷售等。
或許觀點上存在“仁者見仁,智者見智”,那么究竟如何評判什么職業(yè)會被取代,這就先要解答AI更容易在哪些領域超越人類,又在哪些地方還有待突破。
山世光教授介紹,AI擅長的是通過大量的數(shù)據(jù)進行歸納學習。而人類學習除了歸納法外,還包括演繹推理,但需要推理的部分,深度學習目前還沒有辦法解決。通過自我判斷對錯的增強學習,也是目前機器無法做到的。所以現(xiàn)階段的AI,比較適合于數(shù)據(jù)采集、獲娶標注比較便利的領域,包括計算機視覺、語音識別等領域。
由此可見,AI容易超越人類的領域有兩大類別:第一類是巨量空間的搜索問題或者檢索問題;第二類是通過經(jīng)驗習得技能的領域,如自動駕駛、醫(yī)療讀圖。
那么,人類的機會在哪里?山世光教授認為,盡管人類在認知能力沒有像機器一樣日新月異的進步,但人腦除了數(shù)據(jù)學習能力外,還有邏輯推理能力。人類能夠主動為自己設計算法模型,還能夠主動收集數(shù)據(jù)。通用的AI還沒有出現(xiàn)的跡象,當前的AI都是針對特定領域的。
最后,山世光教授分享了他本人投身創(chuàng)業(yè)后的一些進展。他在去年創(chuàng)辦了中科視拓,為各行各業(yè)的用戶、客戶,提供基于私有數(shù)據(jù),生產(chǎn)自己的AI引擎的能力。目前他們已經(jīng)為華為做了手機里的人臉識別,也與中國移動、中國平安等客戶進行了合作。
以下是山世光的演講原文:
大家好!我是來自中科院計算所的山世光。在大概2、3年前,我們進入了新一輪的人工智能的熱潮,我們稱之為第三次人工智能的熱潮。我下面從計算機視覺,也就是我們希望機器能夠像人一樣看世界的視角來探索一下人工智能這一輪熱潮有什么特點。
首先,簡單舉幾個例子,計算機視覺,也就是說在機器有了攝像頭之后,它可以做什么?比如說,最典型的例子,自動駕駛,或者是汽車輔助駕駛里,特別是以特斯拉為代表的自動駕駛的,或者是輔助駕駛的,已經(jīng)可以實現(xiàn)對道路上的汽車、行人、車道線等這樣一些物體的檢測、識別。同時,利用檢測到的車、人,能夠幫助我們進行駕駛。
例子二:從計算機視覺做算法的角度來講,在過去3、4年時間里,我們可以明確地看到,從2012年到2015年,我們讓計算機正確的分類它所看到的物體是什么這樣一個問題上,錯誤率基本上都是以每年下降一半的速度在提升。
例子三:自動圖題技術
我們可以想象成,給大家一張照片,讓機器自動描述,或者寫一段話來介紹這張照片里有什么樣的內(nèi)容。比如說有一張照片,機器可以自動生成一句話來描述這是在一個開放的市場上,有很多人在購物(菜市場)。這是類似于我們小時候看圖作文的任務,這也是計算機視覺非常重要的任務。
大家在過去1、2年里,每年刷臉的次數(shù)也在不斷增加。我相信,在未來的時間,我們每年刷臉的次數(shù),在明年也許會增加到10次,未來會是上百次,甚至是更多的場景。我們用這樣一個系統(tǒng)來刷你的身份證,來判斷你是不是這個身份證合法的持有人。