這樣一些計算機視覺技術(shù)的進步,有三大引擎在起作用:1、非常強大的計算能力,這一點大家已經(jīng)看到了,特別是GPU的普及,使得我們可以訓(xùn)練非常復(fù)雜的算法。2、大數(shù)據(jù)。人臉識別系統(tǒng),谷歌采用了800萬人兩億張照片來訓(xùn)練他們深度學(xué)習(xí)的模型。這一點,地球上任何一個人都不可能在這一輩子見到這么多的人,用來訓(xùn)練自己大腦里的人臉識別算法。我們的系統(tǒng)可以通過刷身份證判斷他是否是合法持有人。
從算法角度來講,就是深度學(xué)習(xí)的技術(shù)。深度學(xué)習(xí)并不是一個新的發(fā)明,而是一個復(fù)興,就像文藝復(fù)興一樣,在很大程度上是對過去的歷史的復(fù)盤。神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)是上世紀(jì)80年代末期所流行的多層神經(jīng)網(wǎng)絡(luò)進一步的拓展。當(dāng)它跟大數(shù)據(jù)、超級計算及聯(lián)姻之后,它的威力發(fā)揮了起來,所以,使得有了今天的技術(shù)進步。
在過去2、3年,有很多AI的問題、任務(wù)。計算機逐漸超越了我們?nèi)祟愔悄堋_@一點也是歷史的必然,其實在很多方面已經(jīng)發(fā)生了。比如說,大家剛才看到的我們刷身份證,去判斷是不是你這樣一個任務(wù)。目前,計算機可以做到在一萬人試圖冒充你的時候,我們有95%的概率可以被正確識別。
AI在什么領(lǐng)域可以超越人類?人工智能主要依賴的算法是深度學(xué)習(xí)的方法。深度學(xué)習(xí)適合的問題是,我稱之為叫“數(shù)據(jù)肥沃”,而且是好數(shù)據(jù)肥沃。好數(shù)據(jù)肥沃意味著我們有大量的數(shù)據(jù)可以進行歸納學(xué)習(xí)。
我們?nèi)祟惖膶W(xué)習(xí)除了歸納學(xué)習(xí)之外,我們還有一種學(xué)習(xí)叫演繹推理,或者是演繹學(xué)習(xí)。比如說看歐幾里得幾何原本,這是通過推理得出的。目前來說,深度學(xué)習(xí)適合的只能從數(shù)據(jù)來學(xué)習(xí)。它比較適合于數(shù)據(jù)采集,獲娶標(biāo)注比較便利的領(lǐng)域。比如說現(xiàn)在做計算機視覺、語音識別,或者是有越來越互聯(lián)網(wǎng)化的領(lǐng)域使得我們收集數(shù)據(jù)可以更加的便利。但是需要推理的,目前來說,深度學(xué)習(xí)沒有辦法解決。
去年發(fā)生著另外一個重要的AI事件,就是阿爾法狗戰(zhàn)勝了圍棋冠軍,阿爾法狗里的深度學(xué)習(xí)起到了80%的學(xué)習(xí),其實還有另外一種技術(shù),叫增強學(xué)習(xí)。它是適合于可以自動判斷對錯的領(lǐng)域,但是并不適合解決計算機視覺識別的問題。機器是不可以自我判斷的,這就很難通過對自己做的對錯的數(shù)據(jù)積累進行增強的學(xué)習(xí)。如果是完全交給機器,讓它自己增強,目前的算法會導(dǎo)致它學(xué)偏,可能會走火入魔,學(xué)傻了。
最近一段時間,李開復(fù)老師在很多場合介紹過,他認(rèn)為10年后,人工智能會取代世界上很多職業(yè),50%的工作都可能被取代,其中包括翻譯、記者、助理,包括保安、司機、銷售等。仁者見仁、智者見智,有很多專家也并不認(rèn)可所有的職業(yè)真的這么輕易的就會被我們AI取代,但是確實也有很多的行業(yè),現(xiàn)在越來越多的可能會受到AI的威脅,比如說保安。
這是我們在一個單位里,他們現(xiàn)在用我們的人臉識別技術(shù)來做門禁,整個集團有1萬多人,他可以通過對每一個來上班的人進行開門、考勤(人臉識別技術(shù))。這個系統(tǒng)也在剛剛運行,我們也相信,當(dāng)這個系統(tǒng)把所有的員工變成熟人的時候,這肯定會比我們?nèi)祟惖谋0惨煤芏唷R粋€好的保安可以認(rèn)1、2000人,但是對于上萬人的企業(yè)來說還是很難的。
什么領(lǐng)域會逐漸被AI超越?一類是巨量空間的搜索問題,再就是檢索類的,比如說圖像的檢索,這對機器來說都是小菜一碟,對我們?nèi)祟悂碚f就沒有那么容易了。再就是經(jīng)驗、技藝依賴的領(lǐng)域,也就是所謂的見多識廣,通過經(jīng)驗學(xué)習(xí)、習(xí)得的技能領(lǐng)域,都可能逐漸的被AI取代,比如說人臉識別、物體識別,或者是自動駕駛,這也是一個經(jīng)驗的問題,比如說醫(yī)療的讀圖。
我們?nèi)斯ぶ悄芸梢越Y(jié)合幾百個頂級的醫(yī)生,通過對這些對這些片子的學(xué)習(xí)就可以超過很多有經(jīng)驗的醫(yī)生??头膯柎鸷芏嘁彩前胫貜?fù)性,或者是完全重復(fù)性的。所以,人工智能完全有可能從歷史的經(jīng)驗當(dāng)中來學(xué)習(xí)這樣一些技能。
大家也會問這樣一個問題,超越人類智能,是不是必須要知道人的大腦是如何工作的,我們才能夠做出來超越人類的能力算法?事實上,我們?nèi)祟惖拇竽X是如何工作的,目前還是一個非常神秘的事情,這也是非常值得研究的課題。好消息是說,其實我們并不需要去類腦,如果我們只能堅持一個類腦的路線,我們反而不能夠超越人。