
現(xiàn)階段,人臉識(shí)別是人工智能領(lǐng)域最炙手可熱的話題之一。Google和Facebook,以及國(guó)內(nèi)一些創(chuàng)業(yè)公司都投入重金在該領(lǐng)域進(jìn)行研發(fā),并且有相當(dāng)多的商業(yè)應(yīng)用。隨著Deep Learning算法的引入,計(jì)算機(jī)在人臉識(shí)別方面的準(zhǔn)確率和魯棒性得到了一個(gè)突破性的提高 [1, 2], 計(jì)算機(jī)算法犯第二類(lèi)錯(cuò)誤(把假當(dāng)作真,即把非A識(shí)別為A)的概率也下降了很多,相比于識(shí)別失敗率,這個(gè)參數(shù)在工業(yè)場(chǎng)景的應(yīng)用中可能更為重要,因?yàn)樗麜?huì)更直接關(guān)系到產(chǎn)品的安全性。計(jì)算機(jī)人臉識(shí)別系統(tǒng)在安全方面的應(yīng)用因此有了更好的接受度。
計(jì)算機(jī)人臉識(shí)別的準(zhǔn)確率已經(jīng)超過(guò)人類(lèi)。目前的算法體現(xiàn)出來(lái)一些特征,從人腦的人臉認(rèn)知和識(shí)別角度來(lái)看,顯得非常的有趣。計(jì)算機(jī)人臉識(shí)別算法面對(duì)自然場(chǎng)景的人臉識(shí)別(Face Recognition in the Wild)問(wèn)題時(shí)仍然有一些困難[3],而這些困難又跟人腦在自然場(chǎng)景做人臉識(shí)別時(shí)面對(duì)的困難又有一些相似和不同。這些問(wèn)題的根本原因,還是在于計(jì)算機(jī)與人腦在人臉識(shí)別任務(wù)上處理的方法,或者說(shuō)算法原理方面的相似性和不同。
大略來(lái)看,在人臉?lè)矫嫖覀兛梢詥?wèn)以下一類(lèi)問(wèn)題:
1. 人在做人臉識(shí)別時(shí)候的注意點(diǎn) 跟 計(jì)算機(jī)算法(特別地,深度神經(jīng)網(wǎng)絡(luò))的“認(rèn)知”重點(diǎn)有什么差異
2. 人在做人臉識(shí)別的學(xué)習(xí)過(guò)程中,需要的樣本數(shù)量很多,但是跟深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練所需的動(dòng)則上百萬(wàn)個(gè)樣本這樣一個(gè)數(shù)量級(jí)還是有很大的差距 [4],是什么導(dǎo)致了這個(gè)問(wèn)題
3. 人腦人臉識(shí)別任務(wù)的一些低識(shí)別率場(chǎng)景是怎么導(dǎo)致的;計(jì)算機(jī)算法也會(huì)面對(duì)類(lèi)似的問(wèn)題,其原因是什么;兩種算法(人腦的識(shí)別算法/模型 與 計(jì)算機(jī)的算法)如何相互參考
4. 計(jì)算機(jī)人臉識(shí)別算法最新趨勢(shì)中跟人腦認(rèn)知的差異
5. .......
作為研究人腦多年并轉(zhuǎn)入計(jì)算機(jī)人臉識(shí)別領(lǐng)域的研究者,我發(fā)現(xiàn)自己處于這樣一個(gè)獨(dú)特的位置:我問(wèn)出的問(wèn)題跟這兩個(gè)領(lǐng)域中的人都不同,但又能同時(shí)快速的獲取和理解這兩個(gè)方面的研究問(wèn)題。因此決定把這個(gè)話題寫(xiě)成一個(gè)系列,作為我自身工作的總結(jié)。這是一個(gè)活動(dòng)的長(zhǎng)期系列,其完成沒(méi)有時(shí)間表,所問(wèn)的問(wèn)題和所要解決的問(wèn)題也會(huì)不斷的擴(kuò)張。本篇作為這個(gè)系列的第0篇僅作初期的預(yù)測(cè)和介紹,歡迎兩方面背景的人賜教