
不久前,阿里巴巴集團(tuán)董事局主席馬云在德國玩的一場“刷臉秀”吸引了很多人的目光,在這次活動(dòng)中,馬云向德國總理默克爾與我國國務(wù)院副總理馬凱,演示了螞蟻金服的Smile to Pay掃臉技術(shù),利用“刷臉支付”從淘寶網(wǎng)上購買了1948年漢諾威紀(jì)念郵票。
人臉識(shí)別最古老也最自然
“刷臉支付”其實(shí)也不是什么新鮮事兒,它是眼下研究很熱門、發(fā)展很迅猛的人身識(shí)別技術(shù)的一種。
除了極端嚴(yán)重的“臉盲癥”患者,我們識(shí)別一個(gè)人最原始、最自然、最方便的方法就是看他的臉。走在路上,迎面一個(gè)人過來,等我們看清了他的臉,就認(rèn)出來了,“哦,老張!”
識(shí)別一個(gè)人的身份,是社會(huì)生活中十分重要的一件事情。以往人們想出了很多辦法來做這件事,比如用鑰匙,用證件,用密碼等等,但這些都是身外之物,一旦遺失了、忘記了或被盜了,就很麻煩。
近幾十年來,人們想到了利用人體固有的生物特征進(jìn)行身份識(shí)別的辦法,這就叫生物特征識(shí)別技術(shù)。由于這些生物特征是長在人的身體上的,所以也就不存在遺失、忘記或被盜的問題了。
這些辦法有很多,比如指紋識(shí)別,這是應(yīng)用最早、最廣泛,也是目前最成熟的生物特征身份鑒別方法;再比如虹膜識(shí)別,虹膜是眼球前部含色素的環(huán)形薄膜,含有極其豐富的結(jié)構(gòu)和紋理特征,到目前為止,虹膜識(shí)別的錯(cuò)誤率是各種生物特征識(shí)別中最低的。此外,還有利用人的行為特征進(jìn)行的筆跡識(shí)別、步態(tài)識(shí)別、聲紋識(shí)別等等。
但是有一條,這些生物特征識(shí)別方法一般都需要人們的行為配合,比如按個(gè)指印兒,把眼睛貼到什么儀器上之類,顯得很不自然,也不太友好。因此,最自然的方法還是要返璞歸真——看見你的臉,就把你認(rèn)出來了!
五十年來獲得長足發(fā)展
早在19世紀(jì)末,有個(gè)叫高爾頓的測量狂人(這個(gè)人也是智商測量的始作俑者)就想到了人臉識(shí)別的問題,他在1888年和1910年分別在《自然》雜志上發(fā)表了兩篇關(guān)于利用人臉進(jìn)行身份識(shí)別的文章。他用一組數(shù)字代表不同的人臉側(cè)面特征,并對(duì)人類自身的人臉識(shí)別能力進(jìn)行了分析。但是當(dāng)然,當(dāng)時(shí)還不可能涉及人臉的自動(dòng)識(shí)別問題。
據(jù)西安理工大學(xué)王映輝教授介紹,自動(dòng)人臉識(shí)別的研究論文最早見于1965年,到現(xiàn)在已有五十年的歷史。近年來,人臉識(shí)別研究得到了諸多研究人員的青睞,涌現(xiàn)出了很多新的技術(shù)和方法。尤其是自1990年以來,人臉識(shí)別更得到了長足的發(fā)展,每年都有大量的學(xué)術(shù)論文發(fā)表。現(xiàn)在,幾乎所有知名的理工科大學(xué)和主要的IT產(chǎn)業(yè)公司都有研究組在從事人臉識(shí)別的研究。
人臉識(shí)別的具體過程可分為以下四步:第一步,搜集并初步處理人的臉部圖像信息;第二步,從采集到的圖像中提取關(guān)鍵的信息;第三步,進(jìn)一步處理已有信息并將它們保存;第四步,比對(duì),把需要識(shí)別的人臉與已經(jīng)保存在數(shù)據(jù)庫中的人臉信息進(jìn)行匹配和甄別。
存在困難超乎一般人想象
這些看上去好像并不難,但對(duì)實(shí)際的人臉識(shí)別來說,面臨的困難其實(shí)是超乎想象的,王映輝教授就介紹了以下幾點(diǎn):
光照問題。這是機(jī)器視覺中存在已久的問題,在人臉識(shí)別中的表現(xiàn)尤為明顯,即使目前最好的人臉識(shí)別系統(tǒng),在室外光照環(huán)境下,其識(shí)別率也會(huì)急劇下降;
姿態(tài)問題。這也是目前人臉識(shí)別研究中需要解決的一個(gè)技術(shù)難點(diǎn)。目前多數(shù)的人臉識(shí)別算法主要針對(duì)正面、準(zhǔn)正面人臉圖像,當(dāng)發(fā)生俯仰或者左右側(cè)面比較厲害的情況下,人臉識(shí)別算法的識(shí)別率也將會(huì)急劇下降;
表情問題。很遺憾,人的面部不像手指、虹膜,它是有豐富表情的地方。表情是一種很復(fù)雜的肌肉運(yùn)動(dòng),每種表情是幾十塊面部肌肉共同運(yùn)動(dòng)的組合,很難用一個(gè)準(zhǔn)確的數(shù)學(xué)模型來描述這些肌肉的運(yùn)動(dòng)。此外,表情的表現(xiàn)形式也因人而異,同一種表情在不同的人面部上有不同的表現(xiàn)形式。因此,如何有效地識(shí)別帶有表情的圖像,從而提高人臉識(shí)別的準(zhǔn)確率,也是一個(gè)重要的挑戰(zhàn);
遮擋問題。對(duì)于非配合情況下的人臉圖像采集,遮擋問題是一個(gè)非常嚴(yán)重的問題。特別是在監(jiān)控環(huán)境下,往往被監(jiān)控對(duì)象都會(huì)戴著眼鏡、帽子等飾物,使得被采集出來的人臉圖像有可能不完整,從而影響了后面的特征提取與識(shí)別;