騰訊人臉識別技術(shù)早于阿里巴巴研究。有媒體列出中國人臉識別技術(shù)十強(qiáng)公司的名單。從第一名到第十名的公司依次是,云從科技、曠視科技、漢王科技、商湯科技、中科視拓、百度、科大訊飛、騰訊、阿里巴巴和川大智勝。其中漢王公司也是發(fā)展歷史悠久。
人臉識別經(jīng)過近 40 年的發(fā)展,取得了很大的發(fā)展,涌現(xiàn)出了大量的識別算法。這些算法的涉及面非常廣泛,包括模式識別、圖像處理、計(jì)算機(jī)視覺、人工智能、統(tǒng)計(jì)學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、小波分析、子空間理論和流形學(xué)習(xí)等眾多學(xué)科。所以很難用一個(gè)統(tǒng)一的標(biāo)準(zhǔn)對這些算法進(jìn)行分類。根據(jù)輸入數(shù)據(jù)形式的不同可分為基于靜態(tài)圖像的人臉識別和基于視頻圖像的人臉識別。因?yàn)榛陟o態(tài)圖像的人臉識別算法同樣適用于基于視頻圖像的人臉識別,所以只有那些使用了時(shí)間信息的識別算法才屬于基于視頻圖像的人臉識別算法。接下來分別介紹兩類人臉識別算法中的一些重要的算法。
特征臉特征臉方法利用主分量分析進(jìn)行降維和提取特征。主分量分析是一種應(yīng)用十分廣泛的數(shù)據(jù)降維技術(shù),該方法選擇與原數(shù)據(jù)協(xié)方差矩陣前幾個(gè)最大特征值對應(yīng)的特征向量構(gòu)成一組基,以達(dá)到最佳表征原數(shù)據(jù)的目的。因?yàn)橛芍鞣至糠治鎏崛〉奶卣飨蛄糠祷爻蓤D像時(shí),看上去仍像人臉,所以這些特征向量被稱為“特征臉”。
在人臉識別中,由一組特征臉基圖象張成一個(gè)特征臉子空間,任何一幅人臉圖象(減去平均人臉后)都可投影到該子空間,得到一個(gè)權(quán)值向量。計(jì)算此向量和訓(xùn)練集中每個(gè)人的權(quán)值向量之間的歐式距離,取最小距離所對應(yīng)的人臉圖像的身份作為測試人臉圖像的身份。
下圖給出了主分量分析的應(yīng)用例子。圖中最左邊的為平均臉,其他地為對應(yīng) 7 個(gè)最大特征值的特征向量。
主分量分析是一種無監(jiān)督學(xué)習(xí)方法,主分量是指向數(shù)據(jù)能量分布最大的軸線方向,因此可以從最小均方誤差意義下對數(shù)據(jù)進(jìn)行最優(yōu)的表達(dá)。但是就分類任務(wù)而言,由主分量分析得到的特征卻不能保證可以將各個(gè)類別最好地區(qū)分開來。
線性鑒別分析是一種著名的模式識別方法,通過將樣本線性變換到一個(gè)新的空間,使樣本的類內(nèi)散布程度達(dá)到最小,同時(shí)類間散布程度達(dá)到最大,即著名的 Fisher 準(zhǔn)則。



Lades 等人針對畸變不變性的物體識別問題提出了一種基于動(dòng)態(tài)連接結(jié)構(gòu)的彈性圖匹配方法,并將其應(yīng)用于人臉識別。所有人臉圖像都有相似的拓?fù)浣Y(jié)構(gòu)。人臉都可表示成圖,圖中的節(jié)點(diǎn)是一些基準(zhǔn)點(diǎn)(如眼睛,鼻尖等),圖中的邊是這些基準(zhǔn)點(diǎn)之間的連線。
每個(gè)節(jié)點(diǎn)包含 40 個(gè) Gabor 小波(一種數(shù)字信號變換方法)系數(shù),包括相位和幅度,這些系數(shù)合起來稱為一個(gè) Jet ,這些小波系數(shù)是原始圖像和一組具有 5 個(gè)頻率、 8 個(gè)方向的 Gabor 小波卷積(一種數(shù)字信號處理算子)得到的。這樣每幅圖就像被貼了標(biāo)簽一樣,其中的點(diǎn)被 Jets 標(biāo)定,邊被點(diǎn)之間的距離標(biāo)定。所以一張人臉的幾何形狀就被編碼為圖中的邊,而灰度值的分布被編碼為圖中的節(jié)點(diǎn)。如下圖所示:
彈性圖匹配方法中人臉的彈性束圖表示
為了識別一張新的人臉,需要從該人臉中找到基準(zhǔn)點(diǎn),提取出一個(gè)人臉圖,這可用彈性圖匹配得到。彈性圖匹配的目的是在新的人臉中找到基準(zhǔn)點(diǎn),并且提取出一幅圖,這幅圖和現(xiàn)有的人臉束圖之間的相似度最大。經(jīng)過彈性圖匹配后,新的人臉的圖就被提取出來了,此圖就表征了新的人臉,用它作為特征進(jìn)行識別。進(jìn)行識別時(shí),計(jì)算測試人臉和現(xiàn)有人臉束圖中的所有人臉之間的相似度,相似度最大的人臉的身份即為測試人臉的身份。
由于該方法利用 Gabor 小波變換來描述面部特征點(diǎn)的局部信息,因此受光照影響較小。此外,在彈性匹配的過程中,網(wǎng)格的形狀隨著特征點(diǎn)的搜索而不斷變化,因此對姿態(tài)的變化也具有一定的自適應(yīng)性。該方法的主要缺點(diǎn)是搜索過程中代價(jià)函數(shù)優(yōu)化的計(jì)算量巨大,因而造成識別速度較慢,導(dǎo)致該方法的實(shí)用性不強(qiáng)。 3D 形態(tài)模型人臉本質(zhì)上是 3D 空間中的一個(gè)表面,所以原則上用 3D 模型能更好地表征人臉,特別是處理人臉的各種變化,如姿勢、光照等。 Blanz 等人提出了一種基于 3D 形態(tài)模型的方法,該方法將形狀和紋理用模型參數(shù)編碼,同時(shí)提出了一個(gè)能從單張人臉圖像還原模型參數(shù)的算法。形狀和紋理參數(shù)可用來進(jìn)行人臉的識別。為了處理由于這些參數(shù)導(dǎo)致的圖像之間差異的極端情形,通常是預(yù)先產(chǎn)生一個(gè)通用的模型。而進(jìn)行圖像分析時(shí),給定一張新的圖像,一般的做法是用通用模型去擬合新的圖像,從而根據(jù)模型來參數(shù)化新的圖像。
基于視頻圖像的識別算法一個(gè)典型的基于視頻圖像的人臉識別系統(tǒng)一般都是自動(dòng)檢測人臉區(qū)域,從視頻中提取特征,最后如果人臉存在則識別出人臉的身份。在視頻監(jiān)控、信息安全和出入控制等應(yīng)用中,基于視頻的人臉識別是一個(gè)非常重要的問題,也是目前人臉識別的一個(gè)熱點(diǎn)和難點(diǎn)?;谝曨l比基于靜態(tài)圖像更具優(yōu)越性,因?yàn)?Bruce 等人和 Knight 等人已證明,當(dāng)人臉被求反或倒轉(zhuǎn)時(shí),運(yùn)動(dòng)信息有助于(熟悉的)人臉的識別。雖然視頻人臉識別是基于靜態(tài)圖像的人臉識別的直接擴(kuò)展,但一般認(rèn)為視頻人臉識別算法需要同時(shí)用到空間和時(shí)間信息,這類方法直到近幾年才開始受到重視并需要進(jìn)一步的研究和發(fā)展。目前視頻人臉識別還有很多困難和挑戰(zhàn),具體來說有以下幾種:
視頻圖像質(zhì)量比較差:視頻圖像一般是在戶外(或室內(nèi),但是采集條件比較差)獲取的,通常沒有用戶的配合,所以視頻人臉圖像經(jīng)常會有很大的光照和姿態(tài)變化。另外還可能會有遮擋和偽裝。
人臉圖像比較?。和瑯?,由于采集條件比較差,視頻人臉圖像一般會比基于靜態(tài)圖像的人臉識別系統(tǒng)的預(yù)設(shè)尺寸小。小尺寸的圖像不但會影響識別算法的性能,而且還會影響人臉檢測,分割和關(guān)鍵點(diǎn)定位的精度,這必然會導(dǎo)致整個(gè)人臉識別系統(tǒng)性能的下降。
視頻人臉識別起源于基于靜態(tài)圖像的人臉識別,即識別系統(tǒng)自動(dòng)的檢測和分割出人臉,然后用基于靜態(tài)圖像的識別方法進(jìn)行識別。對這類方法的一個(gè)提高是加入了人臉跟蹤。在這類系統(tǒng)中,通過利用姿態(tài)和從視頻中估計(jì)到的深度信息合成一個(gè)虛擬的正面人臉。這個(gè)階段的另外一個(gè)能提高識別率的方法是利用視頻中充裕的幀圖像,基于每幀圖像的識別結(jié)果,使用 ” 投票 ” 機(jī)制。投票方法可以是確定的,但是概率投票方法一般來說更好。投票機(jī)制的一個(gè)缺點(diǎn)是計(jì)算結(jié)果的代價(jià)比較昂貴。
視頻人臉識別的第二個(gè)發(fā)展階段是利用多模態(tài)信息。因?yàn)槿祟愐话銜枚喾N信息識別人的身份,所以一個(gè)多模態(tài)系統(tǒng)將比只利用人臉的識別系統(tǒng)性能更好。更重要的是利用多模態(tài)信息提供了一種方法,它能全面解決那些只靠人臉無法識別的任務(wù)。例如,在一個(gè)完全沒有配合的環(huán)境(比如搶劫),歹徒的臉一般是蒙著的,這時(shí)唯一能進(jìn)行無人臉識別的方法就是分析歹徒軀體的運(yùn)動(dòng)特性。除了指紋,人臉和聲音是最常用于身份識別的信息。它們已經(jīng)被用于很多多模態(tài)身份識別系統(tǒng)。 1997 年以來,每兩年,就會召開一個(gè)專門關(guān)于基于視頻和語音身份識別的國際會議。
最近幾年,視頻人臉識別進(jìn)入第三個(gè)發(fā)展階段,這個(gè)階段方法的特點(diǎn)是同時(shí)采用空間信息(在每幀中)和時(shí)間信息(比如人臉特征的運(yùn)動(dòng)軌跡)。區(qū)別于概率投票方法的一個(gè)很大的不同之處在于,此類方法是在時(shí)間和空間的聯(lián)合空間中描述人臉和識別人臉的。
視頻圖像的一個(gè)非常重要的特性是它的時(shí)間連續(xù)性,以及由此產(chǎn)生的人臉信息的不確定性。在人臉跟蹤和識別中利用時(shí)間信息是視頻人臉識別算法和基于靜態(tài)圖像的人臉識別算法的最大區(qū)別。目前這類算法大致可分為兩類:
1、 跟蹤 - 然后 - 識別,這類方法首先檢測出人臉,然后跟蹤人臉特征隨時(shí)間的變化。當(dāng)捕捉到一幀符合一定標(biāo)準(zhǔn)(大小,姿勢)的圖像時(shí),用基于靜態(tài)圖像的人臉識別算法進(jìn)行識別。這類方法中跟蹤和識別是單獨(dú)進(jìn)行的,時(shí)間信息只在跟蹤階段用到。識別還是采用基于靜態(tài)圖像的方法,沒用到時(shí)間信息。
2、 跟蹤 - 且 - 識別,這類方法中,人臉跟蹤和識別是同時(shí)進(jìn)行的,時(shí)間信息在跟蹤階段和識別階段都用到。
漢王人臉識別考勤機(jī)軟件是一款由漢王打造的人臉識別的考勤軟件,通過該軟件,可以讓你更加方便的通過人臉識別來進(jìn)行人員簽到管理。該軟件成功開創(chuàng)了人臉識別門禁考勤市場,還不斷開拓在公安、海關(guān)、金融、軍隊(duì)、教育、城建、機(jī)場、邊防口岸等多個(gè)重要領(lǐng)域的行業(yè)應(yīng)用,以及在智能鎖、智能手機(jī)、平板電腦、智能電視等民用產(chǎn)品領(lǐng)域的智能交互應(yīng)用,并且有相關(guān)硬件:漢王人臉識別考勤機(jī)。
產(chǎn)品網(wǎng)址:http://www.hanwangshop.com/Product_info.aspx?id=322
(本文由中國計(jì)算網(wǎng)總編欒玲編輯 轉(zhuǎn)載請注明出處)
微信關(guān)注公眾號“cncompute_com ”,每天為您奉上最新最熱的計(jì)算頭條資訊,滿滿干貨~多年軟件設(shè)計(jì)師經(jīng)歷,業(yè)內(nèi)資深分析人士,圈中好友眾多,信息豐富,觀點(diǎn)獨(dú)到。發(fā)布各大自媒體平臺,覆蓋百萬讀者?!短O果的品牌設(shè)計(jì)之道》、《誰擁有未來:小米互聯(lián)網(wǎng)思維PK傳統(tǒng)行業(yè)思維》二本暢銷書作者欒玲,現(xiàn)為中國計(jì)算網(wǎng)設(shè)計(jì)總監(jiān)與內(nèi)容總編,欒玲專著與國畫已被國圖、清華北大圖書館等收藏