VJ人臉檢測(cè)器中,相級(jí)聯(lián)的多個(gè)分類器在學(xué)習(xí)的過(guò)程中并不會(huì)產(chǎn)生直接的聯(lián)系,其關(guān)聯(lián)僅體現(xiàn)在訓(xùn)練樣例上:后一級(jí)分類器的訓(xùn)練樣例一定要先通過(guò)前一級(jí)分類器。不同分類器在學(xué)習(xí)時(shí)的獨(dú)立性會(huì)帶來(lái)兩方面的壞處:一是在每個(gè)分類器都是從頭開始學(xué)習(xí),不能借鑒之前已經(jīng)學(xué)習(xí)好的分類器的經(jīng)驗(yàn);二是每個(gè)分類器在分類時(shí)都只能依靠自己,不能利用其它分類器已經(jīng)獲得的信息。為此,出現(xiàn)了兩種改進(jìn)的方案:鏈?zhǔn)紹oosting方法和嵌套式Boosting方法。兩種方案都在學(xué)習(xí)新一級(jí)的分類器時(shí),都考慮之前已經(jīng)學(xué)好的分類器,區(qū)別在于鏈?zhǔn)紹oosting方法直接將前面各級(jí)分類器的輸出進(jìn)行累加,作為基礎(chǔ)得分,新分類器的輸出則作為附加得分,換言之,前面各級(jí)分類器實(shí)際上是新分類器的一個(gè)“前綴”,所有的分類器通過(guò)這種方式鏈在了一起;嵌套式Boosting方法則直接將前一級(jí)分類器的輸出作為新分類器第一個(gè)弱分類器的特征,形成一種嵌套的關(guān)系,其特點(diǎn)是只有相鄰的分類器才會(huì)互相影響。還有一種和嵌套式Boosting方法相類似的方案:特征繼承,即從特征而不是分類器的角度來(lái)關(guān)聯(lián)不同的分類器,具體而言,新的分類器在學(xué)習(xí)時(shí)會(huì)先繼承前一級(jí)分類器的所有特征,基于這些特征學(xué)習(xí)弱分類器,再此基礎(chǔ)上再考慮增加新的弱分類器,這一方案的特點(diǎn)在于其只引入了分類器學(xué)習(xí)時(shí)的相互影響,而在分類時(shí)分類器之間仍然是相互獨(dú)立的。
相關(guān)的任務(wù)之間往往會(huì)相互產(chǎn)生促進(jìn)作用,相輔相成,而和人臉檢測(cè)密切相關(guān)的一個(gè)任務(wù)就是特征點(diǎn)定位:預(yù)測(cè)臉部關(guān)鍵點(diǎn)的位置,這些關(guān)鍵點(diǎn)可以是雙眼中心、鼻尖、嘴角等。基于這樣一種想法,在2014年出現(xiàn)了Joint Cascade,即把檢測(cè)人臉?biāo)枰姆诸惼骱皖A(yù)測(cè)特征點(diǎn)位置的回歸器交替級(jí)聯(lián),同時(shí)進(jìn)行人臉檢測(cè)和特征點(diǎn)定位兩個(gè)任務(wù)。用特征點(diǎn)定位輔助人臉檢測(cè)的關(guān)鍵在于形狀索引特征的引入,即特征不再是在整個(gè)窗口中提取,而是在以各個(gè)特征點(diǎn)為中心的局部區(qū)域進(jìn)行提取,這樣的好處就在于提高了特征的語(yǔ)義一致性。不同的人臉其對(duì)應(yīng)的特征點(diǎn)位置是不同的,反過(guò)來(lái)看,也就是說(shuō)相同的位置實(shí)際上對(duì)應(yīng)于臉部的不同區(qū)域,那么在相同區(qū)域提取的特征實(shí)際上表示的是不同的語(yǔ)義,簡(jiǎn)單地說(shuō),就是在拿鼻子去和嘴巴匹配。采用形狀索引特征可以很好地避免這個(gè)問(wèn)題,從而增大人臉和非人臉窗口之間的區(qū)分性。對(duì)于一個(gè)給定的窗口,我們并不知道特征點(diǎn)的位置,因此采用一個(gè)“平均位置”作為初始位置,即基于標(biāo)注有特征點(diǎn)坐標(biāo)的人臉樣例集,計(jì)算出的每個(gè)點(diǎn)坐標(biāo)的平均值;在平均位置的基礎(chǔ)上,我們提取特征預(yù)測(cè)各個(gè)特征點(diǎn)真實(shí)的位置,不過(guò)一次預(yù)測(cè)往往是不準(zhǔn)確的,就好像跑步的時(shí)候我們沒法直接從起點(diǎn)跳到終點(diǎn)一樣,所以需要不斷基于當(dāng)前確定的特征點(diǎn)位置來(lái)預(yù)測(cè)新的位置,逐步向其真實(shí)的位置靠近。這個(gè)過(guò)程很自然地形成了一種級(jí)聯(lián)結(jié)構(gòu),從而能夠和人臉檢測(cè)器耦合在一起,形成一種不同模型交替級(jí)聯(lián)的形式。
針對(duì)分類器學(xué)習(xí)過(guò)程中的每一個(gè)環(huán)節(jié),人們都進(jìn)行了細(xì)致而充分的探索,除了上面提到的幾個(gè)方向,在分類器分類閾值的學(xué)習(xí)、提升分類器學(xué)習(xí)的速度等問(wèn)題上,也出現(xiàn)了很多出色的研究工作。大部分在分類器及其學(xué)習(xí)方法上進(jìn)行改進(jìn)的工作關(guān)注的還是Boosting方法(AdaBoost方法是Boosting方法的一個(gè)杰出代表)和相對(duì)簡(jiǎn)單的分類器形式,如果能夠引入具有更強(qiáng)分類能力的分類器,相信能給檢測(cè)器帶來(lái)進(jìn)一步的性能提升,這一點(diǎn)在后文會(huì)有所涉及。
級(jí)聯(lián)結(jié)構(gòu)的演化
分類器的組織結(jié)構(gòu)也是人們關(guān)心的一個(gè)重要問(wèn)題,尤其是在面臨多姿態(tài)人臉檢測(cè)任務(wù)的時(shí)候。人臉的姿態(tài)是指人臉在三維空間中繞三個(gè)坐標(biāo)軸旋轉(zhuǎn)的角度,而多姿態(tài)人臉檢測(cè)就是要將帶旋轉(zhuǎn)的人臉給檢測(cè)出來(lái),不管是斜著的(繞x軸旋轉(zhuǎn))、仰著的(繞y軸旋轉(zhuǎn))還是側(cè)著的(繞z軸旋轉(zhuǎn))。不同姿態(tài)的人臉在表觀特征上存在很大的差異,這給檢測(cè)器帶來(lái)了非常大的挑戰(zhàn),為了解決這一問(wèn)題,通常采用分治的策略,即分別針對(duì)不同姿態(tài)的人臉單獨(dú)訓(xùn)練分類器,然后組合起來(lái)構(gòu)建成多姿態(tài)人臉檢測(cè)器。
最簡(jiǎn)單的多姿態(tài)人臉檢測(cè)器就是將針對(duì)不同姿態(tài)人臉的分類器采用并列式的結(jié)構(gòu)進(jìn)行組織,其中并列的每一個(gè)分類器仍然采用原來(lái)的級(jí)聯(lián)結(jié)構(gòu)(我們稱這種分類器為級(jí)聯(lián)分類器);在檢測(cè)人臉的過(guò)程中,一個(gè)窗口如果被其中一個(gè)級(jí)聯(lián)分類器分為人臉窗口,則認(rèn)為其確實(shí)是一個(gè)人臉窗口,而只有當(dāng)每一個(gè)級(jí)聯(lián)分類器都將其判別為非人臉窗口時(shí),才將其排除掉。這種并列式的組織架構(gòu)存在兩方面的缺陷:一是造成了檢測(cè)時(shí)間的成倍增長(zhǎng),因?yàn)榻^大部分窗口是非人臉窗口,這些窗口需要經(jīng)過(guò)每一個(gè)級(jí)聯(lián)分類器的排除;二是容易造成整體分類準(zhǔn)確度的降低,因?yàn)檎麄€(gè)檢測(cè)器分錯(cuò)的窗口包含的是所有級(jí)聯(lián)分類器分錯(cuò)的窗口。