評測人臉檢測器時還有一個重要的問題:怎么根據(jù)對人臉的標注和檢測結(jié)果來判斷某張人臉是否被檢測到了?一般來說,檢測器給出的檢測框(即人臉窗口)不會和標注的人臉邊框完全一致,而且對人臉的標注也不一定是矩形,例如還可能是橢圓形;因此當給定了一個檢測框和一個標注框時,我們還需要一個指標來界定檢測框是否和標注框相匹配,這個指標就是交并比:兩者交集(重疊部分)所覆蓋的面積占兩者并集所覆蓋面積的比例,一般情況下,當檢測框和標注框的交并比大于0.5時,我們認為這個檢測框是一個正確檢測的人臉。
在早期的人臉檢測工作中,一般采用MIT-CMU人臉檢測數(shù)據(jù)集作為人臉檢測器的測試集,來比較不同的檢測器。這個測試集只包含幾百張帶有人臉的圖像,并且人臉主要是清晰且不帶遮擋的正面人臉,因而是一個相對簡單的測試集,現(xiàn)在幾乎已經(jīng)不再使用。在2010年,美國麻省大學(xué)的一個實驗室推出了一個新的人臉檢測評測數(shù)據(jù)集:FDDB,這個集合共包含2845張帶有人臉的互聯(lián)網(wǎng)新聞圖像,一共標注了5171張人臉,其中的人臉在姿態(tài)、表情、光照、清晰度、分辨率、遮擋程度等各個方面都存在非常大的多樣性,貼近真實的應(yīng)用場景,因而是一個非常具有挑戰(zhàn)性的測試集。FDDB的推出激發(fā)人們在人臉檢測任務(wù)上的研究熱情,極大地促進了人臉檢測技術(shù)的發(fā)展,在此后的幾年間,新的人臉檢測方法不斷涌現(xiàn),檢測器在FDDB上的表現(xiàn)穩(wěn)步提高。從100個誤檢時的檢測率來看,從最初VJ人臉檢測器的30%,發(fā)展到現(xiàn)在已經(jīng)超過了90%——這意味著檢測器每檢測出50張人臉才會產(chǎn)生一個誤檢,這其中的進步是非常驚人的,而檢測器之間的比拼還在繼續(xù)。
注:本文由作者發(fā)布于深度學(xué)習(xí)大講堂,轉(zhuǎn)載請聯(lián)系授權(quán)并保留出處和作者,不得刪減內(nèi)容。