近日,在全球最具權(quán)威的人臉檢測評測平臺FDDB公布的最新數(shù)據(jù)中,來自騰訊的優(yōu)圖團(tuán)隊(Tencent-BestImage)在評測集中超過了一眾競爭對手,達(dá)到了世界領(lǐng)先的水平。
FDDB全稱Face Detection Data Set and Benchmark,是由馬薩諸塞大學(xué)計算機(jī)系維護(hù)的一套公開數(shù)據(jù)庫,為來自全世界的研究者提供一個標(biāo)準(zhǔn)的人臉檢測評測平臺,其中涵蓋在自然環(huán)境下的各種姿態(tài)的人臉;該校還維護(hù)了LFW等知名人臉數(shù)據(jù)庫供研究者做人臉識別的研究。作為全世界最具權(quán)威的人臉檢測評測平臺之一,F(xiàn)DDB使用Faces in the Wild數(shù)據(jù)庫中的包含5171張人臉的2845張圖片作為測試集,而其公布的評測集也代表了人臉檢測的世界最高水平。
下圖是最新公布的人臉檢測準(zhǔn)確率召回率曲線圖,橫軸表示誤檢人臉數(shù),縱軸表示檢出率。曲線越陡峭,曲線上的點越接近(0,1),表示檢測器性能越好。從離散情況來看,優(yōu)圖團(tuán)隊在人臉識別檢出率上明顯高于國內(nèi)外的其他眾多優(yōu)秀團(tuán)隊。
人臉檢測技術(shù)是很多技術(shù)與應(yīng)用的基礎(chǔ),而人臉的訓(xùn)練數(shù)據(jù)又是人臉檢測技術(shù)的基礎(chǔ)。優(yōu)圖團(tuán)隊既利用了公開的人臉數(shù)據(jù)集,也通過自動和人工收集來自互聯(lián)網(wǎng)的各種圖片,累計篩選數(shù)百萬張,保持人臉的多樣性,使得訓(xùn)練出的人臉檢測器能夠適應(yīng)各種情況。同時,為了保證高準(zhǔn)確率,也篩選了數(shù)十萬張沒有人臉的照片作為負(fù)樣本。
自從viola和jones提出瀑布流式的人臉檢測框架,人臉檢測逐漸走向?qū)嵱没髞淼暮芏嘌芯空咭蔡岢隽撕芏喔倪M(jìn)方案。優(yōu)圖團(tuán)隊嘗試多種改進(jìn),經(jīng)過數(shù)十輪迭代,最終達(dá)到了世界第一的水平。包括使用多種不同特征,增加表達(dá)能力;采用光照分離技術(shù),減少光線的影響;利用AUC技術(shù),提高分類器的分類能力;利用vector boosting將多姿態(tài)人臉歸到一個框架等。
優(yōu)圖團(tuán)隊是騰訊公司內(nèi)部專業(yè)的圖像技術(shù)和模式識別技術(shù)研發(fā)團(tuán)隊,現(xiàn)在日均處理圖片過5億,檢測出人臉多達(dá)兩億以上。早在2013年5月, 較早版本的優(yōu)圖人臉檢測器在空間相冊數(shù)據(jù)集上就已經(jīng)達(dá)到國內(nèi)第一的水平,并在空間相冊產(chǎn)品中上線。此后,優(yōu)圖人臉檢測器在水印相機(jī)、創(chuàng)意相機(jī)、天天P圖等移動產(chǎn)品中相繼落地,標(biāo)志著優(yōu)圖人臉檢測器的全平臺支持。據(jù)了解,優(yōu)圖在人臉識別、圖像理解和分類、音樂分析等方面都積累了眾多世界水平的研究成果,后續(xù)將繼續(xù)創(chuàng)新,帶來更多頂尖的技術(shù)和產(chǎn)品。