“用戶手機中有一張模糊的照片,用深度學習算法可以把暗光增強,把非常小的圖像放大,使它變成一張清晰的圖像,甚至可以識別出圖片中又小又模糊的人臉。”這是人臉識別技術(shù)在手機相冊中的應(yīng)用場景。
近日,南都記者采訪了中科院深圳先進技術(shù)研究院副院長、香港中文大學教授湯曉鷗,了解到他與生物識別和“人臉識別”有著不解之緣。
值得一提的是,2014年,湯曉鷗帶領(lǐng)團隊開發(fā)的深度人臉識別技術(shù)在著名測試基準LFW上獲得了99.55%的識別率,比人肉眼識別(97.53%)更精準,也超過了Facebook的D eepFace算法(97.35%)。
“癮”子
“深度學習”讓機器能看明白這個世界
“我們一直想把計算機視覺、人工智能的東西用到日常生活中。”湯曉鷗說,他小時候就看了大量的圖畫書,對圖像產(chǎn)生了興趣。在湯曉鷗看來,這也許是他以后從事計算機視覺研究的萌芽。
2003年,湯曉鷗的兒子出生后,湯曉鷗總是在北京和香港兩地來回跑,每次見到兒子的時候就會拍很多照片,而且不斷地拍。由于照片有上萬張,沒法管理。后來,湯曉鷗就帶領(lǐng)學生做了一個用計算機自動整理照片的項目Photo Tagging,將相冊里面的人臉檢測出來,再用人臉識別和U I設(shè)計幫助自動標注。
2011年,湯曉鷗帶領(lǐng)的團隊開始研究“深度學習”,這是學術(shù)界最早涉獵深度學習的華人團隊之一。深度學習是在大量的數(shù)據(jù)之上去挖掘、總結(jié)數(shù)據(jù)里的一些規(guī)律,最終讓機器學習到某一項技能,比如下圍棋、識別人臉、自動駕駛車輛等。
湯曉鷗說,讓機器能看明白這個世界是一件很難的事情。
“我們給計算機看大量的人臉照片,它最開始可能沒那么強,可能會識別錯很多人,但是每次錯的時候你就告訴它錯了,它會根據(jù)錯誤調(diào)整參數(shù)。在它看了非常多的照片、調(diào)整了非常多的參數(shù)之后,它就變得很聰明了。”團隊成員、中科院深圳先進技術(shù)研究院集成所副所長喬宇研究員對南都記者說。
2014年,人臉識別取得了突破性成果。當年3月,湯曉鷗團隊發(fā)表G aussianFace人臉識別算法,準確率達98.52%,全球首次突破人眼識別能力(97.53%),超過Facebook同時期發(fā)布的DeepFace算法(97.35%)。同年6月,湯曉鷗的團隊又發(fā)表了DeepID2算法,人臉識別準確率提升至99.15%。緊接著,DeepID3算法又將人臉識別準確率提升至99.55%,領(lǐng)先全球。DeepID代表人臉識別技術(shù)的真正成熟,開啟了整個人臉識別行業(yè)技術(shù)落地。
“癮”用
在安防、金融等領(lǐng)域已被規(guī)?;貞?yīng)用
在十字路口、電梯口、通道等關(guān)鍵位置部署一個攝像頭,把拍到所有人的人臉抓下來之后,與“黑名單”數(shù)據(jù)庫做比對,如果比對成功,系統(tǒng)就會自動報警。人臉識別技術(shù)開始走進日常生活中。
“去年中國移動用我們的算法做了3億人的認證。”湯曉鷗說,人臉識別這項技術(shù)在安防、金融等領(lǐng)域已經(jīng)被規(guī)?;赜闷饋砹恕?/p>
“人臉識別應(yīng)用非常廣泛?,F(xiàn)在很多女孩子喜歡美顏相機,其實背后也涉及人臉識別,像F aceu在眼睛上加一副眼鏡,一些特效都涉及人臉識別。”喬宇告訴南都記者,深度學習和人臉識別也會用在機器人上,“像監(jiān)控機器人、巡邏機器人首先要找到人臉,再進行識別是不是這個小區(qū)的,是不是這個家庭的,機器人可以判斷這個小區(qū)有沒有異常的情況。”
湯曉鷗說,在深度學習算法取得突破性進展之后,人工智能就進入了快速發(fā)展階段,開始應(yīng)用于很多具體的行業(yè)。在人臉識別、圖像分類、自動駕駛、醫(yī)療技術(shù)等幾個方面都有了不少突破。但同時他也指出,前面的路還很長。我們這次沒有輸在起跑線上,但要想在國際上保持在第一梯隊,要有持續(xù)不斷的基礎(chǔ)研發(fā)投入和高效的產(chǎn)學研聯(lián)動發(fā)展。
英偉達去年評選出了包括M IT和斯坦福在內(nèi)的全球人工智能的十大先鋒實驗室,湯曉鷗的實驗室位列其中,也是亞洲區(qū)唯一入選的實驗室。
在湯曉鷗看來,中國不僅研發(fā)經(jīng)費、公司實力不是問題,而且還有大量海外人才回來。他覺得,人工智能是中國新的機遇。“中國應(yīng)該加強原創(chuàng)技術(shù)積累,做好源頭創(chuàng)新。”湯曉鷗說。