現(xiàn)在,深度學(xué)習(xí)技術(shù)在語音識(shí)別、計(jì)算機(jī)視覺、語言翻譯等領(lǐng)域,均戰(zhàn)勝傳統(tǒng)的機(jī)器學(xué)習(xí)方法,甚至在人臉驗(yàn)證、圖像分類上還超過人類的識(shí)別能力。專家預(yù)計(jì),再過些年,我們口袋里的手機(jī)也可以運(yùn)行像人腦一樣復(fù)雜的神經(jīng)網(wǎng)絡(luò)。
不過,就目前的趨勢(shì)來看,深度學(xué)習(xí)技術(shù)仍然無法代替“坐在后臺(tái)監(jiān)控室的人”。舉個(gè)例子,如果你和朋友在一家飯店里用餐后搶著結(jié)賬,這種推搡過程,智能攝像頭尚難以判斷是在打架還是怎么了。可見,邏輯判斷和情感選擇,是深度學(xué)習(xí)尚難以逾越的障礙。
◇案例◇
一眼就能識(shí)別壞人的系統(tǒng)
專注于計(jì)算機(jī)視覺及人工智能的科技公司格靈深瞳,將基于深度學(xué)習(xí)技術(shù)研發(fā)的智能識(shí)別系統(tǒng),運(yùn)用到銀行安防監(jiān)控領(lǐng)域。
考慮到傳統(tǒng)光學(xué)鏡頭在識(shí)別圖像時(shí)會(huì)丟失“深度”維度,格靈深瞳專門為銀行安監(jiān)開發(fā)了一套三維傳感器。在它的背后,一套獎(jiǎng)懲機(jī)制訓(xùn)練成的算法模型能夠主動(dòng)識(shí)別異常。“看見有人走近了一個(gè)有人的自動(dòng)柜員機(jī),而不是旁邊那個(gè)空著的,此時(shí)要識(shí)別他的軌跡、判斷其行為是否正常,就牽涉到深度學(xué)習(xí)。”格靈深瞳CEO何搏飛介紹,如果系統(tǒng)識(shí)別出異常,它就會(huì)推送給后臺(tái)監(jiān)督者。而為了教會(huì)機(jī)器判斷準(zhǔn)確,背后需要提供幾十萬量級(jí)的圖片數(shù)據(jù)。
何搏飛指出,給這個(gè)智能識(shí)別系統(tǒng)一張側(cè)臉或者是沒有臉的全身照,它也能以超過99%的精度迅速鎖定目標(biāo)。前提是建一個(gè)6000到1.5萬的樣本庫,“一旦樣本達(dá)到百萬級(jí),可能精度要下降20%或更多。”