第四組(LCLL):各位領(lǐng)導(dǎo)老師嘉賓,各位同學(xué)大家好。我是來自浙江大學(xué)的李晨,我們團隊做的是人技術(shù)類的第一個題目:火眼金睛。我們團隊擁有四名成員,都來自于浙江大學(xué),隊長是李越,隊員有張德斌、我、趙笑廷。
我們團隊所做的東西是用來判斷一張圖片中否含有人。組委會給我們一些圖片,圖片比較復(fù)雜、視角也不限。關(guān)于這個算法的運用我們有很廣泛的范圍。我們可以用在道路交通行人的檢測,也可以用于監(jiān)控視頻中人像的搜索。關(guān)于檢測是否有人的算法,已經(jīng)有一個很長時間的研究了。這邊引用了一篇論文中關(guān)于傳統(tǒng)做法的結(jié)果圖。傳統(tǒng)的做法效果都不是很好。最近基于深度學(xué)習(xí)的算法發(fā)展的非常好。所以我們在百度識圖、百度魔圖上都有很好的應(yīng)用。我們團隊決定使用深度學(xué)習(xí)的算法來完成這項任務(wù)。基于深度學(xué)習(xí)的算法,我們團隊的算法取得了非常好的效果,我們排名第一,準確率達到98%。在理性測試中,我們團隊的算法仍然有98.2%。
關(guān)于深度學(xué)習(xí)算法,我們參考目前比較優(yōu)良的其他人的算法構(gòu)建了一個深層的神經(jīng)網(wǎng)絡(luò)。包括基因?qū)?、采樣層、?guī)劃層。我們構(gòu)建了十層的神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)的訓(xùn)練我們需要非常大量的數(shù)據(jù)。主辦方只有三萬張左右的圖片數(shù)據(jù)。為了使我們的效果更好。我們團隊自己從網(wǎng)站搜集了很多數(shù)據(jù)。搜集完數(shù)據(jù)以后,我們一共搜集了九萬張數(shù)據(jù),并進行了人工標注。我們設(shè)計輸入內(nèi)容,我們采用三通道的彩色圖象,128乘128的分辨率。并且我們在神經(jīng)網(wǎng)絡(luò)中添加了規(guī)劃層,使得我們的算法效果更好。并且更有泛化能力。這是我們神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。我們采用了非常深的神經(jīng)網(wǎng)絡(luò)層。并且采用較高分辨率的圖象進行訓(xùn)練。
這是我們算法測試結(jié)果。圖象顯示的是我們訓(xùn)練的誤差,從每次迭代之后誤差逐漸減少。說明我們的算法在不停迭代之后有非常好的性能。這是我們算法訓(xùn)練數(shù)據(jù)的可視化效果。
目前我們用了接近九萬張圖片進行訓(xùn)練。但是規(guī)模數(shù)據(jù)還是遠遠不夠的。所以我們考慮在算法中增加更大規(guī)模的分布式計算和更大的規(guī)模來完成這項工作。
我就介紹到這里。謝謝大家!