另外一個(gè)東西就是去霧,這是我們專門給北京做的,當(dāng)時(shí)08年奧運(yùn)會(huì)的時(shí)候,所有的報(bào)道都講北京的霧霾太嚴(yán)重。所以我們就做了一個(gè)算法把霧去掉了,把三維也算出來了,后來奧運(yùn)會(huì)就成功的舉辦了。
比如說傳統(tǒng)的去霧算法是這樣的,等我們?nèi)ネ觎F以后是這樣的,我們不但把霧去掉了,還能把前景和后景進(jìn)行模糊。
剛才我講的都是在深度學(xué)習(xí)發(fā)生之前,所以很多事做的非常難。突然有一天,有一個(gè)下棋的下了幾局棋結(jié)果輸了四盤,所有人都知道了人工智能這個(gè)詞,如果他再多贏兩盤的話,今天就是我來講了,就是科協(xié)來講了。如果我們聽到虛擬增強(qiáng)現(xiàn)實(shí)、機(jī)器人、無人汽車這里面都有深度學(xué)習(xí)的影子,深度學(xué)習(xí)改變了整個(gè)產(chǎn)業(yè),深度學(xué)習(xí)的核心有三塊。
一是你要設(shè)計(jì)一個(gè)網(wǎng)絡(luò),這個(gè)網(wǎng)絡(luò)很多人都可以設(shè)計(jì)。但是每個(gè)人設(shè)計(jì)的網(wǎng)絡(luò)水平是不一樣的,有的人設(shè)計(jì)的網(wǎng)絡(luò),它的智商大概跟猴子的智商差不多,有的設(shè)計(jì)出來小學(xué)生的智商,有的設(shè)計(jì)出來博士生的智商。你設(shè)計(jì)完了以后它的腦子是空的,比如說我68年出生的時(shí)候,我是問不出來那些問題的,要經(jīng)過七年的學(xué)習(xí),最后才達(dá)到我能上小學(xué)的水平,一定要經(jīng)過學(xué)習(xí)的過程。機(jī)器學(xué)習(xí)就是大數(shù)據(jù)訓(xùn)練的過程,大數(shù)據(jù)訓(xùn)練就需要超大的數(shù)據(jù),來訓(xùn)練無窮大的網(wǎng)絡(luò)。這么大的數(shù)據(jù),這么大的網(wǎng)絡(luò)要訓(xùn)練,又需要大的機(jī)器,大的GPU集群,要進(jìn)行并行運(yùn)算。所以這三個(gè)就是巨大的門檻,為什么說谷歌和FaceBook這些公司才能取得巨大的進(jìn)展,而我們創(chuàng)一個(gè)小的公司,忽悠一下做一些布局,就想做人工智能,這是不大可能的,其實(shí)這是有很多準(zhǔn)備工作要做的。
我簡(jiǎn)單講一下人工智能深度學(xué)習(xí)的歷史,其實(shí)深度學(xué)習(xí)是06年就開始出現(xiàn)的。06年到2011年之前一直在走彎路,基本上是不管用的,在微軟里面做語(yǔ)音識(shí)別,取得了巨大的突破,比傳統(tǒng)算法高了十幾個(gè)百分點(diǎn),以前我們都是每年走一個(gè)點(diǎn),現(xiàn)在相當(dāng)于一年走過去十年的進(jìn)步。2012年又取得了更大的進(jìn)步,他剛做完這件事情四個(gè)月谷歌就買了這家公司,據(jù)說是五千萬(wàn)美元,我們覺得這對(duì)于一個(gè)教授來說,這個(gè)錢確實(shí)是挺多的。但是后來谷歌僅過了一年又買了一家公司花了6.6億美金,只有12個(gè)人,一個(gè)產(chǎn)品也沒有,號(hào)稱是2012年做深度學(xué)習(xí)的。
所以我跟投資人一直強(qiáng)調(diào)一點(diǎn),我們是2011年開始做深度學(xué)習(xí)的,他們是12個(gè)人,我們是30個(gè)人,過了一年多,大家都知道了,它下棋贏了,對(duì)谷歌造成的PR效應(yīng)絕對(duì)值這個(gè)錢了。緊接著谷歌、雅虎大家都開始布局,而且進(jìn)展是非常快的。
首先我回答一下我們經(jīng)常做的事情,比如說人臉檢測(cè),我們是全球第一個(gè)用深度學(xué)習(xí)做人臉檢測(cè)的,這是非常難的圖,我們基本上把所有的臉都抓出來了,這是微軟做出來的效果,這是我們跟微軟相比,微軟漏掉的圖。所以我們的人臉檢測(cè)目前是全球最準(zhǔn)的檢測(cè)器,還有人臉定位,我們也是第一個(gè)用深度學(xué)習(xí)做人臉定位的,我們的五點(diǎn)定位和后面的六十幾點(diǎn)和106點(diǎn)都是我們做的,幾乎所有的公司都在說湯老師我在用你們的算法,我們有些問題想問一下。在中國(guó)基本上別人用你的東西,你是掙不了錢的,但是一定要提供售后服務(wù),這個(gè)是業(yè)界的標(biāo)準(zhǔn)。
最近我們做的另一個(gè)有趣的工作,如果我們?cè)诨ヂ?lián)網(wǎng)上看到兩個(gè)人或者是幾個(gè)人的照片,我們可以用深度學(xué)習(xí)來判斷這兩個(gè)人的關(guān)系。我們用這兩個(gè)人相互的姿態(tài)和相互的表情,能判斷兩個(gè)人到底是什么樣的關(guān)系,是親密的關(guān)系、朋友的關(guān)系,還是敵人的關(guān)系。比如說奧巴馬和拜登,我們可以判斷八個(gè)緯度不同的關(guān)系。
(播放視頻)我們可以在視頻里實(shí)時(shí)判斷兩個(gè)人的關(guān)系,比如說這段視頻是夫妻兩個(gè)人吵架。我們可以看到他們開始吵架了,這個(gè)時(shí)候他們的關(guān)系就好了,藍(lán)線上來了,所以我們是實(shí)時(shí)判斷兩個(gè)人的親密關(guān)系。
另外一個(gè)就是我們做人臉識(shí)別,人臉識(shí)別在深度學(xué)習(xí)之前,其實(shí)真的是用不起來的,雖然你見到很多的產(chǎn)品。但實(shí)際上不是很管用的,后來深度學(xué)習(xí)出來以后,我們?cè)?014年的時(shí)候做了深度學(xué)習(xí)算法。當(dāng)時(shí)FaceBook也做了一個(gè),它做到了97.35,人眼睛的識(shí)別率是97.5,我們做了98.5,做到了98.15,后來做到了99.47和99.5,我們都超過了FaceBook和人眼睛的識(shí)別率,從那以后人臉識(shí)別這件事情在很多商業(yè)上可以落地了。