有了深度學(xué)習(xí),這個(gè)問題被分解為一系列層級化的映射——每個(gè)映射都由一個(gè)具體的神經(jīng)層描述。
將輸入(表征我們實(shí)際觀察的變量)展現(xiàn)給可見層。接著,一系列隱藏層從涉及到某個(gè)具體映射的輸入中提取出越來越抽象的特征。然而請注意,這個(gè)過程并不是提前定義好的,也就是說,我們并不會(huì)指定每層選擇的內(nèi)容。
舉個(gè)例子:從像素中,第一個(gè)隱藏層識別出邊緣
從邊緣,第二個(gè)隱藏層識別角和輪廓。
從角和輪廓,第三個(gè)隱藏層識別目標(biāo)的部分
最終,從目標(biāo)的部分中,第四個(gè)隱藏層識別出整個(gè)物體

對物聯(lián)網(wǎng)的啟示
讓我們扼要重述:
第一,深度學(xué)習(xí)算法可應(yīng)用于多個(gè)領(lǐng)域,包括計(jì)算機(jī)視覺、圖像識別、模式識別、語音識別、行為識別等。
第二,深度學(xué)習(xí)系統(tǒng)現(xiàn)在有著完善的可能性,因?yàn)槿齻€(gè)原因:高配置CPU、更好的算法及更多可用的數(shù)據(jù)。在接下來的幾年里,這些因素會(huì)為深度學(xué)習(xí)系統(tǒng)帶來更廣泛的應(yīng)用。
第三,深度學(xué)習(xí)是最適合于數(shù)據(jù)龐大、參數(shù)之間關(guān)系復(fù)雜的情況。
第四,解決直覺性問題:訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò)需要重復(fù)地向它展示:「給定一個(gè)輸入,就會(huì)有一個(gè)正確的輸出」。如果這個(gè)過程被進(jìn)行了足夠多次,這個(gè)網(wǎng)絡(luò)就擁有了有效的訓(xùn)練,它就能模仿出你所模擬的方程。它會(huì)忽視與解無關(guān)的輸入。但反過來,如果你沒有給出關(guān)鍵性的輸入,它就無法給出一個(gè)正確的解。這種模型可以應(yīng)用于很多情況。
另外,我們在這種技術(shù)上依然還有局限性。例如,我們還要走很漫長的路,深度學(xué)習(xí)系統(tǒng)才能發(fā)現(xiàn)你因?yàn)槟愕呢堖渌赖袅硕軅?盡管IBM的沃森所衍生的認(rèn)知玩具似乎正向著這個(gè)方向前進(jìn))。目前的關(guān)注點(diǎn)更多在于識別圖片,猜測圖片中人物的年齡(基于微軟的Oxford項(xiàng)目的API。)
正如吳恩達(dá)所提醒我們的那樣,用建造火箭飛船的方法去思考人工智能。我們在這一點(diǎn)也的確還有進(jìn)步的空間。
「我認(rèn)為AI類似于建造一艘火箭飛船。你需要一個(gè)巨大的引擎和很多燃料。如果 你有一個(gè)大引擎但是燃料卻很少,你就無法讓它飛上軌道。如果你有一個(gè)小引擎,但是卻有上噸的燃料,你甚至沒法讓它飛起來。這和深度學(xué)習(xí)(創(chuàng)造人工智能的關(guān)鍵過程之一)的相似點(diǎn)在于,火箭引擎是深度學(xué)習(xí)的模型,燃料則是我們供給算法的海量數(shù)據(jù)。 」
今天,由于技術(shù)的限制,我們?nèi)匀皇芟抻谝?guī)?;9雀柰瞥龅淖R別貓的神經(jīng)網(wǎng)絡(luò)有著16,000個(gè)節(jié)點(diǎn)。但是,一個(gè)人類大腦足足有著1000億個(gè)神經(jīng)元!
下列是反向傳播神經(jīng)網(wǎng)絡(luò)適用于的情景:
有著大量的輸入/輸出數(shù)據(jù),但是你并不確定如何與輸出相關(guān)聯(lián)。因此,我們有大量「給定一個(gè)輸入,就有一個(gè)正確的輸出」這樣的情景可利用于訓(xùn)練神經(jīng)網(wǎng)絡(luò),因?yàn)楹苋菀讋?chuàng)造出許多正確行為的樣本。
問題看起來有著極端的復(fù)雜度。復(fù)雜度產(chǎn)生于低規(guī)則、高維度以及很難表征的數(shù)據(jù)。然而,這里肯定有一個(gè)解決方法。
問題的解決方法可能會(huì)隨時(shí)間改變,在給出的輸入與輸出參數(shù)范圍中(也就是說,今天的2+2=4,但是未來我們也許會(huì)發(fā)現(xiàn)2+2=3.8)。輸出可能很「模糊」,或者是非數(shù)值的。
某個(gè)領(lǐng)域的專業(yè)技能并不是必須的,因?yàn)檩敵隹梢约兇鈦碓从谳斎耄哼@里存在一些爭議,因?yàn)榻⒁粋€(gè)輸出只依賴于輸入的模型并不總是可能。不過,想想預(yù)測股市的例子吧。在理論上,有了足夠多的股票價(jià)格的輸入和輸出例子,如果利用深度學(xué)習(xí)技術(shù)進(jìn)行合適的訓(xùn)練,你可以創(chuàng)造出一個(gè)能夠預(yù)測未知情景的模型。
推論:我們需要在缺乏觀察的情況下,也能夠推出新見解。例如,基于音調(diào)的高低——我們可以推測出講話者口音與種族。
說到物聯(lián)網(wǎng)領(lǐng)域,我們要考慮的首要問題是:
哪些已有的應(yīng)用可以通過增加直覺型成分(過去曾用在智慧城市),用深度學(xué)習(xí)技術(shù)來進(jìn)行補(bǔ)充?
測量和預(yù)測時(shí)采用什么度量指標(biāo)?我們?nèi)绾谓o這個(gè)指標(biāo)增加一個(gè)直覺型的成分?
哪些存在于計(jì)算機(jī)視覺、圖像識別、模式識別、語音識別、行為識別等等的應(yīng)用還可以應(yīng)用于物聯(lián)網(wǎng)?
現(xiàn)在為了更加深入該領(lǐng)域,下面有一些我很感興趣且正在關(guān)注的領(lǐng)域。