這個(gè)構(gòu)造可以用一個(gè)簡(jiǎn)單的數(shù)學(xué)公式描述:感知機(jī)模型,基于單個(gè)神經(jīng)元構(gòu)造具有學(xué)習(xí)能力的人工智能系統(tǒng),它像神經(jīng)元一樣,從外界獲得輸入后,傳遞到中央處理的地方,通過簡(jiǎn)單的運(yùn)算再向外輸出。
今天,這個(gè)簡(jiǎn)單的模型正向幾個(gè)維度擴(kuò)展,也就是從線性的輸入輸出,發(fā)展到深度神經(jīng)網(wǎng)絡(luò),最后形成具備學(xué)習(xí)功能的人工智能系統(tǒng)。
深度學(xué)習(xí)為何應(yīng)該受到重視?
我們最近經(jīng)常聽到“深度學(xué)習(xí)”,在最大規(guī)模的互聯(lián)網(wǎng)公司如谷歌、微軟、臉書、百度等等都在運(yùn)作,并產(chǎn)生巨大的商業(yè)價(jià)值,它讓自動(dòng)駕駛等過去不可想象的事情變得觸手可及。這樣的技術(shù)為什么應(yīng)該受到重視?
1、模擬人類大腦的分層結(jié)構(gòu)以及行為
我們今天發(fā)現(xiàn)了基于視覺的神經(jīng)網(wǎng)絡(luò)(科學(xué)家在研究過程中受到了大腦內(nèi)視覺信息分層表述的啟發(fā)。隨著視覺輸入流從視網(wǎng)膜傳輸?shù)匠跫?jí)視皮層,再到下顳葉皮質(zhì),在識(shí)別物體前,每層都會(huì)進(jìn)行處理,從而準(zhǔn)確地識(shí)別物體),因此可以用數(shù)據(jù)訓(xùn)練系統(tǒng),讓系統(tǒng)能夠反映出視覺神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和行為。為了模擬這一過程,神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)者們?cè)谀P椭性O(shè)計(jì)了幾層計(jì)算,剛開始,最底層的神經(jīng)元對(duì)顏色不敏感,對(duì)邊界和朝向敏感,它能復(fù)原出物體的輪廓,把輪廓提取出來,上面一層的神經(jīng)元具備一些更有意思的行為,對(duì)物體的部位很敏感,更高一層的神經(jīng)元對(duì)物體開始敏感,它是一個(gè)逐層的、從局部到整體的敏感過程。這就是從數(shù)據(jù)開始呈現(xiàn)的視覺網(wǎng)絡(luò)行為。
在聽覺神經(jīng)系統(tǒng)里面有類似的現(xiàn)象,我們用數(shù)據(jù)的深度訓(xùn)練也得到類似的現(xiàn)象結(jié)果。
2、深度學(xué)習(xí)特別適合大數(shù)據(jù)
過去的模型和方法對(duì)于大數(shù)據(jù)的處理是不好的,通常我們衡量一個(gè)模型的好壞是用推廣誤差進(jìn)行測(cè)試。通過推廣誤差找到原因并得到控制,從而找到一個(gè)更好的學(xué)習(xí)辦法。推廣誤差來自于幾個(gè)方面:
來源之一是對(duì)模型進(jìn)行假設(shè),但是模型假設(shè)是沒有最完美的,所以肯定有誤差。在概率統(tǒng)計(jì)學(xué)有一個(gè)著名的說法:你所有的模型都是錯(cuò)的,但有些模型是有用的;
來源之二是數(shù)據(jù)的不完美,樣本有限,或者有噪聲,或者有偏差。這兩種不完美都會(huì)帶來誤差,因?yàn)榈湫偷慕y(tǒng)計(jì)學(xué)范疇忽略了一點(diǎn):假設(shè)了無限的計(jì)算資源,這是來源之三。計(jì)算機(jī)科學(xué)做的是實(shí)際問題,就會(huì)導(dǎo)致計(jì)算的不完美,就會(huì)導(dǎo)致誤差,所以你要盡量讓你的假設(shè)完美,讓你的假設(shè)足夠?qū)挿?,收集大量的?shù)據(jù),尋求算法處理大數(shù)據(jù)。
傳統(tǒng)人工智能算法不能處理更大規(guī)模的數(shù)據(jù),因?yàn)槿绻惴ǖ膹?fù)雜性和樣本是立方的關(guān)系,當(dāng)計(jì)算機(jī)設(shè)備數(shù)量和樣本成同比立方增長(zhǎng)的時(shí)候,意味著數(shù)據(jù)增加了,算法就更難了。這就是為什么深度學(xué)習(xí)應(yīng)該受到重視,它特別適應(yīng)大數(shù)據(jù),數(shù)據(jù)越大,算法越好。
3、深度學(xué)習(xí)是一套靈活的建模語言
怎么寫出一篇好文章,和如何做出一個(gè)好的人工智能系統(tǒng),是相通的,就是對(duì)語言有足夠靈活的駕御能力、需要對(duì)所面臨的生活和問題有深刻的感悟和思想,靈活的建模語言和內(nèi)在洞察相結(jié)合,才能夠做好。
深度學(xué)習(xí)是歷史上第一次出現(xiàn)的端到端學(xué)習(xí),不管是語音識(shí)別還是從感知、預(yù)處理到預(yù)測(cè)、判斷,過去絕大部分的工作是做最后一個(gè)部分,而沒有完成前面的幾個(gè)動(dòng)作。從計(jì)算上面來講,在沒有深度學(xué)習(xí)之前,上面幾個(gè)步驟是消耗計(jì)算資源的、人工手動(dòng)的,但是深度學(xué)習(xí)是一氣呵成的,減少人工手動(dòng)。這個(gè)變化是革命性的,今天這已經(jīng)成為共識(shí)了。
4、深度學(xué)習(xí)的成功應(yīng)用