《連線》(Wired)網(wǎng)站日前發(fā)表文章稱,雖然 任何足夠先進(jìn)的技術(shù)都與魔法無(wú)異 ,但當(dāng)前的深度學(xué)習(xí)(Deep learning)技術(shù)還遠(yuǎn)未達(dá)到 魔法 的程度。
谷歌人工智能(AI)應(yīng)用AlphaGo戰(zhàn)勝李世石讓全世界感到驚嘆,一些行業(yè)權(quán)威人士也因此將深度學(xué)習(xí)技術(shù)吹噓成 人腦模擬 。但事實(shí)上,機(jī)器學(xué)習(xí)還遠(yuǎn)不是一個(gè)將從魔瓶里被放出的 妖怪 。它只是一種數(shù)學(xué)算法,是人類在理解智能、建立與人類水平相當(dāng)?shù)腁I過(guò)程中向前邁出的一步。
深度學(xué)習(xí)就是數(shù)學(xué)計(jì)算
深度學(xué)習(xí)正在迅速 吞噬 AI,但不要把這種方興未艾的AI技術(shù)夸大其詞。英國(guó)知名作家亞瑟 克拉克(Arthur C. Clarke)曾經(jīng)說(shuō)過(guò): 任何足夠先進(jìn)的技術(shù)都與魔法無(wú)異。 深度學(xué)習(xí)當(dāng)然是一種先進(jìn)技術(shù),它能識(shí)別圖片中的物體和人臉,識(shí)別語(yǔ)音內(nèi)容,將一種語(yǔ)言翻譯成另一種語(yǔ)言,甚至還能在圍棋比賽中戰(zhàn)勝人類頂尖高手。但是,深度學(xué)習(xí)還沒達(dá)到 魔法 的程度。
隨著谷歌、Facebook和微軟等科技巨頭繼續(xù)將該技術(shù)整合到日常在線服務(wù)中,以及全世界仍在為谷歌AlphaGo戰(zhàn)勝李世石而感到驚嘆之際,一些行業(yè)權(quán)威人士開始將深度學(xué)習(xí)技術(shù)吹噓成 人腦模擬 。其實(shí),機(jī)器學(xué)習(xí)就是簡(jiǎn)單的數(shù)學(xué)計(jì)算,只不過(guò)計(jì)算規(guī)模龐大而已。
事實(shí)上,深度計(jì)算就是一種算法,基于數(shù)據(jù)來(lái)調(diào)整神經(jīng)網(wǎng)絡(luò)。那么這句話到底是何含義呢?讓我們來(lái)解釋一下:一個(gè)神經(jīng)網(wǎng)絡(luò)就是一個(gè)計(jì)算機(jī)程序(受大腦結(jié)構(gòu)而啟發(fā)),它包括大量彼此連接的節(jié)點(diǎn)(或稱 神經(jīng)元 ),每個(gè)節(jié)點(diǎn)都會(huì)對(duì)接收到的數(shù)值輸入進(jìn)行簡(jiǎn)單的函數(shù)計(jì)算(如求和)。這里的 節(jié)點(diǎn) 遠(yuǎn)比大腦神經(jīng)元要簡(jiǎn)單,其數(shù)量也遠(yuǎn)低于大腦神經(jīng)元的數(shù)量。深度學(xué)習(xí)只是強(qiáng)化了神經(jīng)網(wǎng)絡(luò)中的這些節(jié)點(diǎn)的連接。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)子域,機(jī)器學(xué)習(xí)是AI領(lǐng)域里一個(gè)非?;钴S的研究分支。理論上講,機(jī)器學(xué)習(xí)就是基于數(shù)據(jù)點(diǎn)收集的一種逼近函數(shù)(approximating functions)方法。例如,如果一組數(shù)字排列是 2、4、6 ,那么機(jī)器就能預(yù)測(cè)出第四個(gè)數(shù)字應(yīng)該是 8 ,第五個(gè)數(shù)字應(yīng)該是 10 。計(jì)算公式就是2X,X代表排序中的位置。這種算法的應(yīng)用空間很廣泛,例如,在自動(dòng)駕駛汽車、語(yǔ)音識(shí)別和預(yù)測(cè)機(jī)票價(jià)格波動(dòng)等方面均有出色表現(xiàn)。
在某種意義上講,深度學(xué)習(xí)不是獨(dú)一無(wú)二、無(wú)規(guī)律可尋的。任何機(jī)器學(xué)習(xí)系統(tǒng),無(wú)論是否屬于 深度 學(xué)習(xí),都由下列一些基本要素組成:
1.執(zhí)行元素:系統(tǒng)中采取行動(dòng)的部分。例如,在圍棋比賽中負(fù)責(zé)走棋的部分。
2.目標(biāo)函數(shù):被學(xué)習(xí)的函數(shù)。例如,圍棋比賽中棋盤位置或走子選擇的映射。
3.訓(xùn)練數(shù)據(jù):一套被標(biāo)記的數(shù)據(jù)點(diǎn)集合,用于逼近目標(biāo)函數(shù)。例如,圍棋比賽中棋盤位置的集合,其中每一個(gè)位置都標(biāo)注了人類專家在該位置上的走子選擇。
4.數(shù)據(jù)表現(xiàn):每個(gè)數(shù)據(jù)點(diǎn)通常會(huì)被表示為一個(gè)預(yù)先確定的變量的矢量。例如,圍棋盤上每個(gè)棋子的位置。
5.學(xué)習(xí)算法:基于訓(xùn)練數(shù)據(jù)計(jì)算目標(biāo)函數(shù)近似值的算法。
6.假設(shè)空間:學(xué)習(xí)算法可能考慮的函數(shù)的空間。
這種結(jié)構(gòu)能適應(yīng)所有取機(jī)器學(xué)習(xí)方法,包括從簡(jiǎn)單的線性回歸方法到復(fù)雜的深度學(xué)習(xí)算法等。從技術(shù)上講,我們指的正是監(jiān)督學(xué)習(xí)(supervised learning),其中每個(gè)數(shù)據(jù)點(diǎn)都有人類做出的標(biāo)記。如數(shù)據(jù)沒有被標(biāo)記,就是無(wú)監(jiān)督學(xué)習(xí),處理起來(lái)就要困難許多。如果有部分?jǐn)?shù)據(jù)被標(biāo)記,則屬于半監(jiān)督學(xué)習(xí)。
需要指出的是,機(jī)器學(xué)習(xí)架構(gòu)中前五個(gè)部分都是人工輸入的,意識(shí)到這一點(diǎn)很重要。人類程序員建構(gòu)了其中每個(gè)元素,但并未控制機(jī)器學(xué)習(xí)程序。事實(shí)上,程序員通常會(huì)分析這個(gè)學(xué)習(xí)程序的行為,發(fā)現(xiàn)它不夠完美之后,會(huì)手動(dòng)修改其中一個(gè)或多個(gè)元素。這是一項(xiàng)非常艱苦的工作,在達(dá)到期望水平之前,可能需要幾年、甚至更長(zhǎng)時(shí)間的重復(fù)工作。
幫助人類
我們會(huì)發(fā)現(xiàn),一個(gè)學(xué)習(xí)程序的能力會(huì)受到這種架構(gòu)的嚴(yán)格限制。確切而言: