
本篇主題: 層次模型 (Hierarchical Model)
視覺(jué)皮層是第一個(gè)被現(xiàn)代神經(jīng)解剖學(xué)就定義的功能皮層區(qū)域,其解剖特征和功能特征都是高度的結(jié)構(gòu)化的。同時(shí),視覺(jué)皮層占有的皮層表面積/體積又很大,這客觀上方便了視覺(jué)皮層的解剖結(jié)構(gòu)和認(rèn)知功能的研究。因此,不難理解地,視覺(jué)皮層和視覺(jué)功能是我們?cè)谏窠?jīng)科學(xué)方面研究最為深入、理解最為透徹的。
人腦的視覺(jué)信號(hào)傳導(dǎo)通路,在進(jìn)入大腦皮層之前是高度的結(jié)構(gòu)化的、分工明確的。而且一般認(rèn)為,視覺(jué)信息在進(jìn)入大腦皮層前,人腦幾乎被把它做任何實(shí)質(zhì)意義上的處理,也不從中提取有用的信息 [1]。

視覺(jué)信息一旦進(jìn)入大腦皮層(從Primary Visual Cortex初級(jí)視覺(jué)皮層進(jìn)入),就體現(xiàn)出其結(jié)構(gòu)化的特征。視覺(jué)信息的空間位置跟初級(jí)視覺(jué)皮層的位置對(duì)應(yīng)起來(lái),總體上表現(xiàn)為空間相鄰的位置對(duì)應(yīng)的初級(jí)視覺(jué)皮層位置也相鄰,這種拓?fù)浣Y(jié)構(gòu)的對(duì)應(yīng)被稱為視網(wǎng)膜拓?fù)溆成?Retinotopy)[2]. 信息經(jīng)由初級(jí)視覺(jué)皮層處理之后,其發(fā)出方向就變得復(fù)雜起來(lái),總體上分出兩個(gè)主要的層次結(jié)構(gòu)流:腹側(cè)通路(Ventral Pathway)和背側(cè)通路(Dorsal Pathway),前者的損傷導(dǎo)致人的物體識(shí)別功能受損,因此被也被稱為"What"通路,后者的損失導(dǎo)致人的空間判別和視覺(jué)注意能力受損,因此也被稱為"Where"通路 [3]。

特別地,根據(jù)獼猴(Macaque Monkey)視皮層的解剖結(jié)果,人們重建了其各個(gè)視皮層之間的分級(jí)結(jié)構(gòu)[4]:


在比較低級(jí)的視覺(jué)皮層區(qū)域,還發(fā)現(xiàn)其中的神經(jīng)元對(duì)特定的模式刺激放電頻率增加,這種模式可能是物體的視角 [5],也可能是熟悉物體的形狀 [6]。這些發(fā)現(xiàn)為理解大腦物體識(shí)別的層次模式提供了越來(lái)越全面的信息,從而,我們逐漸理解了人腦物體識(shí)別的分級(jí)結(jié)構(gòu)模型:

從初級(jí)到更高級(jí)的視覺(jué)皮層,視覺(jué)信息逐級(jí)傳遞。人腦理解的內(nèi)容越來(lái)越復(fù)雜化、抽象化,由“模式”變成具體的"物",再到物的特性和物與物之間的關(guān)系。進(jìn)入到初級(jí)視覺(jué)皮層的信號(hào)是非常的繁雜和全面的,顯然地,人腦并不需要所有的這些信號(hào),而是只需要提取其中的有用信號(hào)就可以了 , 否則會(huì)給大腦的視覺(jué)理解帶來(lái)太大的壓力,基于層次結(jié)構(gòu)特征,人腦發(fā)展出了視覺(jué)編碼壓縮方式,把通過(guò)視覺(jué)通路傳遞過(guò)來(lái)的信號(hào),跟自己的經(jīng)驗(yàn)比對(duì),比照經(jīng)驗(yàn)中的常見(jiàn)圖像模式,經(jīng)過(guò)比對(duì)之后,找到最為匹配的模式(線、角、圓……;斑馬線,轉(zhuǎn)角……),并以該模式取代實(shí)際的事物。這就好比給視覺(jué)信號(hào)做了一次編碼,以人腦的內(nèi)稟信號(hào)取代實(shí)際信號(hào)對(duì)視覺(jué)圖像做了極大的壓縮,并為后續(xù)的快速處理做好了基礎(chǔ)。另外,在整個(gè)層次模型的處理過(guò)程中,信息流在層級(jí)間幾乎完全表現(xiàn)為“前饋”式 [7]。這為計(jì)算機(jī)模擬方法的可行性和快速性提供了基礎(chǔ)。
上面提到的無(wú)疑是人腦的通用物體識(shí)別架構(gòu),基于這些知識(shí)設(shè)計(jì)了模擬大腦皮層結(jié)構(gòu)的層次物體識(shí)別模型 ( Hierarchical Models of Object Recognition in/and Cortex, HMAX)[8]:

<fig, model="" hmax="">
可見(jiàn)這實(shí)際上是一種早期形式的深度神經(jīng)網(wǎng)絡(luò),它的每一層也是需要根據(jù)具體的任務(wù)情況進(jìn)行訓(xùn)練。

在人臉識(shí)別任務(wù)中,由于結(jié)構(gòu)較淺,而底層的模型又過(guò)于簡(jiǎn)單[9](網(wǎng)絡(luò)設(shè)計(jì)為從簡(jiǎn)特征到復(fù)雜特征),這使得模型在較高層中識(shí)別的feature仍然是接近于“線”、“角”這樣的易于描述的基礎(chǔ)性特征 [10, 11]: