雷鋒網(wǎng) (公眾號:雷鋒網(wǎng)) 按:本文來自北京集智俱樂部。作者 張江,北京師范大學系統(tǒng)科學學院副教授,集智俱樂部創(chuàng)始人、現(xiàn)任主席、集智科學 家,騰訊公司騰云智庫成員。
盡管復雜性科學一直在追求一大類終極問題的答案,如生命的起源、復雜性的起源等。但其實它的發(fā)展完全是研究方法驅動的。例如在計算機出現(xiàn)之前,人們是用哲學思辨和數(shù)學方程來研究復雜系統(tǒng);到了90年代,圣塔菲學派興起,多主體仿真、復雜自適應系統(tǒng)方法席卷了各個研究領域;2000年以后,復雜網(wǎng)絡崛起,小世界和無標度以及各式各樣的網(wǎng)絡分析滲透到了復雜性研究的各個角落;到了2010年以后,基于大數(shù)據(jù)的復雜性研究和計算社會科學(computational social science)開始興起。那么,站在2016年的末端展望未來,下一波的熱潮將會是什么呢?有沒有可能是引領工業(yè)界革命的深度學習技術呢?
實際上,將深度學習技術引入復雜性科學研究已經(jīng)有了大量的研究案例。例如,最近Science上發(fā)表了一篇“用遙感和衛(wèi)星數(shù)據(jù)結合來預測貧困”的研究就是一個很好的典范1。來自斯坦福大學的一個團隊利用深度學習技術成功預測了非洲地區(qū)的貧困,這一研究不僅解決了困擾了社會學家們數(shù)十年的大問題,而且也打開了深度學習方法滲透進社會復雜性研究的一個新窗口。
用深度學習預測貧困

用深度學習和遙感數(shù)據(jù)預測非洲貧困的Science文章(左),以及同期刊登的評述文章
問題的背景是這樣的:非洲的貧困問題長期得不到解決,這并不是因為缺乏來自發(fā)達地區(qū)的資助,而是因為沒有精確的貧困數(shù)據(jù)。這就使得對非洲的大量投資沒有達到需要救助的地區(qū),而全部落入了富人和貪官的腰包里,從而導致了更大規(guī)模的貧富差距。于是,人們想到了利用衛(wèi)星拍攝到的夜光數(shù)據(jù)來預測地區(qū)的貧困,因為越富有的地區(qū),通常夜間燈光的亮度也越高。
但是,這個結論反過來卻不成立,并不是說越貧窮的地區(qū)燈光越暗。事實上,研究人員從一片黑色區(qū)域中完全區(qū)分不出無人居住的沙漠,還是貧困得連燈都用不起的村莊。怎么辦呢?

圖1 復雜的訓練管道,上面的流程為輸入一塊區(qū)域的衛(wèi)星遙感數(shù)據(jù),來預測同一區(qū)域的夜光明亮度,從而訓練一個卷積神經(jīng)網(wǎng)絡以獲得遙感數(shù)據(jù)中的特征。下圖所示為:將卷積神經(jīng)網(wǎng)絡進行遷移,再配合上少量的貧困調(diào)查數(shù)據(jù)作為標簽,訓練一個普通的神經(jīng)網(wǎng)絡。最終卷積神經(jīng)網(wǎng)絡+普通網(wǎng)絡就可以根據(jù)輸入圖片來預測地區(qū)貧困。摘自:文獻2
斯坦福的這個研究團隊巧妙地將另一種高精度、高質量的衛(wèi)星遙感圖像數(shù)據(jù)訓練一個深度卷積神經(jīng)網(wǎng)絡(Convoluational Neural Network, CNN),以預測同區(qū)域的夜光數(shù)值大小。但這樣做的目標并不真的為了預測夜光,而是為了提取遙感圖像數(shù)據(jù)中的特征(例如街道、屋頂?shù)?。然后,再利用這些特征作為輸入,以及少數(shù)采樣點的貧困調(diào)查數(shù)據(jù)作為標簽,一起來訓練一個普通的神經(jīng)網(wǎng)絡。最終,喂給這個網(wǎng)絡一張街景地圖,它就可以高精度地預測該地區(qū)的貧困程度。就這樣,這個組使用了非常先進的遷移學習技術,以及復雜的機器學習訓練管道(pipeline),對局部貧困程度進行了較高精度的預估(如圖1)。
深度學習與多主體建模
多主體建模是復雜系統(tǒng)一種非常普遍而有效的研究方式。我們將系統(tǒng)理解為大量個體遵循簡單的相互作用規(guī)則而形成的整體。例如,當我們分析人群的集體行為時,可以對每一個個體人建立模型,并假設它們都遵循極其簡單的相互作用規(guī)則(如社會力模型3)。然后,我們在計算機中再造這群人的計算機仿真程序,從而模擬出人群的運動軌跡。

社會力模型的模擬程序
盡管這種思路的確可以逼真地模擬復雜系統(tǒng),但是所有的模型規(guī)則和參數(shù)幾乎全部是模型構建者拍腦袋決定的。這就使得模型的準確性和可信賴程度大打折扣。
我們知道,實際上,現(xiàn)在的城市公共空間裝滿了各種各樣的攝像頭。大量的人群運動軌跡被記錄在了視頻里。那么,我們能不能自動地將視頻中的個體人的運動軌跡提取出來,訓練我們的主體模型,從而得到極其逼真的人群運動模擬呢?