將全球各地的機(jī)場(chǎng)數(shù)據(jù)整合后,人們即可以得到各地點(diǎn)相對(duì)引入風(fēng)險(xiǎn)的估計(jì)值,下一步則是考慮如何將分析結(jié)果向公眾展示。顯然數(shù)據(jù)可視化往往是直觀有效展示分析結(jié)果的最佳方式,有人提供了一種基于D3實(shí)現(xiàn)的交互式網(wǎng)絡(luò)分析圖表。(圖一展示了一個(gè)交互式圖表的截圖。有興趣的讀者可翻閱原圖。圖表鏈接:http://rocs.hu-berlin.de/D3/ebola/)
圖1
2. 由移動(dòng)通信數(shù)據(jù)預(yù)測(cè)疫情
埃博拉病毒在西非的爆發(fā)引起了全世界的關(guān)注,人們紛紛把注意力頭像了機(jī)場(chǎng)等引起人口流動(dòng)的公共場(chǎng)所,正如上一節(jié)所說(shuō),機(jī)場(chǎng)數(shù)據(jù)的確對(duì)于流行病學(xué)家等研究者們而言具有極高的分析價(jià)值,但除此之外,基于手機(jī)移動(dòng)端產(chǎn)生的數(shù)據(jù)同樣極具應(yīng)用潛力。
用戶每次利用手機(jī)通話的過(guò)程中都會(huì)同時(shí)產(chǎn)生相應(yīng)的通話記錄數(shù)據(jù),其中自然也包含了電話號(hào)碼、通話時(shí)間以及大致的通信地點(diǎn)等重要信息。對(duì)于運(yùn)營(yíng)商而言,這些數(shù)據(jù)可以為各地基站的部署提供參考從而提升通信網(wǎng)絡(luò)。另一方面對(duì)于城市規(guī)劃者而言則可以基于該數(shù)據(jù)判斷相關(guān)地點(diǎn)是否需要拓展相應(yīng)的公共交通設(shè)施。
然而除了上述這些相對(duì)常用的應(yīng)用外,在流行病學(xué)的應(yīng)用卻更令人期待,更激動(dòng)人心。事實(shí)上到目前為止一般情況下對(duì)于疾病擴(kuò)散建模的常用方法依然是基于人口普查的數(shù)據(jù)以及相關(guān)調(diào)查。然而對(duì)于通信記錄數(shù)據(jù),人們卻可以得到實(shí)時(shí)更新的數(shù)據(jù),也就是說(shuō)在實(shí)際應(yīng)用中無(wú)需估計(jì)某地區(qū)的人口是否會(huì)遷移。同時(shí)幸運(yùn)的是,在近幾年中確實(shí)并不缺乏類似的成功案例。2009年在墨西哥爆發(fā)的豬流感,研究人員就曾利用通信數(shù)據(jù)監(jiān)測(cè)公眾對(duì)于政府發(fā)布的健康預(yù)警信息的反應(yīng)。此后2010年隨海地地震爆發(fā)的霍亂疫情,研究人員則同樣基于手機(jī)通信數(shù)據(jù)建模并給出了最需要援助地點(diǎn)的最優(yōu)估計(jì)。
在對(duì)于埃博拉病毒研究的實(shí)際操作中卻更為復(fù)雜,一個(gè)最主要的原因在于西非大部分民眾并沒(méi)有手機(jī)或者其他通信設(shè)備。不過(guò)盡管如此,某種程度上它卻依然優(yōu)于基于陳舊數(shù)據(jù)的統(tǒng)計(jì)分析。事實(shí)上研究人員如果可以從一個(gè)傳染病爆發(fā)的地域追蹤到人口的流動(dòng),那么對(duì)于下一個(gè)最有可能爆發(fā)傳染病的地點(diǎn)就會(huì)有一個(gè)比較有效的估計(jì)和預(yù)測(cè),從而可以提前展開(kāi)合理有效的資源配置。遺憾的是,盡管很多相關(guān)的機(jī)構(gòu)都做了很大程度的努力,但出于隱私等問(wèn)題的考慮,電信運(yùn)營(yíng)商依然不允許研究人員使用這部分?jǐn)?shù)據(jù)。
3. 由社交媒體數(shù)據(jù)預(yù)測(cè)疫情 [4]
網(wǎng)絡(luò)和社交媒體數(shù)據(jù),對(duì)埃博拉病毒的預(yù)警,發(fā)揮了重大作用。HealthMap是一個(gè)利用大數(shù)據(jù)反應(yīng)疫情的網(wǎng)站/應(yīng)用,它使用一定的算法來(lái)抓取來(lái)自社交媒體網(wǎng)站、本地新聞和政府網(wǎng)站、傳染病醫(yī)師的社交網(wǎng)絡(luò)和其他渠道的數(shù)據(jù),用于探測(cè)和跟蹤的疾病暴發(fā)。2014年3月14號(hào),HealthMap通過(guò)自己的系統(tǒng),預(yù)警了幾內(nèi)亞境內(nèi)爆發(fā)的“神秘出血熱”。2014年3月19號(hào),HealthMap確認(rèn)其為埃博拉病毒并對(duì)世界衛(wèi)生組織發(fā)出警告,還給出了其在幾內(nèi)亞?wèn)|南部熱帶雨林地區(qū)傳播的粗略地點(diǎn)和路徑。2014年3月23號(hào),世界衛(wèi)生組織正式宣布埃博拉疫情爆發(fā)并報(bào)告了第一個(gè)確診案例。在這時(shí),HealthMap已經(jīng)追蹤了在幾內(nèi)亞的29例確診和29人死亡 ——所有數(shù)據(jù)和報(bào)告都來(lái)源于社交媒體和當(dāng)?shù)卣W(wǎng)站等。
HealthMap利用復(fù)雜而算法,過(guò)濾不相關(guān)的數(shù)據(jù),結(jié)合領(lǐng)域內(nèi)專家的幫助,再對(duì)相關(guān)的信息進(jìn)行分類,確定疾病的類型并在地圖上定位爆發(fā)地點(diǎn)。針對(duì)這次埃博拉疫情,在世界衛(wèi)生組織宣布當(dāng)天,HealthMap就上線了專門(mén)的頁(yè)面,其中包含一個(gè)實(shí)時(shí)可交互的地圖。全球網(wǎng)友可以通過(guò)這個(gè)可交互地圖來(lái)免費(fèi)了解疫情,其中包括具體的暴發(fā)地點(diǎn)和跟蹤新的病例和死亡人數(shù)的信息。該系統(tǒng)還能夠記錄公眾的關(guān)注度。用戶可以在地圖上放大特定的國(guó)家和地區(qū),上面會(huì)標(biāo)記主要病例報(bào)告。用戶點(diǎn)擊標(biāo)記會(huì)指向爆發(fā)的新聞報(bào)道。同時(shí),在地圖底部的滾動(dòng)條可以讓你通過(guò)點(diǎn)擊關(guān)鍵日期,以追蹤病情進(jìn)展。
這不是HealthMap第一次立功了。這個(gè)組織成立于2006年,由一組研究人員,流行病學(xué)家和軟件開(kāi)發(fā)人員組成的團(tuán)隊(duì),利用網(wǎng)上各式各樣的數(shù)據(jù)來(lái)源,監(jiān)測(cè)和預(yù)測(cè)的疾病暴發(fā),并實(shí)現(xiàn)對(duì)公共健康威脅的實(shí)時(shí)監(jiān)控。他們匯集了各式不相干的數(shù)據(jù)源,包括網(wǎng)絡(luò)新聞集中平臺(tái),目擊者報(bào)告,專家策劃討論和官方驗(yàn)證的報(bào)告。除了實(shí)時(shí)和可交互的呈現(xiàn)數(shù)據(jù),HealthMap也致力于預(yù)測(cè)疾病風(fēng)險(xiǎn)。曾經(jīng)有報(bào)導(dǎo)稱,該組織成功使用boosted regression tree等模型成功預(yù)測(cè)了SARS在中國(guó)境內(nèi)爆發(fā)的死亡率。