2014年時代雜志的年度人物稱號由埃博拉患者護理人員獲得,在向他們致敬的同時,讓我們回顧一下去年這場飽受關(guān)注并且持續(xù)到今年的全球性傳染病事件。
2014年繼馬航客機失聯(lián)事件之后,始發(fā)于西非幾內(nèi)亞的埃博拉病毒疫情經(jīng)由傳統(tǒng)媒體和數(shù)字媒體走入全球公眾視野。據(jù)世界衛(wèi)生組織提供的資料[1]顯示,埃博拉病毒最早在1976年同時爆發(fā)的兩起疫情中首次出現(xiàn)的,一起在蘇丹,另一起在剛果民主共和國。后者發(fā)生在位于埃博拉河附近的一處村莊,該病由此得名。該次埃博拉疫情在剛果民主共和國爆發(fā)的是扎伊爾標準亞種,累計318人患病,280人死亡,致死率88%;在蘇丹爆發(fā)的則是蘇丹亞種,累計284人患病,151人死亡,致死率53%;另外還有雷斯頓、科特迪瓦、邦地布優(yōu)等三個亞種,對動物和人類的危害相對溫和。據(jù)悉,目前正在肆虐全球的埃博拉病毒,正是致死率最高的扎伊爾標準亞種。
埃博拉病毒疫情時隔幾年便爆發(fā)一次,不過之前每次疫情規(guī)模都比較小,主要集中在一個地區(qū)爆發(fā),并且局限在中非。特別地,剛果民眾共和國史上曾多次爆發(fā)埃博拉疫情。
2014年3月開始爆發(fā)的埃博拉病毒疫情的爆發(fā)規(guī)模引起了國際社會的關(guān)注,并且被世界衛(wèi)生組織列為“國際間關(guān)注的公共衛(wèi)生緊急事件”(歷史第三次)。首先,這次疫情涉及到了多個國家和地區(qū)。全境范圍受影響的國家包括幾內(nèi)亞、利比里亞和塞拉利昂。部分領(lǐng)土受影響的地區(qū)包括馬里的卡伊,西班牙的馬德里,美國的達拉斯、德克薩斯州和紐約市,英國蘇格蘭地區(qū)的格拉斯哥市,尼日利亞的拉各斯哈科特港,以及塞內(nèi)加爾的達喀爾。其次,這次埃博拉病毒疫情出現(xiàn)的病例和死亡數(shù)字超過了所有其它疫情的總和。截止2014年12月31號,累計20206人患病,7905人死亡[2]。并且數(shù)字還在不斷增加。而所有的埃博拉護理者,則被美國時代周刊選為2014年的年度人物。
回望過去幾十年,人類無疑在信息、科技、生物、醫(yī)療等領(lǐng)域取得了今非昔比的成果。反觀2014年埃博拉病毒疫情的爆發(fā)、傳播、媒體報導(dǎo)、控制,我們不禁開始思考在這個大數(shù)據(jù)時代,數(shù)據(jù)、統(tǒng)計、理性思考、批判思維能為人類對疫情防控帶來什么好處?這篇文章試圖從三個角度去闡述大數(shù)據(jù)如何與疫情防控緊密相連。本文第一部分討論了如何通過交通數(shù)據(jù)、移動通信數(shù)據(jù)與社交媒體數(shù)據(jù)等非傳統(tǒng)公共衛(wèi)生數(shù)據(jù)來測算乃至預(yù)測疫情風(fēng)險;第二部分重點關(guān)注死亡率的不同估算方法帶來的對于疫情風(fēng)險的不同認知;第三部分聚焦在埃博拉病毒疫情的治療和防控支出數(shù)據(jù)。
一、數(shù)據(jù)驅(qū)動的疫情預(yù)測
1. 由交通數(shù)據(jù)預(yù)測疫情[3]
全球人口流動的日趨頻繁使某區(qū)域爆發(fā)的疫情會給全球其他國家和地區(qū)帶來潛在的疫情風(fēng)險,于是如何對此類疫情風(fēng)險進行有效的預(yù)測和評估自然就成了一個值得探究的課題。本次埃博拉爆發(fā)的一個重大特征即是,疫情通過交通運輸突破國境,在源爆發(fā)地幾內(nèi)亞之外多國肆虐。對于國際間的人口流動,飛機顯然是最主要的交通方式,因此對機場人口流動數(shù)據(jù)的統(tǒng)計分析也就成了重中之重。
事實上機場數(shù)據(jù)也早已被很多領(lǐng)域的研究者們所重視,基于此類數(shù)據(jù)分析建模的案例也已屢見不鮮。對于埃博拉疫情傳播的分析,也有研究人員給出了他們的方法,其中一種就是通過估計引入風(fēng)險(import risk)的方法來量化埃博拉對某一地區(qū)可能造成的影響。
對于引入風(fēng)險的估計,最核心的問題便是如何通過動態(tài)模型或是統(tǒng)計模型將風(fēng)險量化。這里介紹一種比較直觀簡介的估計方式,首先把引入風(fēng)險分為相對引入風(fēng)險(relative import risk)和絕對引入風(fēng)險(absolute import risk)。不妨假設(shè)X為疫情爆發(fā)區(qū)域的某個機場,而Y則是世界上任意一塊區(qū)域,那么我們可以通過條件概率的形式來定義相對引入風(fēng)險,即P(Y|X)。而對于絕對引入風(fēng)險我們則可以通過聯(lián)合概率來定義,即P(X,Y)=P(Y|X)P(X),這里需要注意的是P(X)往往遠小于P(Y|X),因此P(X,Y)也會遠遠小于P(Y|X)。在實際應(yīng)用中,相對風(fēng)險較絕對風(fēng)險而言更有價值,其主要原因在于P(X)的估計在大部分時間都難以實現(xiàn),事實上P(X)的估計需要依賴于大量的參數(shù)來描述X所在地區(qū)的各類因素,而絕對風(fēng)險的估計卻恰恰依賴于P(X)。與此相反,相對風(fēng)險的計算則僅僅需要各機場人口流動的數(shù)據(jù)即可,即無需考慮地區(qū)本身的相關(guān)因素。