有報告顯示,2011 年,單單美國的醫(yī)療健康系統(tǒng)數(shù)據(jù)量就達(dá)到了 150EB。照目前的增長速度, ZB(約 1021GB)和 YB(約 1021GB) 的級別也會很快達(dá)到 (IHTT, 2013)。Kaiser Permanente,一個在加州發(fā)展起來的醫(yī)療健康網(wǎng)絡(luò)系統(tǒng), 就有 9 百萬的會員,被認(rèn)為擁有 26.5 到 44PB 的電子健康記錄 (IHTT, 2013)。
IT 時代涌現(xiàn)的還有各種網(wǎng)絡(luò)社交媒體數(shù)據(jù),比如曾經(jīng) Google 用來預(yù)測流感的數(shù)據(jù)?;驍?shù)據(jù)也是非常龐大的存在,一次全面的基因測序,產(chǎn)生的個人數(shù)據(jù)則達(dá)到 300GB (Leah, 2014)。公開發(fā)布的基因 DNA 微陣列達(dá)到 50 萬之多,每一陣列包含數(shù)萬的分子表達(dá)值。在生物醫(yī)藥方面,功能性磁共振影像的數(shù)據(jù)量也達(dá)到了數(shù)萬 TB 級別,每一幅影像包含有 5 萬像素值 (Fan, Han, & Liu, 2014)。
此外,各種健身,健康可穿戴設(shè)備的出現(xiàn),使得血壓、心率、體重,血糖,心電圖(EKG)等的監(jiān)測都變?yōu)楝F(xiàn)實(shí)和可能,信息的獲取和分析的速度已經(jīng)從原來的按“天”計(jì)算,發(fā)展到了按“小時”,按“秒”計(jì)算。比如,一家名為 Blue Spark 的科技公司已經(jīng)生產(chǎn)出能 24 小時實(shí)時監(jiān)測體溫的新型溫度計(jì)貼片 temptraq。
這種數(shù)據(jù)的擴(kuò)展速度和覆蓋范圍是前所未有的,數(shù)據(jù)的格式也五花八門,可能是無格式文件(flat file),CSV,關(guān)系表,ASCII/ 純文本文件等等。
同時,數(shù)據(jù)的來源也紛繁復(fù)雜,可能來自不同的地區(qū),不同的醫(yī)療機(jī)構(gòu),不同的軟件應(yīng)用。不可否認(rèn),一旦理順了多格式,多源頭,呈爆炸性成長的大數(shù)據(jù)的整合和分析,醫(yī)療大數(shù)據(jù)將對提高醫(yī)療質(zhì)量,強(qiáng)化患者安全,降低風(fēng)險,降低醫(yī)療成本等方面發(fā)揮無與倫比的巨大作用。
醫(yī)療大數(shù)據(jù)的優(yōu)勢和應(yīng)用場景
有效的整合和利用數(shù)字化的醫(yī)療大數(shù)據(jù)對個體醫(yī)生,康寶中心,大型醫(yī)院,和醫(yī)療研究機(jī)構(gòu)都有著顯著的好處。
潛在的利益包括 (W.Raghupathi & Raghupathi, 2014):
1)更多更準(zhǔn)確的數(shù)據(jù)使得疾病能在早期被監(jiān)測到,從而使治療更容易和有效。
2)通過對特定個體或人群的健康管理,快速有效地監(jiān)測保健詐騙。
3)基于大量的歷史數(shù)據(jù),預(yù)測和估計(jì)特定疾病或人群的某些未來趨勢,比如:預(yù)測特定病人的住院時間,哪些病人會選擇非急需性手術(shù), 哪些病人不會從手術(shù)治療中受益,哪些病人會更容易出現(xiàn)并發(fā)癥,等等。麥肯錫估計(jì),單單就美國而言,醫(yī)療大數(shù)據(jù)的利用可以為醫(yī)療開支節(jié)省出 3 千億美元一年。
醫(yī)療大數(shù)據(jù)的利用可以從以下幾方面減少浪費(fèi)和提高效率 (Manyika, 以及其他人, 2011):
臨床操作: 相對更有效的醫(yī)學(xué)研究,發(fā)展出臨床相關(guān)性更強(qiáng)和成本效益更高的方法用來診斷和治療病人。
研究和發(fā)展:在藥品和醫(yī)療器械方面,建立更低磨損度,更精簡,更快速,更有針對性的研發(fā)產(chǎn)品線。統(tǒng)計(jì)工具和算法方面,提高臨床試驗(yàn)設(shè)計(jì)和患者的招募,使得治療方法可以更好地匹配個體患者的病癥,從而降低臨床試驗(yàn)失敗的可能和加快新的治療方法推向市場。分析臨床試驗(yàn)和病人的病歷,以確定后續(xù)的跡象,并在產(chǎn)品進(jìn)入市場前發(fā)現(xiàn)病人對藥物醫(yī)療方法的不良反應(yīng)。
公共衛(wèi)生:分析疾病模式和追蹤疾病暴發(fā)及傳播方式途徑,提高公共衛(wèi)生監(jiān)測和反應(yīng)速度。更快更準(zhǔn)確地研制靶向疫苗,例如:開發(fā)每年的流感疫苗。
此外,醫(yī)療大數(shù)據(jù)的分析還有利于以下幾方面的發(fā)展 (W.Raghupathi & Raghupathi, 2014):
循證醫(yī)學(xué):結(jié)合和分析各種結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),電子病歷,財務(wù)和運(yùn)營數(shù)據(jù),臨床資料和基因組數(shù)據(jù)用以尋找與病癥信息相匹配的治療,預(yù)測疾病的高?;颊呋蛱峁└喔咝У尼t(yī)療服務(wù)。
基因組分析:更有效和低成本的執(zhí)行基因測序,使基因組分析成為正規(guī)醫(yī)療保健決策的必要信息并納入病人病歷記錄。
提前裁定欺詐分析:快速分析大量的索賠請求,降低欺詐成功率,減少浪費(fèi)和濫用。
設(shè)備/遠(yuǎn)程監(jiān)控:從住院和家庭醫(yī)療裝置采集和分析實(shí)時大容量的快速移動數(shù)據(jù),用于安全監(jiān)控和不良反應(yīng)的預(yù)測。
病人的個人資料分析:全面分析病人個人信息(例如,分割和預(yù)測模型)從中找到能從特定健保措施中獲益的個人。例如,某些疾病的高?;颊撸ㄈ缣悄虿。┛梢詮念A(yù)防措施中受益。這些人如果擁有足夠的時間提前有針對性的預(yù)防病情,那么大多數(shù)的危害可以降到最低程度,甚至可以完全消除。