懷疑主義是一把雙刃劍。如果沒有懷疑主義的話,IT經(jīng)理可能會去投資那些沒有用處的軟件。足夠的懷疑,可以讓IT部門等待足夠的證據(jù),以證明特定的平臺可以帶來好結(jié)果。
醫(yī)療行業(yè)的數(shù)據(jù)分析到達臨界點
大數(shù)據(jù)分析現(xiàn)在已經(jīng)到達了醫(yī)療行業(yè)的臨界點。一些供應商承諾在減少開支的同時,會提供更好的醫(yī)療質(zhì)量,但有證據(jù)表明這些說法是有爭議性的。同樣,一些大數(shù)據(jù)運動的批評者指出,醫(yī)療行業(yè)在開展大的項目之前,可以從小數(shù)據(jù)集榨取情報。
舉例來說,在最近的一篇博客文章中,顧問兼醫(yī)學博士David C. Kibbe和Vince Kuraitis爭論說道,運營商最好專注于使用小數(shù)據(jù),而不是屈從于大數(shù)據(jù)分析的誘惑力。換句話說,集中于臨床上已有的以數(shù)字化的形式保存的數(shù)據(jù),致力于使用那些直接適用于護理管理的IT工具。
另一方面,大數(shù)據(jù)分析試圖從許多不同的來源,解析成堆的數(shù)據(jù),試圖發(fā)現(xiàn)那些對于解決問題來說有用的模式。例如,研究人員采用了大數(shù)據(jù)的方法來研究遺傳和環(huán)境因素在多發(fā)性硬化癥上的表現(xiàn),從而尋找個性化的治療方法。
一些研究可能會帶來令人興奮的回報,但IT公司已經(jīng)迫不及待了。就像Kibbe 和Kuraitis指出的,科技公司都在鼓吹大數(shù)據(jù)分析是醫(yī)療保健系統(tǒng)必須具備的,而醫(yī)生群體的目標是成為可信賴的醫(yī)療機構(gòu)或者在納稅人的支持下,成立像ACO類似組織。由于這些ACO和醫(yī)療機構(gòu)嘗試得到共享儲蓄或金融風險的合同的利潤,這些大數(shù)據(jù)支持者聲稱,大數(shù)據(jù)可以幫助他們整合數(shù)據(jù),使得質(zhì)量提高的同時,能夠降低成本。
一些供應商已經(jīng)在病人護理方面使用大數(shù)據(jù)。據(jù)《商業(yè)周刊》的消息,許多供應商正在轉(zhuǎn)向如微軟、SAS、IBM、戴爾和甲骨文這樣的公司,去獲得數(shù)據(jù)挖掘的專業(yè)知識。醫(yī)療保健分析是一個不斷發(fā)展的業(yè)務(wù)。Frost&Sullivan的研究顯示將有一半的醫(yī)院在2016年使用先進的分析軟件,而現(xiàn)在是10%。
醫(yī)療服務(wù)提供者已經(jīng)為大數(shù)據(jù)分析做好準備了么?他們能夠?qū)Ω邢薜臄?shù)據(jù)分析功能內(nèi)置到他們的電子病歷系統(tǒng)和指向新政策和程序的關(guān)系數(shù)據(jù)庫感到滿意么?
在最近接受《信息周刊》醫(yī)療保健欄目采訪時,說到權(quán)衡大數(shù)據(jù)和小數(shù)據(jù),國家健康協(xié)調(diào)IT辦公室的前負責人大衛(wèi)·布盧門撒爾表示:“這不是一個選擇問題。大數(shù)據(jù)是從小數(shù)據(jù)開始的。我們有更多關(guān)于健康、疾病以及護理模式的信息,這些信息將給我們提供有益的見解,告訴我們什么在起作用,什么卻沒有以及什么是疾病的自然史。它使我們能夠更快、更有效地做研究......但是我們會需要一段時間,才能弄清楚如何使用這些數(shù)據(jù)。
聽到許多大數(shù)據(jù)評論家的質(zhì)疑,Blumethal說:“我們堅信科學提供了機遇,同時大部分時間證明,我們的信念是正確的。”
從這個角度出發(fā),筆者總結(jié)了7家公司以及大型醫(yī)療中心的工作,指出他們已經(jīng)在做類似的嘗試。
Explorys
克利夫蘭診所的產(chǎn)品Explorys,提供了一個基于云的性能管理平臺,給醫(yī)療服務(wù)者提供臨床、財務(wù)和運營方面的數(shù)據(jù)管理,這是以前從未有過的模式。在它的客戶中,有圣若瑟衛(wèi)生系統(tǒng)、MedStar和天主教健康伙伴。
與老派的依賴于關(guān)系型數(shù)據(jù)庫的分析方法不同,該公司的服務(wù)依賴于Cloudera公司。這是一個基于Hadoop的軟件的服務(wù)公司,可以幫助工程師和信息專家處理做繁重的工作。
Explorys平臺允許供應商做三件事情:在患者人群和保健場所搜索,以幫助確定疾病的發(fā)展趨勢;坐標規(guī)則驅(qū)動的病人登記;性能指標——如果一個組織打算滿足ACO的要求的話,這是一個關(guān)鍵因素。
當然,如果它不產(chǎn)生過硬的數(shù)據(jù),去表現(xiàn)出更好的醫(yī)療質(zhì)量并降低成本,這一切努力都是毫無意義的。
Explorys的首席醫(yī)療信息官兼醫(yī)學博士Anil Jain解釋說:“因為該公司相對來說比較年輕,還尚未產(chǎn)生這些結(jié)果。換一句話說,沒有證據(jù)證明,它可以減少糖尿病患者截肢的人數(shù)或減少先天性心臟疾病的患者死于心肌梗死的數(shù)量。
但Explorys所產(chǎn)生的數(shù)據(jù)表明,它正在接近這一目標。例如,在與辛辛那提天主教健康伙伴合作時,分析平臺有助于提高肺炎疫苗14%的接種率,乳癌篩檢率增加了13%,增加了糖尿病患者3%的糖化血紅蛋白檢測率——這是一個長期血糖控制的衡量標準。
美國醫(yī)學信息學協(xié)會雜志(哈福)最近在一份報告中概述了Explorys的項目,它從幾個不同的醫(yī)療保健系統(tǒng)近100萬患者的電子病歷中收集數(shù)據(jù)。分析可以幫助醫(yī)生找出那些位于四肢和肺部中最危險的血液凝塊。該分析只需花費125小時,所需的也是最少的人力。這樣一個分析項目,使用傳統(tǒng)的研究方法的話,通常需要幾年時間才能完成。
Humedica
Humedica提供了一個基于云計算的人口分析系統(tǒng)。它連接了患者在不同的醫(yī)療設(shè)置產(chǎn)生的信息——門診和住院病人以及時間段產(chǎn)生的病人的護理的縱向視圖。公司擁有30多個國家近25萬患者的數(shù)據(jù),可以使得個人化的客戶與一個非常大的人口數(shù)據(jù)來比較他們的身體性能。
該公司的服務(wù)整合、標準化和驗證臨床數(shù)據(jù),是從護理的不同層面開展的,不僅包括藥物治療、實驗室檢測結(jié)果、生命體征、人口統(tǒng)計、住院和門診,也包括醫(yī)生的筆記和實驗室檢測結(jié)果,結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)均得到了利用。它的客戶基礎(chǔ)來自四大類:綜合交付網(wǎng)絡(luò)(IDN)、大型學術(shù)醫(yī)學中心、多醫(yī)院的醫(yī)療系統(tǒng)和多實踐的大醫(yī)療集團。
一個典型的例子:中哈得遜醫(yī)療集團的以病人為中心的醫(yī)療家已經(jīng)使用Humedica的MinedShare分析服務(wù),來衡量其患者群體,并將其與行業(yè)最佳實踐服務(wù)做比較。
例如,125-醫(yī)生的做法是提取糖尿病患者的數(shù)據(jù),以確定最近一次問診時,其HgA1c的讀數(shù)在7%(小于最佳的血糖控制的跡象)以上,并指出哪個病人在最近一年內(nèi)沒有看醫(yī)生。因為使用該系統(tǒng),醫(yī)院能夠關(guān)注到這些高?;颊?,并且保證在該項目開展的前8個月,大約有三分之一的人能夠得到至少一次的回訪。
在這一組中,有三分之一的患者實現(xiàn)了HgA1c的數(shù)字保持在8%以下的目標,60%HgA1c的數(shù)字超過9%的患者,正通過頻繁的造訪初級保健醫(yī)生,努力降低血糖。
進一步的證據(jù)表明,中哈得遜是看中了Humedica MinedShare提供的臨床指標的投資回報率,而且現(xiàn)在該供應商已取得了由國家質(zhì)量委員會(NCQA)頒發(fā)的3級識別標志。
InterSystems
InterSystems喜歡提醒醫(yī)療服務(wù)提供者,即使是大型企業(yè)級數(shù)據(jù)倉庫也可能是不夠用的,能夠在提供高質(zhì)量的護理并顯著節(jié)省開支的情況下,提供所有必需的智能。負責保健機構(gòu)和類似支付的性能模式的出現(xiàn)所需要的智能,目前是最迫切需要的。
InterSystems公司提供的HealthShare醫(yī)療衛(wèi)生信息平臺,其內(nèi)置的有源分析組件,能夠解決這個問題。像許多其他大數(shù)據(jù)供應商一樣,收集、聚集、規(guī)范化并展示從各種孤島得來的病人的數(shù)據(jù),以幫助決策者提供臨床以及財政上的支持。
羅得島州正在全州范圍內(nèi)使用HealthShare,來促進健康信息的交流,并收集和分析病人的數(shù)據(jù)。這使得國家的醫(yī)療實踐隊伍能夠做臨床的總結(jié)交流,以改善護理的質(zhì)量,這是ACOS的一個重要組成部分。
羅得島州質(zhì)量協(xié)會的首席信息官加里·克里斯騰森,在InterSystems網(wǎng)站上稱贊HealthShare,他說:“HealthShare給RIQI提供了節(jié)約成本和一定質(zhì)量水平的護理的服務(wù),這是醫(yī)生不能從自己的記錄中得到的分析結(jié)果。”在最近一次接受采訪時,克里斯騰森表示:“他的團隊使用InterSystems公司的分析工具,得出在羅得島州超過四分之一的的人口所進行的實驗,8%至12%的測試是重復的,醫(yī)學上來說不必要的。
瑞典也已發(fā)覺了使用HealthShare InterSystems的好處,它創(chuàng)建一個900萬人口的國家電子病歷系統(tǒng)。該系統(tǒng)以瀏覽器為基礎(chǔ),能夠顯示病人的人口統(tǒng)計資料、藥物清單、實驗室數(shù)據(jù)、過敏和相關(guān)信息。
Pervasive
保險詐騙是醫(yī)療保健行業(yè)最棘手的問題之一,占用了Pervasive大量的時間和精力。Pervasive的DataRush,是一個高速并行數(shù)據(jù)處理的多核心電腦和多臺電腦聯(lián)網(wǎng)的應用程序框架和分析引擎,可以在服務(wù)供應商協(xié)同國家機構(gòu)在檢測醫(yī)療補助欺詐行為方面,提供幫助。在一個案例研究中,該公司在其網(wǎng)站上強調(diào),Pervasive可以幫助恢復醫(yī)療賠償,而那些本來應該是私人保險公司償付的。
為了檢測欺詐行為,一些服務(wù)提供商為了匹配保險文件,使用SQL Server,這是一個長時間的乏味的過程。DataRush快速模糊匹配系統(tǒng)搜索兩個數(shù)據(jù)庫,其中一個包含從國家獲得的醫(yī)療補助的名字,另一個是參加私人計劃的病人的名字,最終是為了找到重疊部分。根據(jù)Pervasive情況報告,最終的結(jié)果是降低運營成本和獲得更快的投資回報率。
臨床查詢
臨床查詢可能不會有和商業(yè)大數(shù)據(jù)公司相同的利潤動機,但可以肯定的是,在尚未開發(fā)的醫(yī)療數(shù)據(jù)方面它有自己的優(yōu)勢。
臨床查詢是一個在貝斯以色列女執(zhí)事醫(yī)療中心使用的醫(yī)療信息平臺,它能夠在降低成本的同時,提高產(chǎn)品質(zhì)量。為了實現(xiàn)這兩個目標,醫(yī)生不僅需要重點關(guān)注坐在他們面前的病人,還有關(guān)注那些有著相同病癥或情況的人群——所謂的人口健康管理。這一任務(wù)需要的數(shù)據(jù)分析工具,比以往任何時候都復雜的多。
BIDMC的首席信息官約翰·哈拉姆卡,把“進入臨床查詢”作為一個臨床試驗或者臨床研究商業(yè)智能系統(tǒng)。這是一個與擁有病人病歷龐大的數(shù)據(jù)庫連接起來的搜索引擎,能夠讓醫(yī)院員工測試到底是什么原因?qū)е乱环N疾病的發(fā)生,例如測試藥物、飲食或生活習慣這些可能導致疾病發(fā)展的變量。
該庫包含了220萬名患者的200萬個數(shù)據(jù)點,包括藥物服用、診斷和實驗室值。查詢工具能夠瀏覽20000條使用布爾表達式的醫(yī)學概念。所有的數(shù)據(jù)被映射到標準的醫(yī)療語言代碼。例如診斷映射到ICD-9,藥物映射到RxNorm代碼,實驗室數(shù)據(jù)映射到邏輯觀察標識符名稱和代碼(LOINC)。
在臨床查詢的幫助下,臨床醫(yī)生或研究人員可以搜索記錄,以找出多少名乳腺癌患者也服用ACE抑制劑,這是一類用于治療高血壓的藥物。如果藥物和惡性腫瘤之間顯示出很強的相關(guān)性,醫(yī)院可以做更深入的分析,并建立一個正式的研究項目來做調(diào)查。
最終目標是發(fā)現(xiàn)一個新的醫(yī)療方法,以改善整個乳腺癌患者的生存狀況。
哈拉姆卡說:“臨床查詢的獨特之處是,它是完全的自助式服務(wù)。我沒有必要去聘請分析師。我也不需要從我們的機構(gòu)審查委員會得到特別許可,就能使用它。”
IBM/Memorial Sloan-Kettering Cancer Center
在紐約電子健康協(xié)會最近主辦的數(shù)字健康會議上,IBM首席醫(yī)學科學兼醫(yī)學博士馬丁·科恩和紀念斯隆-凱特琳癌癥中心(MSKCC)在紐約的首席信息官 Pat Skarulis,提出共同利用沃森超級計算機的大數(shù)據(jù)處理能力,以幫助腫瘤學家為MSKCC的患者提供更好的服務(wù)。
科恩指出,沃森不僅是類固醇的“搜索引擎”,甚至是一個龐大的數(shù)據(jù)庫。 它依賴于并行概率算法來分析在病人的病歷和醫(yī)學文獻中數(shù)以百萬計的網(wǎng)頁的非結(jié)構(gòu)化的文本,找到最相關(guān)的答案,以診斷和治療相關(guān)的問題。
全球90%的數(shù)據(jù)在過去的兩年被制造出來,80%的數(shù)據(jù)是非結(jié)構(gòu)化的。 任何一個有著未讀醫(yī)學期刊一大堆的臨床醫(yī)生都知道,收集的大量信息并沒有包含在人們所閱讀的文獻中。
沃森為這些人閱讀這些文獻,并且提高了速度。
借助自然語言處理 (NLP),計算機不僅翻譯出有關(guān)條款,以符合臨床醫(yī)生在查詢中的搜索條件,同時也了解英語中的成語和其他特殊表現(xiàn)形式。在時間、統(tǒng)計釋義和地理空間算法的幫助下,能夠在臨床醫(yī)生的問題和收集的大量醫(yī)療事實以及理論之間,找到有意義的聯(lián)系。
Skarulis表示,MSKCC決定與IBM合作,以“打造智能引擎來提供特定的診斷測試和治療建議”。這兩個組織現(xiàn)在將把從MSKCC而來的被稱為Darwin的龐大的數(shù)據(jù)庫,與屈臣氏的自然語言處理能力的數(shù)據(jù)相結(jié)合。
IBM正在使用醫(yī)療中心所有的結(jié)構(gòu)化的病人的數(shù)據(jù)和它的NLP工具,致力于將醫(yī)療中心的免費文字咨詢說明轉(zhuǎn)換成可用的數(shù)據(jù)。 Skarulis希望推出一項試點工程,使得不久的將來,將允許超級計算機能夠為真正的醫(yī)療情況而工作。
甲骨文/匹茲堡大學醫(yī)學中心
匹茲堡大學醫(yī)學中心(UPMC)在響應大數(shù)據(jù)倡議方面更進了一步,投資1億美元建立了一個全面的數(shù)據(jù)倉庫,匯集了整個UPMC、UPMC健康計劃及其他關(guān)聯(lián)實體的200多個數(shù)據(jù)源的數(shù)據(jù)。
為了收集、存儲、管理和分析保持在數(shù)據(jù)倉庫中的信息,UPMC將使用Oracle Exadata的數(shù)據(jù)庫機,這是一個高性能的數(shù)據(jù)庫平臺。運用IBM的COGNOS來做軟件商業(yè)智能和財務(wù)管理。同時運用Informatica的數(shù)據(jù)集成平臺和dbMotion的基于SOA的互操作平臺,它集成了醫(yī)療機構(gòu)和衛(wèi)生信息交流而來的病人的病歷。這些工具將管理流經(jīng)UPMC的業(yè)務(wù)部門的3.2千兆字節(jié)的數(shù)據(jù)。
我們的目標是幫助醫(yī)生進入一個更加智能的電子病歷時代。比如根據(jù)實驗室檢測結(jié)果,關(guān)注指標微妙的變化,知曉患者腎功能衰竭的風險,還比如根據(jù)患者的遺傳基因和臨床信息,為乳腺癌患者提供最有效的、同時毒性最小的治療方案。在乳腺癌這種情況下,大部分工作將通過分析患者群體完成,使得研究人員和醫(yī)生在一段時間內(nèi),關(guān)注病人對治療效果和自己的健康狀況做出的反應。
UPMC的官員解釋說,他們將開始使用新的分析工具,他們收集的是先前研究的一組140例乳腺癌患者的數(shù)據(jù)。研究人員已經(jīng)擁有了這些患者的基因組學和電子病歷數(shù)據(jù),在尋求理解個人的差別和他們對治療的反應方面,這給研究人員提供了一個良好的開端。
甲骨文健康科學高級副總裁兼總經(jīng)理尼爾·克雷申佐說:“創(chuàng)新性對于甲骨文和UPMC來說都是非常重要的,因為他們正在開發(fā)的企業(yè)醫(yī)療分析平臺,集成了從臨床、基因組學、金融、管理到運營整個組織的數(shù)據(jù)。所有這些領(lǐng)域都需要他們的工作流程能夠提高工作效率,因為這是UPMC要完成的挑戰(zhàn),以應對數(shù)據(jù)的指數(shù)增長。
為了完成排序這個數(shù)據(jù)挑戰(zhàn),UPMC將廣泛的使用Oracle工具,其中包括了Oracle企業(yè)醫(yī)療分析和Oracle健康科學網(wǎng)。UPMC還將利用“甲骨文融合分析”以及多個組件,比如用甲骨文融合中間件中的Oracle HyperionProfitability和成本管理,來支持以成本為基礎(chǔ)的會計;用甲骨文身份和訪問管理套件來加強合規(guī)性和數(shù)據(jù)保護。