“在中國,有70%的診療需要根據(jù)醫(yī)療影像給出的信息做出診斷。而且這個系統(tǒng)還在不斷地發(fā)展,影像圖片量每年大概有40%左右的增長,但是相應(yīng)的,每年影像醫(yī)生數(shù)量卻頂多只以3%的速度在增加,所以說現(xiàn)在中國非常缺乏影像科醫(yī)生。”上海第二軍醫(yī)大學長征醫(yī)院放射科主任、中華放射學會副主任委員劉士遠告訴澎湃新聞(www.thepaper.cn)。
缺少影像科醫(yī)生又引發(fā)了另外一個問題,即導致醫(yī)生的超負荷工作。而當醫(yī)生在超負荷工作時,做出錯誤判斷的概率會上升,甚至會漏掉原本可以發(fā)現(xiàn)的一些早期病癥。這樣的惡性循環(huán)成為了醫(yī)患關(guān)系緊張的推手。
目前看來,解決這個問題的關(guān)鍵落在了人工智能技術(shù)上。2013年,自動識別疾病,提高醫(yī)院診斷的深度學習方法就被《MIT科技評論》評為當年的十大技術(shù)突破之一。目前,人工智能在金融、醫(yī)療和制造等領(lǐng)域的應(yīng)用正在迅速增長。麥肯錫估計,到2025年,AI應(yīng)用的總市場將達到1270億美元。而另一個機構(gòu)IDC預測,國內(nèi)醫(yī)療信息化解決方案市場在2012年至2016年的年復合增長率達到14.3%,未來這一市場有望超300億元。
在國內(nèi),利用深度學習技術(shù)訓練模型,已經(jīng)可以在臨床診療上幫助醫(yī)生識別肺部病變和癌癥。上海第二軍醫(yī)大學長征醫(yī)院成為最早擁抱這一技術(shù)的醫(yī)院之一,而與他們合作的公司是一家在2016年前無人關(guān)注的初創(chuàng)公司——推想科技。
“2014年我回國的時候,發(fā)現(xiàn)國內(nèi)醫(yī)療領(lǐng)域的痛點,很多醫(yī)生其實每天都在超負荷工作。當我決心要做這件事的時候,才發(fā)現(xiàn)原來其實自己身邊真的有很多人因為醫(yī)院的漏診或誤診錯過了最佳治療的時間。”陳寬在接受澎湃新聞(www.thepaper.cn)專訪時說。
用靠譜的數(shù)據(jù)教機器識別病變
不過說說容易,做起來難。
“我們與陳寬的合作開始于2016年的10月份,說實話一開始合作的時候結(jié)果并不樂觀。雖然機器能發(fā)現(xiàn)肺部病變,但是許多是假陽性。”劉士遠主任說。
之所以先在肺部進行醫(yī)療影像識別診斷的應(yīng)用,其實有一定的科學依據(jù)。因為肺本身是一個含空氣的一個臟器,它的醫(yī)療影像擁有最好的天然對比。如果病人的肺里面有病灶,相當于在黑紙上面有個白點,一目了然了,對于機器來說,比較容易識別。而其他器官,比如肝臟、大腦等部位的醫(yī)療影像,如果有病灶就像在灰色的紙上,點了個白點,對比并不強烈。
那何為機器檢查出來的假陽性,劉士遠做了一個比喻。機器檢測出的假陽性,相當于一個警察在人群中識別出了十個壞人,卻發(fā)現(xiàn)八個是好人。另外一個問題是機器還存在漏診的可能性。也就是說警察能識別出殺人犯等重罪犯人,卻無法識別出小偷小摸的輕度罪犯。對于肺部的病變來說,許多肺里結(jié)節(jié)一開始是小且淡的,需要時間才能變大,但對于許多病人來說,這時候其實是就診的最佳時機。
要改變上述的情況,高精準的醫(yī)療數(shù)據(jù)集成了關(guān)鍵。Facebook人工智能實驗室主任楊樂昆曾對機器學習的圖像識別技術(shù)進行過解釋。對于機器來說,要識別圖中有什么,首先需要人類通過大量的標記好的圖片告訴它圖片里是什么。劉士遠和推想科技進行了合作,利用醫(yī)院自己清晰標注的數(shù)據(jù)集對模型進行了訓練,提高機器識別的準確率。
“這相當于請老師教一個無知的孩子識字辨是非。如果你請了不靠譜的老師,交給他錯誤的信息,這個孩子會越學越壞;相反,如果你請了靠譜的老師,他才能越學越聰明。”劉主任說。
借助長征醫(yī)院一整套完善的肺部標準化重建和評價體系,經(jīng)過6個月左右的訓練和實驗,目前推想科技的產(chǎn)品在肺部病變的識別率上已經(jīng)有所提高。在識別的10個“犯人”中,機器的錯誤率已經(jīng)降至1個或者半個。同時,與醫(yī)院里年輕的醫(yī)生相比,機器發(fā)現(xiàn)小結(jié)節(jié)的敏感度比人的肉眼要高出50%左右。人類可能肉眼會錯過的小結(jié)節(jié),目前機器已不會漏掉。
超高識別率背后的艱辛
推想科技在長征醫(yī)院取得的成果令人振奮,但在國內(nèi)愿意擁抱新技術(shù)的醫(yī)院卻還是少數(shù),大部分的醫(yī)院目前還在觀望階段。