Steffen Haider 表示自己先要學(xué)習(xí)規(guī)則,在書中他得知中風(fēng)往往發(fā)生在一邊,組織在 CT 中會輕微“變灰”,且常常伴有略微腫脹,造成解剖邊界模糊。“在某些部位,大腦的供血特別脆弱。”他說道。要想認出這些病變,他必須在大腦的一側(cè)尋找那些另一側(cè)沒有出現(xiàn)的跡象。
筆者提醒他忽視了圖像中很多不對稱的情況。這個 CT 掃描與大多數(shù)情況一樣,在腦部左側(cè)存在其他灰色的波紋,但右側(cè)卻沒有,它們可能是婦女中風(fēng)前大腦中的異常運動或潛在變化。他是如何把重點縮小到這片區(qū)域的?他停了下來,沉思了一會,隨后說道:“我也不知道,有一部分是存在于潛意識里的。”
“對于一個放射學(xué)家來說,這是在學(xué)習(xí)和成長中自然習(xí)得的。”Lignelli-Dipple 說道。于是筆者開始思考,機器是否也能用同樣的方式進行“學(xué)習(xí)和成長”。
Thrun 的理想世界
2015 年 1 月,計算機科學(xué)家 Sebastian Thrun 開始迷上了醫(yī)學(xué)診斷這個課題。Thrun 在德國長大,他身材消瘦,剃了光頭,看起來就像漫畫里的人物。Thrun 以前是斯坦福大學(xué)教授,領(lǐng)導(dǎo)該校的人工智能實驗室,后來他離職創(chuàng)建 Google X,領(lǐng)導(dǎo)會自學(xué)的機器人和自動駕駛汽車的研發(fā)。但是,他發(fā)現(xiàn)自己對有著學(xué)習(xí)能力的醫(yī)療設(shè)備有很大的興趣。Thrun 的母親因乳腺癌離世,當(dāng)時她才 49 歲。“大多數(shù)癌癥病人一開始沒有癥狀。”Thrun 說道。“我母親就是這樣,但當(dāng)她去看醫(yī)生時,一切都晚了。因此,我一直想找到一個能盡早發(fā)現(xiàn)癌癥的方法,畢竟那時我們還能將病人從死亡線上拉回來。機器學(xué)習(xí)算法在這里能起到作用嗎?”
學(xué)界關(guān)于自動診斷的早期研究往往與教科書上的顯性知識緊密相關(guān)。以心電圖為例,過去的二十年來,電腦解讀的通常是這些系統(tǒng)的特征,執(zhí)行這些工作的程序也比較直接,特征波形與多種情況相關(guān),如心房顫動或血管阻塞。此外,還有識別這些特征波形并輸入到應(yīng)用中的規(guī)則。當(dāng)機器識別到這些特征波形時,它會把這種心跳標記為“心房顫動”。
乳腺癌的檢查與心電圖類似,眼下“計算機輔助檢查”的方式已經(jīng)不再新鮮。在檢查中,模式識別軟件會標記那些疑似出現(xiàn)病變的區(qū)域,隨后醫(yī)生需要對這些可疑區(qū)域進行復(fù)查以確定診斷結(jié)果是否正確。不過,如今的診斷軟件大多數(shù)利用的還是基于規(guī)則的系統(tǒng),它們沒有自行學(xué)習(xí)的能力。因此,一個看過 3000 張 X 光片的機器人其實水平跟只看過 4 張的差不多。2007 年的研究進一步證明了這種檢測方法的局限性。人們通常認為機器介入后,準確率會明顯提高,但事實上機器產(chǎn)生的影響很復(fù)雜。在計算機輔助診斷組中,活體檢查的準確率上升,但腫瘤學(xué)家最希望檢測到的小型侵入性乳腺癌準確率卻有所降低(后續(xù)檢測中甚至出現(xiàn)了“假陽性”問題)。
Thrun 相信,他能將第一代診斷設(shè)備上基于規(guī)則的算法替換為基于學(xué)習(xí)的算法,這樣一來設(shè)備就拋棄了“書面知識”,學(xué)會了“實踐知識”。Thrun 的學(xué)習(xí)算法還加入了現(xiàn)在最為火熱的“神經(jīng)網(wǎng)絡(luò)”技術(shù),因為該技術(shù)的靈感源于大腦運作的模型,所以它能完成這一學(xué)習(xí)過程。在大腦中,神經(jīng)突出會通過反復(fù)激活而遭到增強或削弱;這些數(shù)字系統(tǒng)旨在通過數(shù)學(xué)手段實現(xiàn)類似的目的,調(diào)整連接的“權(quán)重”向預(yù)期輸出靠攏。更強大的系統(tǒng)會與神經(jīng)元層級相似,每個系統(tǒng)會分別處理輸入的數(shù)據(jù)并將結(jié)果傳送給下一層,而這就是我們所說的“深度學(xué)習(xí)”。
Thrun 首先拿皮膚癌開刀,特別是美國人非常容易罹患的角化細胞癌和黑色素瘤(非誠勿擾 2 里孫紅雷得的,最恐怖的皮膚癌)。機器經(jīng)過學(xué)習(xí),能在圖片上分清皮膚癌和那些良性皮膚?。ㄈ缍欢?、皮疹等)嗎?“如果皮膚科醫(yī)生能做到,那么機器肯定也能搞定,而且可能會做得更好。”
通常情況下,關(guān)于黑色素瘤的教學(xué)會從基于規(guī)則的系統(tǒng)開始,就像皮膚病醫(yī)生入門一樣。學(xué)習(xí)過程中會有一系列便于記憶的符號,如 ABCD。這些符號有其特殊含義,如黑色素瘤通常是不對稱的(Asymmetrical),它們的邊界(Borders)參差不齊,顏色(Color)呈斑塊狀,而直徑(Diameter)則超過 6 毫米。不過,Thrun 查了醫(yī)書和網(wǎng)絡(luò)上的標本后卻發(fā)現(xiàn),一些黑色素瘤的的標本并不適用于這些固定的規(guī)則。