美國科學(xué)家正準(zhǔn)備為癌癥研究裝備上人工智能的馬達(dá),加速人類對(duì)抗癌癥的征途。
作為美國“抗癌登月計(jì)劃”、精密醫(yī)學(xué)計(jì)劃、美國國家戰(zhàn)略計(jì)算計(jì)劃三項(xiàng)國家性計(jì)劃的結(jié)晶之一,美國能源部與美國國家衛(wèi)生研究院下屬的國家癌癥研究所合作,發(fā)起“先進(jìn)癌癥計(jì)算解決方案的聯(lián)合設(shè)計(jì)(Joint
Design of Advanced Computing Solutions for
Cancer,JDACS4C)”。作為負(fù)責(zé)人之一,美國阿貢國家實(shí)驗(yàn)室計(jì)算、環(huán)境與生命實(shí)驗(yàn)室副主任Rick
Stevens透露,聯(lián)合設(shè)計(jì)的首個(gè)試點(diǎn)項(xiàng)目成果將在2017年的第二季度公開。
該項(xiàng)目于今年6月正式宣布啟動(dòng),并在8月到位了第一筆資金。“抗癌登月計(jì)劃”是美國總統(tǒng)奧巴馬在今年1月宣布的一項(xiàng)科研戰(zhàn)略目標(biāo),旨在加快癌癥研究,總預(yù)算近10億美元。
之所以稱為聯(lián)合設(shè)計(jì),是因?yàn)樵擁?xiàng)目將攻克三個(gè)基于計(jì)算機(jī)深度學(xué)習(xí)的抗癌難題:
1. RAS分子項(xiàng)目。從分子層面上,了解RAS/RAF通路的蛋白質(zhì)相互作用。RAS基因在上世紀(jì)60年代被發(fā)現(xiàn)是癌基因,存在于30%的癌癥患者中。通過結(jié)合模擬和實(shí)時(shí)篩選數(shù)據(jù),針對(duì)RAS基因及相關(guān)信號(hào)通道,科學(xué)家希望能找到新的診斷和靶點(diǎn)治療方法;
2. 臨床前篩查。發(fā)展藥物反應(yīng)的預(yù)測(cè)模型,在臨床試驗(yàn)前進(jìn)行最大化地藥物篩選,為癌癥病人提供精準(zhǔn)醫(yī)療方案。具體操作是對(duì)臨床前和臨床試驗(yàn)時(shí)的癌癥數(shù)據(jù)進(jìn)行篩選,結(jié)合小鼠模型中的新數(shù)據(jù),通過反饋循環(huán)讓實(shí)驗(yàn)?zāi)P椭笇?dǎo)計(jì)算模型的設(shè)計(jì),建立腫瘤藥物反應(yīng)的預(yù)測(cè)模型;
3. 人口模型。根據(jù)生活方式、所處環(huán)境、癌癥種類、醫(yī)療體系,從百萬個(gè)癌癥病人的病歷數(shù)據(jù)中自動(dòng)分析、獲取最佳的治療策略。海量數(shù)據(jù)來自美國國家衛(wèi)生研究院、美國食品和藥物管理局、制藥公司和第三方付款機(jī)構(gòu)。
這三個(gè)難題基于不同的生物尺度,對(duì)大數(shù)據(jù)分析和深度學(xué)習(xí)提出了高要求,由來自不同領(lǐng)域的科學(xué)家團(tuán)隊(duì)在數(shù)據(jù)采集、數(shù)據(jù)分析、模式公式、模擬運(yùn)行上開展合作。美國能源部和國家癌癥研究所各有所長,前者有精良的計(jì)算機(jī)專家資源,而后者擁有不輕易對(duì)外公開的癌癥數(shù)據(jù)資源。如果挑戰(zhàn)成功,現(xiàn)有的傳統(tǒng)科學(xué)計(jì)算應(yīng)用將被超越,推進(jìn)百億億次級(jí)計(jì)算機(jī)的應(yīng)用,并在人工智能的幫助下,將癌癥治療在精準(zhǔn)化方面上一個(gè)臺(tái)階。
雄心勃勃的同時(shí)有重重困難。生物信息、病理報(bào)告、病歷信息往往是非結(jié)構(gòu)性的,它與機(jī)器學(xué)習(xí)所依靠的結(jié)構(gòu)性信息存在一條“溝”,如何在非結(jié)構(gòu)性和結(jié)構(gòu)性信息之間轉(zhuǎn)化、翻譯是難點(diǎn)之一。
另一方面,要想有高精度的預(yù)測(cè)和解釋模型仍具挑戰(zhàn)性。比如對(duì)藥物的治療效果進(jìn)行判斷時(shí),計(jì)算機(jī)可以精確得知結(jié)果,但得到的結(jié)果是機(jī)械性的,不具備解釋原因的能力。Rick Stevens設(shè)想,將機(jī)械化的模型和機(jī)器學(xué)習(xí)的模型結(jié)合起來,可以解決這一問題。
出現(xiàn)英特爾、IBM等公司身影
提高深度學(xué)習(xí)的能力,需要回歸到高性能計(jì)算機(jī)(HPC)的研究,離不開高性能計(jì)算機(jī)供應(yīng)商的身影。在接受國際高性能計(jì)算網(wǎng)站HPCwire的采訪時(shí),Rick
Stevens透露,“先進(jìn)癌癥計(jì)算解決方案的聯(lián)合設(shè)計(jì)”項(xiàng)目已和英特爾、Cray、NVIDIA、IBM等公司達(dá)成合作關(guān)系。
今年8月,英特爾耗資4億美元收購了Nervana Systems公司,Nervana雖是初創(chuàng)企業(yè),但在深度學(xué)習(xí)領(lǐng)域是排頭兵,擁有專為深度學(xué)習(xí)打造的全方位優(yōu)化的軟件和硬件堆棧,號(hào)稱處理器速度將可達(dá)到GPU的10倍。
除了高性能計(jì)算機(jī),Rick
Stevens和同事還在評(píng)估最適合的深度學(xué)習(xí)框架,其中不排除谷歌、微軟、Facebook等公司。另一方面,Rick
Stevens和同事也在和美國著名的人工智能實(shí)驗(yàn)室勞倫斯·利弗莫爾國家實(shí)驗(yàn)室合作,比如其實(shí)驗(yàn)室名為LBANN的可擴(kuò)展人工神經(jīng)網(wǎng)絡(luò)框架。
是美國“抗癌登月計(jì)劃”的目標(biāo)之一