還有一個是我們同事的小孩,當(dāng)時因為川崎病進(jìn)了醫(yī)院,后來治療得到了控制,出院前復(fù)查的時候都很開心。但是小孩出院后第二天開始全身發(fā)熱,而且沒有查出原因。之后通過高通量基因測序幫助迅速確定是“蒙氏假單胞菌”感染,這是醫(yī)院內(nèi)常見的一個病原微生物,針對性用藥之后小男孩病情得到控制并恢復(fù)了正常。
上面舉了五個例子,綜合起來講就是:貫穿整個生命周期,基因組醫(yī)學(xué)都有相應(yīng)的解決方案。從孕前、新生兒,到老年的過程,腫瘤、病原感染的治療都有比較好的案例。這些就是老百姓們用得起的基因檢測。
基因大數(shù)據(jù)擴展的價值在哪兒?
大產(chǎn)業(yè)產(chǎn)生大數(shù)據(jù),基因大數(shù)據(jù)擴展的價值在哪兒?
先舉一個23andMe的例子。這是一家提供個人基因檢測的公司。公司寄給用戶一個樣品收集裝備,用戶將樣品與收集管里面的保存液混合后再寄回公司。通過檢測,公司會告訴用戶疾病健康以及個體特征等信息。2007年成立的時候,初期的數(shù)據(jù)積累特別慢,后來爆發(fā)式增長,目前已經(jīng)有超過100萬的用戶數(shù)據(jù)。可是一直以來該公司都沒有找到合適的盈利點。2015年1月6號,Genentech宣布投資6000萬美元購買3000萬名帕金森病全基因組的數(shù)據(jù),這些數(shù)據(jù)從原來的99美金一份變成了2000美金一份。這些數(shù)據(jù)可以用作新藥研發(fā),幫助找到靶基因。
另外一個例子是華大的無創(chuàng)產(chǎn)前基因檢測,這100萬的低深度全基因組測序的數(shù)據(jù)量是23andMe的很多倍,對應(yīng)的我講講華大的無創(chuàng)產(chǎn)前基因檢測能告訴用戶什么。下面的結(jié)果是華大基因的金鑫博士的分析。第一個可以查的是孕期腫瘤,本來這個項目的設(shè)計是為了查胎兒的染色體異常,意外地發(fā)現(xiàn)通過檢測也可以查孕婦有沒有腫瘤。2015年的一篇科學(xué)研究報道:通過無創(chuàng)產(chǎn)前基因檢測,可以發(fā)現(xiàn)母體的腫瘤發(fā)病率在3/4000。同樣,我們通過華大自己的數(shù)據(jù)也能發(fā)現(xiàn)孕婦當(dāng)中的腫瘤,下圖中紅紅藍(lán)藍(lán)的柱子表示的是染色體異常。正常的孕婦其實不會有那么多異常,這提示的就是腫瘤異常,相應(yīng)的數(shù)據(jù)也通過隨訪進(jìn)行了相互驗證。
除此之外,還可以分析耳聾和地中海貧血基因以省級行政區(qū)為單位的攜帶情況以及分子流行病學(xué)調(diào)查。結(jié)果表明: 耳聾致病基因在北方的攜帶率高于南方;而地中海貧血南方高發(fā),北方低發(fā),這也符合之前的預(yù)期。除了我們原來認(rèn)為的兩廣(廣東和廣西)和海南之外,包括云南、貴州、湖南這幾個地方攜帶率也很高。還有一個跟乳腺癌相關(guān)的,剛才提到的BRCA1、BRCA2這兩個基因在東西方的頻率差異到底是什么樣子,以前誰也回答不了,而通過百萬數(shù)據(jù)就可以回答這個問題。
人的血液里面只有人的基因嗎?其實不是。通過下面這個數(shù)據(jù)可以看出,在人的血液里面還發(fā)現(xiàn)很多病原微生物的基因。
形象地來說,基因像一堆字母,隨便找一個字母T是什么意思?這個是不知道的。如果足夠幸運,另外一個人跟我的基因完全一樣,只有一個字母T變成了A,而剛好我是正常的,另外一個人則是鐮刀型細(xì)胞貧血的患者。我們可以講這個T到A其實就是由正常變成了鐮刀型細(xì)胞貧血的原因,但是實際情況遠(yuǎn)遠(yuǎn)比這個復(fù)雜。要通過大樣本、大數(shù)據(jù)的分析才能揭示真相,任何兩個人抓過來都有一堆不一樣的位點。
大家應(yīng)該還記得剛才講的眼盲小男孩凱文,兩千多個沒有報道過的變異怎么一步一步縮小變成一個致病基因上的一個位點呢?其實就是通過比對大量的正常人數(shù)據(jù)庫。正常人都有的變異其實跟疾病沒有關(guān)系,剩下的才是跟致病相關(guān)的。以前的千人基因組數(shù)據(jù),加上這個百萬NIFTY數(shù)據(jù)庫,組成了一個更大的正常人基因數(shù)據(jù)庫。