中國(guó)IDC圈5月19日?qǐng)?bào)道,生命科學(xué)的大數(shù)據(jù)還處在比較初始的階段,否則國(guó)家也不會(huì)現(xiàn)在才開(kāi)始提出精準(zhǔn)醫(yī)學(xué)這樣的概念。所謂精準(zhǔn)醫(yī)學(xué)想通過(guò)大數(shù)據(jù)模型準(zhǔn)確預(yù)測(cè)預(yù)防,個(gè)性化的給每個(gè)人提供健康解決方案的項(xiàng)目。
機(jī)能強(qiáng)大的人腦
作為生命科學(xué)來(lái)說(shuō)首先是要認(rèn)識(shí)自己,這是剛剛?cè)ナ赖募{什,諾貝爾獎(jiǎng)獲得者,這個(gè)圖片講的是他到五角大樓里面去幫五角大樓破解蘇聯(lián)密碼,結(jié)果他看著滿墻數(shù)字跳動(dòng)的時(shí)候很自然的圈定幾個(gè)數(shù)字,把蘇聯(lián)計(jì)劃進(jìn)入美國(guó)的經(jīng)緯度所謂的密碼數(shù)字圈了出來(lái),幫助五角大樓瓦解蘇聯(lián)的進(jìn)攻。
從這個(gè)例子我們應(yīng)該看到其實(shí)我們每個(gè)人的大腦都是非常強(qiáng)的大數(shù)據(jù)處理機(jī)器,接下去我大概講一下我們大腦為什么會(huì)這么強(qiáng),大腦的處理能力有多強(qiáng)。我們大腦只有140億個(gè)腦細(xì)胞,從出生到死亡基本是不會(huì)變的。為什么從出生到死亡我們的知識(shí)是不一樣的,就是因?yàn)槟X細(xì)胞會(huì)建立突出的連接,這個(gè)人越聰明突出的連接就越復(fù)雜。
二是大腦的能耗特別低,只有20瓦,大家在拼命思考的時(shí)候腦子會(huì)發(fā)熱,不會(huì)像CPU一樣熱的過(guò)高燒起來(lái)。
我們做一項(xiàng)對(duì)比,我們把大腦跟英特爾剛出的e7的CPU對(duì)比,這樣一個(gè)CPU大概有56億個(gè),能耗要105瓦,我們大腦在能耗上面跟CPU對(duì)比處理能力和能耗比,比現(xiàn)在的機(jī)器強(qiáng)很多。
從一生過(guò)程來(lái)看,人的一生大概能存儲(chǔ)100PB的存儲(chǔ)量,是美國(guó)600個(gè)國(guó)家圖書(shū)館的量,加起來(lái)是140PB,正常人是能存儲(chǔ)140個(gè)PB。這是什么概念?比如說(shuō)因特網(wǎng)上所有的音樂(lè)加起來(lái)就是10個(gè)P左右。大腦的集散能力也特別強(qiáng),一天能處理86G的信息,如果把處理能力換算成超算的計(jì)算速度,大腦的計(jì)算速度在3.5EFlops,現(xiàn)在超級(jí)計(jì)算機(jī)遠(yuǎn)遠(yuǎn)沒(méi)有達(dá)到。
現(xiàn)在最快的天河2號(hào)連續(xù)五年拿到了世界超算排名第一的計(jì)算機(jī)研究,可見(jiàn)大腦的計(jì)算能力相當(dāng)可以。另外一個(gè)例子,我們眼睛的分辨率大概是5.7千萬(wàn)像素,人的眼睛到這么高的分辨率,但人的大腦還能實(shí)時(shí)處理這些圖片,以每秒25幀的數(shù)據(jù)處理,大腦的數(shù)據(jù)能力是非常強(qiáng)的。
我們先認(rèn)識(shí)一下自己的大腦還是非常強(qiáng)大的,在某個(gè)專業(yè)領(lǐng)域跟計(jì)算機(jī)領(lǐng)域比還是有不足,但整體比較計(jì)算機(jī)是很難超越人的大腦的。
人體大數(shù)據(jù)
我們說(shuō)到大數(shù)據(jù)有兩層含義,有的大數(shù)據(jù)是數(shù)量上面的,有的大數(shù)據(jù)是數(shù)據(jù)大小上面。我們?cè)賮?lái)認(rèn)識(shí)一下我們自己身體其它部位的大數(shù)據(jù)的情況,人類的基因是30億個(gè)堿基,整個(gè)身體大概是100萬(wàn)億個(gè)細(xì)胞,同時(shí)在我們的腸道里有一千萬(wàn)億個(gè)細(xì)菌,腸道是我們的外環(huán)境,不要以為是我們的內(nèi)環(huán)境,我們的生活是內(nèi)外相互作用的結(jié)果。
如果把跟健康所有相關(guān)的數(shù)據(jù)匯總在一些,看看有哪些類型,要使遺傳信息有功能的話,把基因組信息翻譯成RA,再翻譯成蛋白 ,同時(shí)基因組還跟環(huán)境有一定的相互作用,這個(gè)相互作用是通過(guò)這里的表觀組學(xué)來(lái)實(shí)現(xiàn)的。我們體內(nèi)還有很多小分子,我們這里說(shuō)的叫Metabolome,Microbiome是我剛才提到的一千萬(wàn)億數(shù)量的細(xì)菌,這些遺傳因素跟我們的環(huán)境有相互關(guān)系。
同時(shí)現(xiàn)在可穿戴的設(shè)備特別流行,日常生活中的心電、血糖、心率都可以通過(guò)可穿戴設(shè)備記錄下來(lái),這也跟日常健康有很大的關(guān)系。跟神奇的是,大家不要以為社交網(wǎng)絡(luò)跟身體沒(méi)關(guān)系,其實(shí)社交網(wǎng)絡(luò)跟我們內(nèi)在基因也是有一定的關(guān)系的,但隨著研究的發(fā)展這種關(guān)系可能會(huì)越來(lái)越強(qiáng)。
環(huán)境對(duì)人的影響
接下去把每個(gè)類型展開(kāi),首先講環(huán)境,每個(gè)人的健康一出生50%健康的情況就已經(jīng)決定了,由你內(nèi)在遺傳的物質(zhì)決定,DNA決定了你接下去的生活是什么樣的情況,另外50%就是我們剛才說(shuō)的外在的環(huán)境,會(huì)對(duì)我們的健康生活產(chǎn)生一定的影響,這個(gè)占50%的樣子。
這個(gè)是表觀組學(xué),這個(gè)主要反應(yīng)了環(huán)境跟內(nèi)在DNA相互作用的情況。在我們?nèi)畠|的堿基里面只有2%的堿基是表達(dá)基因的,另外98%在科學(xué)里面叫做垃圾基因,不管是2%的基因還是98%的垃圾基因里面都有一些“短創(chuàng)”,這個(gè)短創(chuàng)對(duì)基因組的功能起到調(diào)控作用??茖W(xué)研究表明,在三十億堿基里面我們發(fā)現(xiàn)了28890個(gè),這個(gè)在有功能的2%的部分里大概有56%的基因功能是受它控制的。
要把基因組環(huán)境和人的關(guān)系建立起來(lái)的話,其實(shí)要在不同的環(huán)境里測(cè)表觀組的情況,一個(gè)人需要2個(gè)T的數(shù)據(jù)來(lái)存儲(chǔ)。