2007年,寶德科技協(xié)助華大基因繪制了全球第一張黃種人基因圖譜,引起全世界的關(guān)注;2008年,寶德再次投入熊貓基因項(xiàng)目的運(yùn)算和應(yīng)用,助力華大基因取得了又一創(chuàng)舉。近期,寶德與華大基因再次牽手,寶德高性能計(jì)算集群在天津華大基因科技有限公司成功應(yīng)用,助力華大基因在全球基因測(cè)序的競(jìng)技場(chǎng)上釋放越來(lái)越大的能量。此次合作,寶德HPC方案既為天津華大基因打造了高效的計(jì)算基礎(chǔ)平臺(tái),又為其信息安全提供了可靠的保障。
華大基因是基因組測(cè)序能力及生物信息分析能力位居亞洲第一、世界第三的基因組研究中心。天津華大基因科技有限公司于2011年4月順利落戶天津空港商務(wù)園,從事面向中國(guó)北方的包含但不限于生命健康(包括胎兒、心腦血管、腫瘤、老年病等基因檢測(cè)、診斷技術(shù)及干細(xì)胞、克隆技術(shù))、生物育種(包括抗干旱、耐寒、耐堿等農(nóng)作物育種)研發(fā)、運(yùn)營(yíng)業(yè)務(wù)。目前,天津華大基因成為華大基因在華北區(qū)乃至北方區(qū)的中心,且國(guó)家基因庫(kù)北方庫(kù)已于2012年6月在天津華大基因建設(shè)并投入使用。
為支撐天津華大基因各重大科研項(xiàng)目和各個(gè)產(chǎn)業(yè)體系的發(fā)展,天津華大基因信息生產(chǎn)中心不斷地在高性能計(jì)算領(lǐng)域內(nèi)開發(fā)可以解決生物信息產(chǎn)生的海量數(shù)據(jù)方面的硬件和分析軟件。本次寶德高性能計(jì)算集群支撐的在線生產(chǎn)系統(tǒng),正服務(wù)于國(guó)家基因庫(kù)北方庫(kù)。
就本套高性能計(jì)算集群而言,其主要目的在于解決大規(guī)模生物信息計(jì)算的處理問(wèn)題,計(jì)算能力毋容置疑是首要選擇指標(biāo);同時(shí),其存儲(chǔ)能力指標(biāo)同樣不容小覷,因?yàn)樵谟?jì)算開始時(shí),要從存儲(chǔ)系統(tǒng)中讀取數(shù)據(jù),計(jì)算結(jié)束時(shí),要向存儲(chǔ)系統(tǒng)中寫入計(jì)算后的結(jié)果,如果這之間的讀取和寫入速度不匹配,不僅會(huì)拖延高性能項(xiàng)目的完成周期,低延遲還會(huì)嚴(yán)重影響高性能創(chuàng)造價(jià)值的能力。
針對(duì)本次項(xiàng)目需求,寶德為天津華大基因提供了一套具有高性能、高容量、高可用、高可靠特點(diǎn)的高性能計(jì)算集群。該集群計(jì)算子系統(tǒng)采用64個(gè)高密度計(jì)算節(jié)點(diǎn)+2個(gè)PR4840R承擔(dān)前端計(jì)算節(jié)點(diǎn);網(wǎng)絡(luò)子系統(tǒng)采用高帶寬、低延時(shí)的56GB InfiniBand網(wǎng)絡(luò)做計(jì)算網(wǎng)絡(luò),千兆以太網(wǎng)做管理網(wǎng)絡(luò);后端采用600TB的Lustre并行文件系統(tǒng)做整個(gè)集群的統(tǒng)一存儲(chǔ),底層硬件基于高容量、高性能的高端磁盤陣列GS5316D。
本集群Lustre并行文件系統(tǒng)
寶德是國(guó)內(nèi)領(lǐng)先的云計(jì)算解決方案提供商,同時(shí)也是國(guó)內(nèi)HPC產(chǎn)品技術(shù)成熟度最高的廠商之一,在生物信息和生命科學(xué)計(jì)算領(lǐng)域,寶德HPC積累了大量的客戶和行業(yè)經(jīng)驗(yàn),此次與華大基因的又一次合作,再次有力的證明了寶德高性能計(jì)算集群在該領(lǐng)域的雄厚實(shí)力。