圖五:使用AVX指令集和不使用AVX指令集性能對(duì)比圖
從圖五可以看出,使用AVX2指令集進(jìn)行加速之后,NAMD、Gromacs和Lammps三個(gè)軟件的性能均有所上升,其中以Gromacs的提升最大,提升了1.6倍左右。
內(nèi)存使用情況
下圖是浪潮天眼測(cè)試的Gromacs運(yùn)行過(guò)程中的內(nèi)存使用情況,其單一節(jié)點(diǎn)的內(nèi)存使用在2GB左右,而運(yùn)行同一算例的NAMD的單節(jié)點(diǎn)內(nèi)存使用在4GB左右。
圖六:浪潮天眼測(cè)試的Gromacs內(nèi)存使用情況
考慮到大部分的分子動(dòng)力學(xué)研究的計(jì)算規(guī)模都是10萬(wàn)-100萬(wàn)原子數(shù)規(guī)模,因此可以看出分子動(dòng)力學(xué)模擬應(yīng)用對(duì)內(nèi)存容量的需求并不是很大。這也就是說(shuō),運(yùn)行這一類應(yīng)用時(shí),一般的雙路高性能服務(wù)器就可以滿足其對(duì)內(nèi)存的需求,并不需要使用胖節(jié)點(diǎn)。
內(nèi)存帶寬情況
下圖是浪潮天眼依次給出的Gromacs和NAMD兩個(gè)軟件在運(yùn)行時(shí)某一節(jié)點(diǎn)的內(nèi)存帶寬情況。可以看到,經(jīng)過(guò)前幾分鐘的調(diào)整之后,總內(nèi)存讀寫(xiě)帶寬(紅線)均維持在一個(gè)較為穩(wěn)定的值;其中Gromacs的值在13GB/s,NAMD的值在25GB/s左右。
圖七:浪潮天眼監(jiān)測(cè)的Gromacs內(nèi)存帶寬情況
圖八:浪潮天眼監(jiān)測(cè)的NAMD內(nèi)存帶寬情況
可以看出,在本測(cè)試算例中,兩程序運(yùn)行時(shí)對(duì)內(nèi)存帶寬的需求并不是特別大。但是,需要提到的是,內(nèi)存帶寬的大小是和算例規(guī)模有關(guān)系的,隨著算例規(guī)模的增大,原子數(shù)的增多,程序?qū)?nèi)存帶寬的需求會(huì)變大。
網(wǎng)絡(luò)通信情況
下面兩個(gè)圖依次是浪潮天眼測(cè)試的Gromacs和NAMD運(yùn)行時(shí)的網(wǎng)絡(luò)帶寬情況,其中重合的紅線和綠線分別對(duì)應(yīng)IB網(wǎng)絡(luò)的數(shù)據(jù)發(fā)送和數(shù)據(jù)接收。可以看出Gromacs運(yùn)行時(shí)的網(wǎng)絡(luò)通信帶寬在300MB/s左右,而NAMD運(yùn)行時(shí)的網(wǎng)絡(luò)通信帶寬則高達(dá)1000MB/s。
圖九:浪潮天眼測(cè)試的Gromacs網(wǎng)絡(luò)通信情況
圖十:浪潮天眼測(cè)試的NAMD網(wǎng)絡(luò)通信情況
除了網(wǎng)絡(luò)帶寬之外,從這兩個(gè)圖中我們也可以看出網(wǎng)絡(luò)通信是一個(gè)持續(xù)的數(shù)據(jù)流,這也就意味著網(wǎng)絡(luò)延遲(latency)也會(huì)對(duì)程序性能有較大影響,即低延遲的網(wǎng)絡(luò)會(huì)對(duì)程序的性能有較好的提升作用。這也就意味著,在網(wǎng)絡(luò)的選擇方面,高帶寬、低延遲的InfiniBand網(wǎng)絡(luò),是一個(gè)較好的選擇。
磁盤(pán)讀寫(xiě)
分子動(dòng)力學(xué)程序在運(yùn)行時(shí)只會(huì)輸出對(duì)應(yīng)的軌跡文件,而該文件的輸出也是程序每運(yùn)行幾百時(shí)間步時(shí)追加寫(xiě)入一次,因此其在運(yùn)行時(shí)對(duì)磁盤(pán)讀寫(xiě)并沒(méi)有什么特殊的需求。
分子動(dòng)力學(xué)模擬計(jì)算集群配置方案建議
通過(guò)以上比較我們可以發(fā)現(xiàn),即使是對(duì)于同樣大小的體系,Gromacs和NAMD對(duì)計(jì)算資源的需求也是不一樣的,NAMD需要相對(duì)更多的內(nèi)存、內(nèi)存帶寬以及網(wǎng)絡(luò)帶寬,而不同的體系大小,也會(huì)體現(xiàn)出對(duì)計(jì)算資源需求的差異。
根據(jù)這些分子動(dòng)力學(xué)模擬軟件的普遍特點(diǎn),我們也給出了如下的集群配置建議:(1)選擇核心數(shù)更多,AVX頻率更高的CPU,充分利用CPU的向量化浮點(diǎn)運(yùn)算能力;(2)合理的搭配內(nèi)存的數(shù)量和容量,雖然這些應(yīng)用對(duì)內(nèi)存容量的需求不高,但是有不小的內(nèi)存帶寬需求,因此建議單節(jié)點(diǎn)搭配不少于8條內(nèi)存來(lái)充分滿足應(yīng)用的內(nèi)存帶寬需求;(3)選擇高帶寬、低延遲的網(wǎng)絡(luò),當(dāng)前市面上主流的Infiniband和OPA網(wǎng)絡(luò)均是不錯(cuò)的選擇。
浪潮在分子動(dòng)力學(xué)模擬應(yīng)用的調(diào)優(yōu)優(yōu)化方面有豐富的經(jīng)驗(yàn),通過(guò)浪潮天眼可以更全面、更精細(xì)的分析軟件的運(yùn)行特征,提供軟硬一體化的全方位優(yōu)化方案,目前浪潮在該領(lǐng)域的應(yīng)用方案已經(jīng)廣泛的應(yīng)用在了各高校和科研院所的相應(yīng)領(lǐng)域的科學(xué)研究中。