——浪潮高性能“天、地、人”系列案例(一)
【導(dǎo)語(yǔ)】天氣預(yù)報(bào)對(duì)高性能計(jì)算的需求十分巨大,越精準(zhǔn)的天氣預(yù)報(bào)需要計(jì)算性能更強(qiáng)大的超級(jí)計(jì)算機(jī)。近日,浪潮構(gòu)建的超級(jí)計(jì)算機(jī)為南京大學(xué)大氣科學(xué)學(xué)院的應(yīng)用研究帶來(lái)了數(shù)倍的性能提升,大大提升了南京大學(xué)大氣科學(xué)學(xué)院對(duì)氣象預(yù)報(bào)模式的研究和監(jiān)測(cè)效率。
在全球氣候變暖的背景下,強(qiáng)暴雨、強(qiáng)對(duì)流、高溫、干旱等極端的天氣氣候事件正在呈現(xiàn)增多的趨勢(shì),迫使人們不得不重視極端天氣氣候事件的預(yù)報(bào)、預(yù)測(cè)和災(zāi)害的防御。這種變化給大氣研究帶來(lái)了新的挑戰(zhàn),需要更高的科技水平和科技手段來(lái)提高對(duì)災(zāi)害天氣的監(jiān)測(cè)和預(yù)警能力。
在極端天氣氣候事件的研究中,預(yù)測(cè)無(wú)疑是非常關(guān)鍵環(huán)節(jié),以龍卷風(fēng)為例,如能對(duì)龍卷風(fēng)的產(chǎn)生地點(diǎn)、走向、持續(xù)時(shí)間以及影響范圍等做出準(zhǔn)確預(yù)測(cè),就能提前做好避險(xiǎn)、遷移等工作,將人員和財(cái)產(chǎn)損失降到最低。目前,美國(guó)已經(jīng)可以做到提前13分鐘到15分鐘來(lái)發(fā)布龍卷風(fēng)的預(yù)警,這也成為美國(guó)氣象現(xiàn)代化的標(biāo)志。
1比16,天氣預(yù)測(cè)精度和超算性能之間的博弈
一般來(lái)說(shuō),天氣預(yù)報(bào)的準(zhǔn)確度依賴于氣象數(shù)值模式的分辨率。分辨率的數(shù)值是指該模式能預(yù)測(cè)多少范圍內(nèi)的天氣變化,分辨率的數(shù)字越小表示能預(yù)測(cè)的范圍越精細(xì),越能為突發(fā)天氣災(zāi)害、百姓日常出行提供準(zhǔn)確的天氣依據(jù)。南京大學(xué)大氣科學(xué)學(xué)院近日承擔(dān)了多項(xiàng)科技部973項(xiàng)目、國(guó)家基金委重點(diǎn)研究項(xiàng)目,其中一項(xiàng)就是中尺度災(zāi)害性天氣機(jī)理研究和數(shù)值預(yù)報(bào)的高時(shí)空分辨率數(shù)值模擬,以及支撐全國(guó)3km高分辨率的實(shí)時(shí)數(shù)值預(yù)報(bào)研究系統(tǒng),這種分辨率水平在國(guó)際中處于領(lǐng)先地位。
南京大學(xué)大氣科學(xué)學(xué)院是我國(guó)最早建立的氣象學(xué)系,在中尺度天氣、邊界層氣象、大氣環(huán)流與季風(fēng)、短期氣候變率與預(yù)測(cè)等領(lǐng)域取得了具有國(guó)際影響和富有特色的研究成果,多次獲得省部級(jí)科技獎(jiǎng)和國(guó)家科技進(jìn)步獎(jiǎng)。
南京大學(xué)大氣科學(xué)學(xué)院的專家介紹,“國(guó)內(nèi)大部分氣候模式的分辨率都在1-3KM左右,國(guó)外如美國(guó)已經(jīng)能開(kāi)展500米甚至200米的精度的預(yù)測(cè),要趕上歐美國(guó)家的水平需要強(qiáng)大的超級(jí)計(jì)算機(jī)支撐。然而,天氣預(yù)報(bào)對(duì)計(jì)算性能需求巨大,分辨率越高越需要計(jì)算性能強(qiáng)大的超級(jí)計(jì)算機(jī)。理論上來(lái)說(shuō),預(yù)報(bào)精度提高1倍,其所需計(jì)算量將提高16倍?!?/P>
軟、硬“兩儀”,浪潮高性能方案化解計(jì)算挑戰(zhàn)
一元生兩儀是對(duì)中國(guó)智慧的高度總結(jié)。針對(duì)南京大學(xué)大氣科學(xué)學(xué)院的需求,浪潮的解決方案頗有點(diǎn)“一元生兩儀”的意味,所謂一元指浪潮方案的一體化,所謂兩儀分別指浪潮一體化方案中的硬件方案和軟件方案。
在南京大學(xué)大氣科學(xué)學(xué)院的氣象研究模式中,基本采用WRF、ARP等模式。這些模式對(duì)計(jì)算性能的需求非常大,并且運(yùn)行這些軟件時(shí),各個(gè)CPU之間的通訊量也很大。同時(shí),由于涉及大量的用戶和大量的小文件讀寫(xiě),氣象模式基本都對(duì)整個(gè)系統(tǒng)的IOPS性能都有較高要求。
在軟件的應(yīng)用層面,浪潮高性能一貫提倡深度挖掘行業(yè)應(yīng)用,不僅擁有一支高性能專業(yè)應(yīng)用研究團(tuán)隊(duì),同時(shí)還不斷收集、積累各行業(yè)應(yīng)用軟件,并進(jìn)行深入測(cè)試、分析、整理,形成自己一套高性能應(yīng)用特點(diǎn)剖析方法論。在南京大學(xué)大氣科學(xué)學(xué)院的項(xiàng)目中,浪潮專業(yè)應(yīng)用團(tuán)隊(duì)對(duì)用戶的需求進(jìn)行了該方法論中的“單元測(cè)試”和“基準(zhǔn)測(cè)試”,對(duì)用戶的應(yīng)用需求進(jìn)行了充分、完整的評(píng)估,然后根據(jù)評(píng)估出的數(shù)據(jù)為用戶量身定做了硬件層面的系統(tǒng)構(gòu)建方案。
浪潮針對(duì)WRF應(yīng)用做的評(píng)估測(cè)試
在硬件層面,浪潮根據(jù)氣象行業(yè)的應(yīng)用特點(diǎn),為南京大學(xué)大氣科學(xué)學(xué)院設(shè)計(jì)構(gòu)建的超級(jí)計(jì)算機(jī)采用浪潮NF5280M3作計(jì)算節(jié)點(diǎn),并配合光纖存儲(chǔ)系統(tǒng)浪潮AS500E,實(shí)現(xiàn)了所有節(jié)點(diǎn)全線速、無(wú)阻塞高速互聯(lián),整系統(tǒng)的Linpack實(shí)測(cè)效率達(dá)到92%以上。此外,在高帶寬、大容量外,存儲(chǔ)的數(shù)據(jù)安全性越來(lái)越成為現(xiàn)在集群建設(shè)的一大難點(diǎn),為此浪潮部署了一套并行文件系統(tǒng),實(shí)現(xiàn)多節(jié)點(diǎn)的高可用,通過(guò)8Gb光纖網(wǎng)絡(luò)映射到后端存儲(chǔ),保證單個(gè)節(jié)點(diǎn)宕機(jī)不影響系統(tǒng)正常讀寫(xiě)到磁盤陣列。同時(shí),考慮到氣象領(lǐng)域?qū)Υ鎯?chǔ)空間的需求,浪潮還為該集群配置了超800T裸容量的光纖存儲(chǔ)系統(tǒng),可以充分滿足大氣科學(xué)院近三年存儲(chǔ)需求。