聯(lián)想之所以能夠在南京大學HPC競標中力壓群芳,一是靠聯(lián)想在高教HPC領(lǐng)域常年的經(jīng)驗積累,以及提供個性化服務的精神;二是提供了包括計算、網(wǎng)絡(luò)、存儲和軟硬件一體的,經(jīng)過兼容性測試的完整系統(tǒng)——對于人力、物力相對缺乏的高校來說,這是最重要的選擇指標之一。
而從技術(shù)方面來說,這套系統(tǒng)通過部署65套聯(lián)想Flex機箱,可以確保系統(tǒng)總體計算能力的峰值達到每秒860.16萬億次,運算效率超過76% (理論最高值為81%),其次,在Infiniband交換機部分,系統(tǒng)通過兩臺配置了612個接口的交換機,實現(xiàn)計算和存儲的全線速交換。
最重要的一點是,此套系統(tǒng)采用了聯(lián)想全SSD分布式并行存儲和穩(wěn)定可靠高性能的GPFS并行文件系統(tǒng),可滿足PB級海量數(shù)據(jù)文件的匯存需要,本系統(tǒng)使用的GPFS保持著實際測試中帶寬可達208GB/s的速度,該設(shè)計可以滿足隨需擴展的容量需求,支持存儲帶寬隨容量線性擴展。此外,基于互聯(lián)網(wǎng)的7*24小時HPC在線運維服務系統(tǒng)也將極大提高系統(tǒng)平臺的運營管理效率。
“南”字輩的另一家學校南方科技大學,雖然是一所成立于2011年的年輕院校,但一開始就以國際領(lǐng)先的創(chuàng)新研究型大學為發(fā)展目標,該校物理研究領(lǐng)域涵蓋了新能源物理,新型功能材料,以及與之相關(guān)的凝聚態(tài)物理等前沿理論,研究領(lǐng)域涵蓋不同維度下的半導體、金屬、絕緣體等多種材料,以及對新材料的設(shè)計和預測等學界前沿地帶。
所以,這家眼界開闊、思維前沿的“改革試驗田”對HPC平臺的要求也是同樣的前瞻和嚴苛,南科大為“搭建一套全新的、符合平衡設(shè)計的高性能材料分析模擬平臺”而發(fā)布的招標書中明確提出:高性能材料分析模擬平臺需要提供強大的計算能力,具備高度的智能管理能力,以及高速/高吞吐量/低延遲的交互網(wǎng)絡(luò),并且可進行靈活高效的任務調(diào)度和快速部署擴展——每一項都是高標準嚴要求。
基于對高教HPC領(lǐng)域的重視,聯(lián)想能夠迅速集結(jié)起一支由Lenovo System x高級專家和HPC系統(tǒng)優(yōu)化高級工程師組成的專家隊伍,在經(jīng)過數(shù)月的溝通討論之后,“一套共有153個節(jié)點的Leovo System x HPC綜合解決方案最終浮出水面”。
就技術(shù)方面來講,聯(lián)想充分利用了Lenovo System x HPC軟件包支持自動并行化、線程并行(OpenMP)、進程并行(MPI)以及混合模式等多種并行技術(shù)的先進功能,通過單點管理,管理命令和界面使得日常集群管理工作量與單一映像系統(tǒng)相當。
就管理方面來說,聯(lián)想為了讓平臺具備更靈活高效的調(diào)度能力,借助專業(yè)作業(yè)調(diào)度軟件,可將不同作業(yè)分配到不同節(jié)點上,保證多個作業(yè)同時提交時的高效有序運行,完整的管理系統(tǒng)保證所有不同類型節(jié)點都可被充分運用。根據(jù)方案設(shè)定,這150多個節(jié)點具有數(shù)年平均無故障時間的高穩(wěn)定性設(shè)計,特別適合南科大物理系在計算材料物理時的高可靠性要求。
作為國內(nèi)計算材料物理的先行者,南科大高性能材料分析模擬平臺的效率將直接關(guān)系到我國計算材料物理領(lǐng)域的發(fā)展速度和水平,南方科技大學的嚴苛要求與聯(lián)想的認真對待,著實是一點也不過分。
南京大學是896個計算節(jié)點,南方科技大學則是153個計算節(jié)點,聯(lián)想為北京大學搭建的Lenovo Intelligent Cluster高性能計算系統(tǒng),則擁有個976顆英特爾至強E5-2670 V2和48顆英特爾Xeon Phi 5110P處理器、8顆NVDIA K20協(xié)處理器,就高教HPC領(lǐng)域來說,這三套系統(tǒng)都是規(guī)模相對比較大的HPC平臺,但必須要指出的是,在高教HPC領(lǐng)域,普遍的情況是低于100左右的節(jié)點,甚至是低于50個節(jié)點左右的HPC集群,而對那些將目標矛頭指向互聯(lián)網(wǎng)巨鱷的HPC供應商來說,這部分業(yè)務在很大程度上交給了部分國內(nèi)HPC領(lǐng)域的中小型服務商。
但對教育科研任務來說,每一次計算、每一個結(jié)果、每一個HPC集群,無論大小都有成為一次學科研究爆發(fā)點的潛力。因此,就規(guī)模相對較小、范圍更加廣泛但學科研究價值一點不比前述HPC集群低的諸多高校HPC集群需求來說,仍然需要有技術(shù)更好、服務更專業(yè)、產(chǎn)品更優(yōu)秀的供應商參與進來。這就是聯(lián)想作為“中國HPC領(lǐng)域‘托底’單位”最大的價值。
校企合作 無論大?。耗贸鲋袊鳫PC的“底氣”
無論是北京大學、南京大學,還是南方科技大學,總體來說有幾個共性:第一,都處于相對發(fā)達的經(jīng)濟地區(qū),經(jīng)濟水平較好、高??蒲匈Y金較為充足、學校高尖端人才儲備非常豐富;第二,這些學?;蚴窃诟咝阅苡嬎泐I(lǐng)域有著短則十幾年年、長則三十多年的HPC構(gòu)建經(jīng)驗,要么是吸引了國內(nèi)外頂尖學科帶頭人的頂尖院校——與此不同,在更為廣闊的國內(nèi)高教HPC領(lǐng)域,同樣存在著發(fā)展不均衡的現(xiàn)象。