3. 首次實(shí)現(xiàn)Krylov子空間算法的MIC加速
由于系統(tǒng)開采用了一種Krylov子空間算法,大量的全局集合通信不可避免,使得算法的天然并行性不是十分良好,這是由算法自身決定的。在不改變算法本質(zhì)思想的前提下,對(duì)算法結(jié)構(gòu)做了調(diào)整,并成功隱藏了集合通信時(shí)間。首次將此算法成功移植到CPU+MIC異構(gòu)集群平臺(tái)上。
超大規(guī)模線性方程組高性能求解系統(tǒng)開發(fā)完成后,太原理工大學(xué)工程數(shù)值計(jì)算團(tuán)隊(duì)在 “局部徑向基函數(shù)配點(diǎn)法(Local RBSs colloction methods)求解高維偏微分方程”課題中使用該軟件,僅利用3個(gè)計(jì)算節(jié)點(diǎn)(每個(gè)節(jié)點(diǎn)內(nèi)配置2*Intel Xeon E5-2650 v2+2*Intel Xeon Phi 7120P),在20秒之內(nèi)完成了7維問題線性方程組的求解,4分鐘之內(nèi)完成了8維問題線性方程組(億階規(guī)模)的求解,而原有的求解工具最多只能完成6維問題的求解。這一突破大大加速了太原理工大學(xué)工程數(shù)值計(jì)算團(tuán)隊(duì)對(duì)更高維度未知世界探索的腳步。
據(jù)了解,國內(nèi)在大規(guī)模線型方程組高性能求解系統(tǒng)的開發(fā)中一般求解規(guī)模在百萬階量級(jí),對(duì)于億階規(guī)模矩陣的求解鮮有嘗試。同時(shí),國內(nèi)外目前在大規(guī)模線型方程組高性能求解系統(tǒng)中一般采用的是CPU+GPU異構(gòu)架構(gòu),本次浪潮是將大規(guī)模線型方程組算法首次成功移植到CPU+MIC異構(gòu)集群平臺(tái)上。