“隨著科技的進步,問題的處理規(guī)模逐漸增大且精度要求日益提高。受計算能力所限,超大規(guī)模線性方程組的求解往往成為工程數(shù)值計算過程中的一大瓶頸。浪潮高性能計算應用研發(fā)團隊基于CPU+MIC異構平臺開發(fā)的超大規(guī)模線性方程組高性能求解系統(tǒng),可在短短幾分鐘內(nèi)完成億階規(guī)模矩陣的求解,這一成果對科學研究、工程應用以及自主可控國產(chǎn)CAE軟件的開發(fā)都有重要意義!” 對于與浪潮聯(lián)合開發(fā)的億階線性方程組MIC加速方案,太原理工大學博士生導師,中國計算數(shù)學學會常務理事、副秘書長李明給出了上述評價。
“毫不夸張的講,大部分科學與工程問題都要歸結為一個線性方程組的求解問題。”李明教授一開頭說道。他介紹說,線性方程組的求解問題是一個十分古老的問題,早在中國古代數(shù)學專著《九章算術》第八章就詳細記載了一次線性方程組的求解方法。時隔數(shù)千年的今天,線性方程組求解仍是眾多科學與工程領域重點研究的課題之一。
超大規(guī)模線性方程組求解難
實際上,數(shù)學物理模型的求解是眾多工程生產(chǎn)與科研領域必不可少的工作之一,如機械制造、材料加工、航空航天、汽車、土木建筑、國防軍工、船舶、鐵道、石化、能源、科學研究等??焖?、精確地求解線性方程組可以很大程度地提高生產(chǎn)、研究效率。經(jīng)過半個多世紀眾多專家的不斷探索,目前有關的方法和理論已相對比較成熟,產(chǎn)生了一批比較漂亮實用的算法。然而,隨著科技的進步,所求解問題規(guī)模的增大,模型結構越來越復雜且對計算精度的要求日益提高,這也使得線性方程組的規(guī)模急劇增加。
近幾年,隨著計算機集群系統(tǒng)的發(fā)展,處理核心數(shù)量的急劇增加,計算能力的大大提高,使超大規(guī)模線性方程組的求解重現(xiàn)希望。國內(nèi)高性能計算發(fā)展雖然勢頭兇猛,然而,不可否認的是高性能軟件及應用方面仍有很大的提升空間。成熟的超大規(guī)模線性方程組的高性能求解工具更是鳳毛麟角。
正是由于此類工具非常重要且稀缺,不得不將大量的數(shù)據(jù)與信息提供到國外有償計算。且不論高昂的花費,大量的數(shù)據(jù)信息掌握在外人的手里,對企業(yè)和科研機構存在著很大的信息安全隱患,甚至危害國家的安全。因此,開發(fā)自主可控的高性能計算軟件意義重大!
新方法結合新技術突破億階
浪潮作為國內(nèi)高性能計算產(chǎn)品和技術領先廠商,在MIC技術研究與應用開發(fā)方面,一直處于國內(nèi)領先的地位。浪潮高性能計算應用開發(fā)團隊與太原理工大學密切配合,基于CPU+MIC異構計算平臺,成功完成了億階以上超大規(guī)模線性方程組高性能求解系統(tǒng),并在實際用例的測試中出色完成求解任務。
整個開發(fā)工作,工程師們經(jīng)歷了目標制定、算法篩選與調(diào)整、串行設計、MPI并行設計、MIC移植及優(yōu)化等一系列的考驗,特別是算法的選取于優(yōu)化更是整個開發(fā)工作的重中之重。一般來說,求解線性方程組的傳統(tǒng)算法有直接法和迭代算法,浪潮工程師在經(jīng)過對矩陣特性的分析并參閱了大量材料后,從眾多的算法中挑選出最適合的一種Krylov子空間算法。但是Krylov子空間算法的一大特點就是不具有良好的天然可并行性,大量的MPI集合通信容易造成擴展瓶頸,而關于如何解決Krylov子空間方法集合通信量大的有效資料少之又少。在這樣的困局下,浪潮工程師們密切跟蹤相關研究的最新進展并根據(jù)自己的認識對標準的算法結構作了一定的調(diào)整,最后采用通信與計算相互隱藏的異步運作模式成功將大部分的進程集合通信隱藏,從而克服的研發(fā)道路上最大的一塊絆腳石。
超大規(guī)模線性方程組高性能求解系統(tǒng)具有以下三大特色:
1. 適用范圍廣
高性能求解系統(tǒng)采用了被July稱為二十世紀最偉大10大算法之一的Krylov子空間算法,也是少數(shù)幾個適用于超大規(guī)模線性方程組求解的算法之一。這決定了高性能求解系統(tǒng)不僅可求解經(jīng)有限元方法推導出的剛度矩陣對稱正定(SPD)的線性方程組,同時也可求解系數(shù)矩陣非對稱的線性方程組。因此,無論對于科研還是實際應用中系數(shù)矩陣正定的線性方程組原則上都可求解,且對于矩陣結構無特殊要求。
2. 計算效能出色
高性能求解系統(tǒng)基于MPI+OpenMP+MIC架構開發(fā)的。整個系統(tǒng)對硬件資源的利用效率很高,達到了70%以上,充分利用了CPU的邏輯、控制能力以及MIC眾核處理設備強大的計算能力。