基于集群的高性能計算技術(shù)在過去的二十年中將傳統(tǒng)的單機(jī)高性能計算趕下了神壇,其性能在二十年間也提升了成千上萬倍。根據(jù)預(yù)測,2018年到2020年之間,峰值性能為E(Exascale,相當(dāng)于1000PB)級的高性能計算產(chǎn)品將會問世,相當(dāng)于天河二號系統(tǒng)的33倍。目前,天河二號的峰值性能大約是33.83PFlops,在最新的全球高性能計算榜單上的峰值計算性能排名第一。但是,隨著高性能計算系統(tǒng)的性能不斷提升,系統(tǒng)規(guī)模也在不斷擴(kuò)大,相應(yīng)的技術(shù)難點(diǎn)和瓶頸也發(fā)生了變化。北京大學(xué)信息學(xué)院計算機(jī)系副系主任陳一峯表示,系統(tǒng)可擴(kuò)展性和可靠性問題將是E級高性能計算系統(tǒng)上所關(guān)注的幾個核心問題之一。
高性能計算現(xiàn)在是百家爭鳴時代
陳一峯表示,目前的高性能計算仍舊處于高速發(fā)展期,是百家爭鳴的時代。“這串行計算領(lǐng)域,業(yè)界很容易就達(dá)成了共識,理論體系也相對固定?!彼f,“但高性能計算目前是應(yīng)用并行計算體系,而并行計算體系當(dāng)中就有多種不同的流派,象征計算機(jī)學(xué)科里面最高榮譽(yù)的圖靈獎就曾頒發(fā)給好幾個涉及到并行計算領(lǐng)域的項目。也就是說,現(xiàn)在在學(xué)界也沒有在并行計算領(lǐng)域形成共識,這就導(dǎo)致現(xiàn)在出來的硬件也是多種多樣,編程工具和語言也同樣是多種多樣。舉例,在眾核方面,就有大小核之分;在存儲上,有多層次的存儲級別之分;這都意味著高性能計算今后會越來越復(fù)雜?!?/P>
北京大學(xué)信息學(xué)院計算機(jī)系副系主任陳一峯
顯然,百家爭鳴意味著不同的技術(shù)路線,也意味著更多選擇,但陳一峯首先強(qiáng)調(diào),高性能計算的體系結(jié)構(gòu)最終還是需要通用?!案咝阅苡嬎愕耐度胩貏e大,這需要衡量好社會效率和經(jīng)濟(jì)效益。英特爾不僅會聽取我們的意見,也會聽取很多其他用戶的意見,從而以最好的工程實(shí)現(xiàn)來造出符合大部分人需求的高性能芯片,實(shí)現(xiàn)社會效益的最大化。因此,這就要求我們把現(xiàn)有的機(jī)器理解透徹,竭力用好?!彼f,“這也意味著應(yīng)用需要根據(jù)硬件的發(fā)展步驟進(jìn)行必要的調(diào)整?!?/P>
以“有限元”運(yùn)算為例,這是將本來規(guī)則化的東西變成不規(guī)則了,其目的是減少計算量。但是,在新的并行體系結(jié)構(gòu)下,把規(guī)則的變成不規(guī)則的會有額外的代價,很可能會導(dǎo)致從數(shù)學(xué)上看的計算量在減小,但實(shí)際映射到機(jī)器當(dāng)中進(jìn)行運(yùn)算要比原來慢很多。因此,在高性能計算的體系結(jié)構(gòu)發(fā)生變化以后,這意味著計算的假設(shè)已經(jīng)發(fā)生了變化,這就需要學(xué)科在新的假設(shè)下研究數(shù)學(xué)方法。
再回到最開始的E級高性能計算機(jī),當(dāng)系統(tǒng)規(guī)模擴(kuò)大之后,如何讓應(yīng)用匹配如此大規(guī)模的集群架構(gòu),讓性能保持相應(yīng)增長,這是業(yè)界最關(guān)心的核心問題之一。換言之,需要研究應(yīng)用哪些不同的方法,使得在擴(kuò)大了系統(tǒng)規(guī)模之后仍舊能夠高效利用系統(tǒng)的資源。其次,當(dāng)系統(tǒng)規(guī)模擴(kuò)大之后,也很可能會開發(fā)出新的計算方法和模式來提高整體系統(tǒng)的穩(wěn)定性。
高性能計算軟硬發(fā)展依舊不同步
相對高性能計算在硬件方面的飛速發(fā)展,高性能計算在軟件編程和人才培養(yǎng)方面就顯得有些滯后了。陳一峯表示,軟件發(fā)展跟不是硬件發(fā)展確實(shí)是一大挑戰(zhàn),但這并不是軟件技術(shù)開發(fā)或者編程經(jīng)驗(yàn)進(jìn)展慢,而是硬件發(fā)展太快——在硬件方面,現(xiàn)在是幾個月推出一個新產(chǎn)品,而且其特點(diǎn)也不斷更新,會有不同的模型、不同的架構(gòu)、不同的產(chǎn)品鏈,做計算機(jī)的都需要有一段時間來理解和消化,才能將其用好,傳遞到最終用戶的應(yīng)用端,需要的時間可能會會更長。
英特爾中國公司軟件與服務(wù)集團(tuán)客戶響應(yīng)團(tuán)隊經(jīng)理喬楠
英特爾中國公司軟件與服務(wù)集團(tuán)客戶響應(yīng)團(tuán)隊經(jīng)理喬楠表示,高性能計算服務(wù)器集群當(dāng)中所應(yīng)用的處理器從單核發(fā)展到雙核、四核到多核,甚至到現(xiàn)在的眾核,一方面是核數(shù)在增加,另一方面是每一個核的復(fù)雜度在提升,跟內(nèi)存打交道的部件也在變得越來越復(fù)雜。英特爾也在盡可能彌補(bǔ)硬件發(fā)展過快導(dǎo)致的軟件問題。首先,是在人才培養(yǎng)方面投入資源。英特爾的大學(xué)合作部組織了很多多核培訓(xùn),面向大學(xué)教師提供多核的基本培訓(xùn)內(nèi)容和材料,用于相應(yīng)的課程教學(xué)中;同時,英特爾也提供了一些專才培養(yǎng)課程,例如商業(yè)領(lǐng)域中的地震資料處理、DCC動漫渲染等。其次,英特爾提供了很多工具來幫助開發(fā)者降低開發(fā)成本,提升開發(fā)效率。這些工具包括VTune、Thread Profiler等多線程的工具、多進(jìn)程的工具,集群工具等等,這些在MIC上的工具和在CPU上的工具是統(tǒng)一的,這可以打通所有的環(huán)節(jié)。再次,英特爾會從硬件的角度盡可能讓它們?nèi)ト诤?,?shí)現(xiàn)指令集完全兼容,從編譯器的角度把指令集的不同給屏蔽掉,應(yīng)用本身來捕捉硬件平臺的不同來自動適應(yīng),這方面也在不斷發(fā)展。最后,有賴于各方努力,共同呼吁來組織活動來培養(yǎng)人才。