美國封鎖對華超級計算機關鍵技術出口的消息,讓超算這個詞匯又成了媒體關注的焦點。
雖然國產(chǎn)超算“天河2號”已經(jīng)數(shù)度奪得全球性能冠軍,但是為之自豪的網(wǎng)民還很少對“超級計算機”這個概念有比較深入的了解。本文將先為大家介紹超級計算機相關的背景知識,而續(xù)篇則會探討美國技術封鎖政策對我國超算發(fā)展的影響。
什么是超算?
超級計算機,又稱高性能計算,英文名High Performance Computing,簡稱超算/HPC。HPC是為了解決工業(yè)界對大規(guī)模計算能力的需求而誕生的技術,現(xiàn)代超算本質上是將大量配置接近普通家用電腦/商用工作站的主機通過高速網(wǎng)絡連接起來的主機集群。它運行的是專用操作系統(tǒng),每臺主機是一個運算節(jié)點;大量節(jié)點的運算能力疊加起來,就獲得了遠超單臺或幾臺普通PC的計算能力。
超算的技術特點
經(jīng)常在超算相關的新聞下面看到這樣的評論:“這么強,跑xxx游戲卡不卡?”普通消費者對“運算速度”的概念通常就是玩一些大型游戲有多少幀率、畫面細節(jié)能達到什么檔次。有趣的是,超算執(zhí)行的任務與3D游戲有不少相似之處。
計算機世界中,“計算”可以分為整數(shù)和浮點計算兩大類。8X4是整數(shù)運算,而1.5912/0.4就是浮點計算。我們常見的大多數(shù)程序都是以整數(shù)計算為主,輔之以少量浮點部分;但3D游戲、圖像渲染、視頻特效這類工作則會大量應用浮點代碼。
在科學和工程領域常見的計算任務都是偏浮點化的:典型如大氣模擬、材料應力計算、蛋白質分子模擬、地質模型分析等。這些領域中整數(shù)運算所占的比例較小,與我們常見的PC程序有較大差異。
浮點運算任務的一大特點是很容易高度并行化。簡單來說就是一段計算可以拆分給許許多多的計算核心來完成,不像整數(shù)計算那樣很多時候只能分給少量幾個核心。另外,密集浮點程序可以大量使用高級浮點指令—例如AVX、FMA等來明顯提升運算速度。相比之下一般消費者使用的程序往往只能用到老舊的SSE、SSE2,不太容易從新指令中獲得加速效果。
因為上述特點,高性能計算領域的應用可以很容易地從CPU的浮點運算能力改進中得益。下圖是Intel幾代Xeon CPU的理論浮點性能對比,可以看出受益于高級指令的增加,每代新品的性能都提升1倍以上;我們普通消費者很難感受到這么大幅度的進步,但科學和工程計算程序就獲益匪淺。
偏重浮點性能、可以大規(guī)模并行化的特點使科學計算應用很適合跑在GPU上。GPU可以看作是有很多小核心的一種CPU,犧牲整數(shù)性能和單核心性能換來整塊芯片超強的浮點性能。CPU和GPU聯(lián)合執(zhí)行科學計算的方式被稱為異構計算,最近幾年異構計算開始逐漸在業(yè)界推廣。
除了執(zhí)行運算的CPU、GPU核心,超算的另外兩大關鍵技術是內(nèi)存和互聯(lián)網(wǎng)絡。高性能計算任務通常需要大量的內(nèi)存,而且所需的空間隨計算核心數(shù)量的增多而增加;此外,這些內(nèi)存還要有很高的帶寬來迅速將數(shù)據(jù)傳遞給處理器核心。互聯(lián)網(wǎng)絡則是將成千上萬的主機搭建成超算系統(tǒng)的關鍵,主機數(shù)量越多,對網(wǎng)絡的帶寬、延遲和穩(wěn)定性要求就越高。
超算技術發(fā)展現(xiàn)狀
從前面的介紹我們可以知道,超算需要的是浮點性能很強、內(nèi)存帶寬和容量很高的計算芯片,以及高性能的大規(guī)?;ヂ?lián)網(wǎng)絡。高性能芯片的技術被四大巨頭壟斷:Intel、IBM、Nvidia和AMD。其中,Intel和IBM一方面生產(chǎn)CPU,另一方面研制出了類似GPU的超多核心芯片。例如Intel的新一代Xeon Phi處理器就是將數(shù)十顆特別加強了浮點性能的Atom核心集成到一起,配上帶寬達到數(shù)百GB/s的3D封裝內(nèi)存制造而成的。一顆新版Xeon Phi的性能達到每秒2萬億次浮點運算,相當于最快的Xeon CPU的3倍。Nvidia和AMD則在自家GPU的基礎上生產(chǎn)專用計算卡Tesla和FirePro,其浮點性能也達到2-3萬億次每秒的水平。
由于制造技術與成本的限制,Tesla和Xeon Phi這樣的芯片的內(nèi)存不能做到很大容量,無法執(zhí)行那些需要龐大內(nèi)存空間的代碼,這也限制了這類芯片的普及率。但由于這些芯片的性能相比一般CPU有明顯優(yōu)勢,且?guī)状笃髽I(yè)都在努力解決內(nèi)存空間的問題,未來它們會是業(yè)界的主流選擇。Intel希望自己的Xeon Phi在未來能一統(tǒng)天下;Nvidia與IBM合作,將推出Power CPU+Tesla 計算卡的異構解決方案;AMD則力推自家的HSA異構方案,希望Opteron CPU+FirePro計算卡的組合能占據(jù)一席之地。目前來看Intel的優(yōu)勢比較大,而Nvidia/IBM的聯(lián)盟也能拿下一定的份額。
互聯(lián)網(wǎng)絡方面的技術不像計算芯片那樣高度壟斷。目前有不少企業(yè)都在提供超算網(wǎng)絡解決方案,我國在這方面也具備世界一流水平。最先進的超算網(wǎng)絡可以讓數(shù)萬計算節(jié)點以高達100Gbps的帶寬通信,同時保證穩(wěn)定性和低延時。
超算對國家的意義
一如前文所述,超算技術主要是服務工業(yè)和科學研究的。強大的計算能力對企業(yè)、學校和國防研究都有很大的幫助,甚至可以說是不可或缺的。當年美國宣布終止核試驗,其底氣就是超算模擬核試驗技術已經(jīng)足夠成熟。由于投入巨大、回報周期較長,各國的超算項目主要由政府實施或資助。如今,超算技術和資源水平已經(jīng)成為一國科研實力的重要指標之一。
中國的超算技術近年來發(fā)展迅速,曙光、天河前后多次登上全球超算性能排行榜冠軍。如今美國宣布對華超算技術禁運,無疑是感到了中國在這一領域的威脅。那么美國的禁運政策將對中國有什么影響呢?請看下一篇文章的具體分析。