天河一號(hào)A根植于2009年獲得TOP100冠軍的天河一號(hào),也是天河一號(hào)的改進(jìn)版本。天河一號(hào)A具備了14336顆Intel Xeon X5670 2.93GHz六核心處理器;7168塊NVIDIA Tesla M2050高性能計(jì)算加速卡;互聯(lián)網(wǎng)絡(luò)從Infiniband交換器改為專用高速互聯(lián)總線;此外,還有加上了2048顆我國(guó)自主研發(fā)的飛騰FT-1000八核心處理器作為秘密武器進(jìn)行加速。它具備總計(jì)高達(dá)20多萬(wàn)顆處理器核心,Linkpack最大性能飆升至2.507PFlops(每秒千萬(wàn)億次浮點(diǎn)運(yùn)算),峰值性能更是高達(dá) 4.7PFlops,分別是上代的4.4倍、3.9倍。而且得益于Fermi新架構(gòu)的Tesla GPU高性能計(jì)算卡,天河一號(hào)的系統(tǒng)效率(最大性能與峰值性能比值)達(dá)到了53.3%。
在傳輸方面,天河一號(hào)A采用的是高速互聯(lián)交換芯片“NRC”和接口芯片“NIC”,全部具備自主知識(shí)產(chǎn)權(quán)。其中NRC芯片片內(nèi)延遲只有單端口雙向帶寬高達(dá)160Gbps——是Infiniband QDR傳輸速率的2倍,而NRC單芯片上擁有16個(gè)這樣的交換端口,其峰值速率達(dá)到2.56Tbps。通信芯片由于穩(wěn)定性和制程局限,往往不采用最新的制程工藝。NRC芯片采用了90nm工藝制造,晶體管數(shù)目大約為4.6億——比“飛騰”處理器晶體管要多。
國(guó)家超級(jí)計(jì)算濟(jì)南中心——神威藍(lán)光
神威藍(lán)光超級(jí)計(jì)算機(jī)共有8704個(gè)CPU。這是該超級(jí)計(jì)算機(jī)最大的突破。這些CPU全部采用中國(guó)購(gòu)買許可后自主設(shè)計(jì)生產(chǎn)的CPU,即申威3代“申威1600”處理器(ShenWei processor SW1600)。該處理器是16核64位處理器,每個(gè)核心都是DEC Alpha 21164A(EV56)處理器的現(xiàn)代化增強(qiáng)版,以最高頻率1.1GHz運(yùn)行時(shí),16個(gè)核總共提供最大141GFlops的雙精度浮點(diǎn)處理能力。它的運(yùn)算能力峰值達(dá)到1.07016PFlops,持續(xù)性能達(dá)到795.9TFlops, Linpack效率為74.37%,總功耗為1074KW。存儲(chǔ)容量2PB,最高帶寬69.6TB/s。采用多種節(jié)能技術(shù)實(shí)現(xiàn)綠色指標(biāo)741.06MFlops/W。
國(guó)家超級(jí)計(jì)算深圳中心——曙光星云
中國(guó)自主研發(fā)的第一臺(tái)實(shí)測(cè)性能超千萬(wàn)億次的超級(jí)計(jì)算機(jī),是世界上第三臺(tái)同類計(jì)算機(jī)。這臺(tái)計(jì)算機(jī)名為“星云”,由曙光信息產(chǎn)業(yè)(北京)有限公司、中國(guó)科學(xué)院計(jì)算技術(shù)研究所、國(guó)家超級(jí)計(jì)算深圳中心共同研制,是中國(guó)制造的擁有部分自主知識(shí)產(chǎn)權(quán)的超級(jí)計(jì)算機(jī)。2010年6月1日,該超級(jí)計(jì)算機(jī)在北京正式亮相。2010年5月31日在全球最快超級(jí)計(jì)算機(jī)前500名排行榜上,“星云”超級(jí)計(jì)算機(jī)及其相關(guān)系統(tǒng)經(jīng)過(guò)眾多專家測(cè)評(píng),躋身排行榜第二的位置,超越歐洲和日本的同類產(chǎn)品,其運(yùn)算速度達(dá)每秒1270萬(wàn)億次。
中國(guó)超算發(fā)展面臨的機(jī)遇與挑戰(zhàn)
程序優(yōu)化與編程加速的那些事兒
毋庸置疑,隨著上述幾款大型超級(jí)計(jì)算機(jī),特別是天河二號(hào)的推出,中國(guó)已經(jīng)成功站在了超級(jí)計(jì)算機(jī)行業(yè)的頂峰,成為了與美國(guó)并駕齊驅(qū)的超級(jí)計(jì)算機(jī)大國(guó)。不過(guò)這僅僅是在硬件層面上,在軟件特別是應(yīng)用生態(tài)環(huán)境中,中國(guó)還有很長(zhǎng)的路要走。
中科院計(jì)算所計(jì)算機(jī)體系結(jié)構(gòu)國(guó)家重點(diǎn)實(shí)驗(yàn)室研究員、高性能計(jì)算專業(yè)委員會(huì)秘書長(zhǎng)張?jiān)迫J(rèn)為——中國(guó)的超算硬件水平已經(jīng)達(dá)到了世界領(lǐng)先程度,特別是天河二號(hào)再次獲得了TOP500超算排名的第一位,之前的天河一號(hào)A和曙光星云超級(jí)計(jì)算機(jī)都取得了喜人的成績(jī)。從操作性來(lái)說(shuō),如何將這些世界頂尖的超級(jí)計(jì)算機(jī)應(yīng)用好,成為了行業(yè)面臨的重要問(wèn)題。如何開發(fā)適合的軟件、如何培訓(xùn)相關(guān)的技術(shù)人才,實(shí)現(xiàn)產(chǎn)業(yè)的良性循環(huán),則是目前面臨的主要問(wèn)題。曙光本次的大會(huì)立足于人才培養(yǎng),這需要一個(gè)長(zhǎng)期堅(jiān)持的過(guò)程,從高專委的角度出發(fā),也希望曙光能夠持之以恒的進(jìn)行,高專委也將提供大力的支持。
結(jié)合當(dāng)下超級(jí)計(jì)算機(jī)應(yīng)用的發(fā)展來(lái)說(shuō),并行化研究已經(jīng)是行業(yè)的重要方面,而如何將原有的代碼遷移到超級(jí)計(jì)算機(jī)中就成為了關(guān)鍵性的問(wèn)題。從遷移的角度來(lái)說(shuō),NVIDIA的CUDA編程方式提供了非常好的解決方案。NVIDIA亞太區(qū)首席技術(shù)官Simon See認(rèn)為——NVIDIA提供了超過(guò)250個(gè)應(yīng)用案例,這可以幫助用戶更多的了解在各自行業(yè)中的表現(xiàn)。在應(yīng)用方面提供了諸多的開發(fā)軟件,包括CUDA、OpenACC等等,這也是希望用戶更多的使用GPU。