在中國(guó),談到高性能計(jì)算機(jī)業(yè)界第一個(gè)想到的便是曙光公司。從曙光1號(hào)到曙光星云,曙光公司一直在高性能計(jì)算機(jī)的研發(fā)和應(yīng)用上保持著領(lǐng)先優(yōu)勢(shì),并在市場(chǎng)上獲得了廣泛認(rèn)可。
在35屆中國(guó)超級(jí)計(jì)算機(jī)TOP500榜單里,曙光公司不僅讓業(yè)界為之一震,更讓世界為之一震,曙光星云以其峰值理論運(yùn)算能力2.98 PFlop/s排在了世界第二,僅次于“Jaguar(美洲豹)”,這是中國(guó)超級(jí)計(jì)算機(jī)在TOP500榜單里的最高排名。這不僅刷新了中國(guó)高性能計(jì)算機(jī)的最高速度,同時(shí)還意味著中國(guó)高性能計(jì)算機(jī)產(chǎn)業(yè)實(shí)現(xiàn)了超千萬(wàn)億次計(jì)算技術(shù)的自主產(chǎn)業(yè)化。
據(jù)悉,曙光星云系統(tǒng)已經(jīng)成功應(yīng)用在曙光公司全國(guó)布局的云計(jì)算中心建設(shè)中,以“中國(guó)速度”推動(dòng)中國(guó)云計(jì)算發(fā)展進(jìn)程,加速中國(guó)云計(jì)算進(jìn)入應(yīng)用時(shí)代。
以曙光TC3600刀片為核心 高配置星云成就“中國(guó)速度”
2010年6月,經(jīng)歷了十萬(wàn)億次與百萬(wàn)億次超級(jí)計(jì)算能力的測(cè)試考驗(yàn),中國(guó)首臺(tái)實(shí)測(cè)性能超千萬(wàn)億次的超級(jí)計(jì)算機(jī)曙光星云高性能計(jì)算機(jī)系統(tǒng)正式發(fā)布,這是中國(guó)超級(jí)計(jì)算機(jī)史上值得紀(jì)念的歷史性時(shí)刻。中科院院士李國(guó)杰這樣評(píng)價(jià)星云系統(tǒng):“從每一個(gè)刀片到浮點(diǎn)加速卡,以及整個(gè)軟件系統(tǒng),全部都是自主創(chuàng)新的成果,星云系統(tǒng)的組裝密度已經(jīng)超過了世界上任何一臺(tái)高性能計(jì)算機(jī)。”
據(jù)悉,星云系統(tǒng)核心部件采用的是曙光公司自主研發(fā)的最新一代刀片服務(wù)器曙光TC3600,也是全球第一款符合SSI規(guī)范的刀片服務(wù)器系統(tǒng)。曙光TC3600刀片服務(wù)器以高性能計(jì)算、WEB基礎(chǔ)架構(gòu)、虛擬化為主要應(yīng)用目標(biāo),融入了諸多先進(jìn)的設(shè)計(jì)理念和技術(shù)特性,是業(yè)界領(lǐng)先的最新一代符合開放性標(biāo)準(zhǔn)的刀片服務(wù)器產(chǎn)品,它擁有高性能、高密度、可伸縮、按需配置、方案靈活等設(shè)計(jì)特點(diǎn),可以滿足用戶多樣且動(dòng)態(tài)變化的應(yīng)用需求,同時(shí)它還具備企業(yè)級(jí)產(chǎn)品的RAS特性,可滿足政府、電信、金融、教育、互聯(lián)網(wǎng)等關(guān)鍵用戶的需要。
從運(yùn)算能力上來看,星云系統(tǒng)峰值為每秒300萬(wàn)億次云系統(tǒng)峰值為每秒3000萬(wàn)億次(3PFlops),實(shí)測(cè)Linpack值每秒1271萬(wàn)億次(1.271PFlops),是中國(guó)第一臺(tái)、世界第三臺(tái)實(shí)測(cè)雙精度浮點(diǎn)計(jì)算超千萬(wàn)億次的超級(jí)計(jì)算機(jī)。相比“Jaguar(美洲豹)”采用了224162個(gè)處理器核心和IBM“Roadrunner(走娟)”的122400個(gè)處理器核心,名列第二的“星云”則只用了120640個(gè)處理器核心。同時(shí),星云超級(jí)計(jì)算機(jī)也是目前國(guó)內(nèi)最“綠色”的超級(jí)計(jì)算機(jī),它的單位耗能所提供的性能達(dá)到了4.98億次/瓦。
正如高性能計(jì)算領(lǐng)域的技術(shù)人員所認(rèn)為的那樣:“盡管CPU是計(jì)算機(jī)的核心,但并不是簡(jiǎn)單地把眾多CPU堆起來,就能搭成一架超級(jí)計(jì)算機(jī),這需要架構(gòu)設(shè)計(jì)、軟件設(shè)計(jì)等很多技術(shù)。”而星云超級(jí)計(jì)算機(jī)采用自主設(shè)計(jì)的HPP體系結(jié)構(gòu),處理器是X5650,并且采用了Nvidia Tesla C2050 GPU做協(xié)處理,由4640個(gè)計(jì)算單元組成。它采用了高效異構(gòu)協(xié)同計(jì)算技術(shù),系統(tǒng)包括了9280顆通用CPU和4640顆專用GPGPU組成。計(jì)算網(wǎng)絡(luò)采用了單向40Gbps QDR Infiniband技術(shù),核心存儲(chǔ)采用了自主設(shè)計(jì)的Parastor高速I/O系統(tǒng)。同時(shí)包括自主研發(fā)的QDR IB高速交換模塊(HSSM),突破高速信號(hào)傳輸技術(shù),是系統(tǒng)高速通信的核心部分。獨(dú)創(chuàng)的IOE設(shè)計(jì),大大提高了系統(tǒng)的可擴(kuò)展性。