2010年底,我們?cè)?jīng)親身走進(jìn)天津的國(guó)家超級(jí)計(jì)算中心,目睹了當(dāng)時(shí)世界第一超算天河一號(hào)A的風(fēng)采。世事變遷,性能堪比至少五個(gè)天河一號(hào)A的“泰坦”(Titan)又在美國(guó)的橡樹嶺國(guó)家實(shí)驗(yàn)室(ORNL)里屹立起來。接下來,我們就跟隨國(guó)外記者的腳步,一同去探秘這個(gè)新的全球超算No.1。(友情提醒:圖灰常灰常多喲……)
【從美洲虎到泰坦】
ORNL是美國(guó)能源部委托UT-Battelle公司管理的一個(gè)國(guó)家級(jí)核心科技研究基地,超級(jí)計(jì)算機(jī)只是他們的一個(gè)工具而已。上一代的“美洲虎”(Jaguar)建成于2005年,之后每年都在進(jìn)行升級(jí),泰坦則是一次超大規(guī)模的更新?lián)Q代。
泰坦還是200個(gè)定制的19英寸機(jī)柜和18688個(gè)計(jì)算節(jié)點(diǎn),但已經(jīng)更換為最新的Cray XK7計(jì)算系統(tǒng),內(nèi)部配置也大為不同:登陸與IO節(jié)點(diǎn)翻番為512個(gè);處理器還是AMD Opteron,但是從12核心變?yōu)?6核心,總的核心數(shù)量從224256個(gè)增加到299008個(gè);每顆處理器搭配開普勒架構(gòu)的NVIDIA Tesla K20高性能計(jì)算卡,總計(jì)18688個(gè)GPU;系統(tǒng)內(nèi)存每個(gè)節(jié)點(diǎn)原來是16GB,現(xiàn)在不但翻番為32GB,還有6GB GDDR5顯存,總量從300TB增至710TB;硬盤是一萬塊標(biāo)準(zhǔn)的1TB 7200轉(zhuǎn)2.5寸機(jī)械盤,總?cè)萘?0PB,下次升級(jí)會(huì)增加到20-30PB。升級(jí)替換下來的老硬件照例都交還給Cray。
單單是CPU、GPU加在一起,整套系統(tǒng)就有177萬億個(gè)晶體管!
由于超算的大部分工作都是遠(yuǎn)程執(zhí)行的,泰坦內(nèi)部還有幾十個(gè)10Gbps以太網(wǎng)鏈接,還接入了能源部能源科學(xué)網(wǎng)絡(luò)(ESNET)的100Gbps骨干網(wǎng)內(nèi)。
而在峰值浮點(diǎn)性能方面,美洲虎“只有”2.3PFlops,泰坦猛增了幾乎十倍,超過20PFlops,也就是每秒鐘可進(jìn)行2億億次計(jì)算。
全速運(yùn)行的時(shí)候,它需要消耗900萬瓦特電力,典型負(fù)載下也要700萬瓦特,而這也是唯一限制它擴(kuò)充的地方。為了減少供電線厚度,電壓是很高的480V而不是當(dāng)?shù)貥?biāo)準(zhǔn)的208V。
泰坦的升級(jí)工作已經(jīng)按時(shí)基本完成,并且立即就能投入科學(xué)計(jì)算工作,而且得益于Tesla計(jì)算卡的加盟,大量科學(xué)應(yīng)用可以提速4-8倍。
至于泰坦是不是能夠成功拿下第一,要到半個(gè)月后的新一屆超算大會(huì)SC12上才會(huì)知曉,但就目前看來,已經(jīng)是十拿九穩(wěn)的了。