還記得計(jì)算機(jī)的發(fā)展史么?
1946年2月14日,標(biāo)志現(xiàn)代計(jì)算機(jī)誕生的ENIAC在費(fèi)城公諸于世。這個(gè)大家伙長50英尺,寬30英尺,占地170平方米,重30噸,有1.88萬個(gè)電子管,計(jì)算速度是每秒5000次加法或400次乘法。ENIAC不僅占地大,而且耗電極大,開機(jī)時(shí)整個(gè)費(fèi)城西區(qū)的電燈都為之黯然失色。至于可靠性…ENIAC每15分鐘就可能燒掉一支真空管。
70年過去,如今一個(gè)迷你計(jì)算器的性能都已經(jīng)超過了ENIAC,而計(jì)算機(jī)的巔峰計(jì)算力也已經(jīng)達(dá)到了每秒十億億次——在第47屆全球TOP500超算排行榜中奪冠的“太湖之光”,性能峰值已經(jīng)達(dá)到125.4Pflop/s(每秒12.54億億次)。
70年間,計(jì)算機(jī)的性能翻了不知多少倍,即便如此,人類也未曾停止攀登計(jì)算新高峰的腳步。在十億億次之后,超級(jí)計(jì)算機(jī)的下一個(gè)臺(tái)階是“E級(jí)計(jì)算”,即“百億億次”——1后面18個(gè)0,想必大家在日常生活中,根本無法觸及這樣的數(shù)字。
“E級(jí)計(jì)算”也成為HPC廠商們新的愿景。7月1日,聯(lián)想舉辦了主題為“開啟E級(jí)計(jì)算新篇章”的2016全球超算峰會(huì),剛剛在全球TOP500超算榜單中斬獲份額亞軍的聯(lián)想展現(xiàn)出了更大的胃口,對(duì)于目前看似還很遙遠(yuǎn)的“E級(jí)計(jì)算”,聯(lián)想打算要做一個(gè)有力的競(jìng)爭(zhēng)者。
E級(jí)計(jì)算還需邁過幾道坎
在今年6月20日所公布的第47屆全球TOP500超算榜單中,聯(lián)想以92套系統(tǒng)的成績獲得份額亞軍,這是歷史上中國廠商在TOP500榜單中獲得的最好成績,同時(shí)也幫助中國廠商第一次在TOP500中的份額超過美國(中國167套,美國165套)。
獲得這樣的成績足夠聯(lián)想驕傲,但對(duì)于E級(jí)計(jì)算這個(gè)新的高峰,全球所有的HPC廠商,包括聯(lián)想,都還有很長的路要走。
E級(jí)計(jì)算,或者叫做百億億次,并不是HPC領(lǐng)域的一個(gè)新目標(biāo)。在HPC計(jì)算峰值剛剛突破千萬億次浮點(diǎn)運(yùn)算的時(shí)候,英特爾等廠商就已經(jīng)提出了百億億次的愿景。當(dāng)時(shí),“摩爾定律”依舊在發(fā)揮著作用,異構(gòu)計(jì)算大獲成功,“眾核”技術(shù)剛剛起步。
時(shí)間僅僅過去六七年,HPC計(jì)算峰值已經(jīng)從千萬億次突破到十億億次,跨越了兩個(gè)臺(tái)階,看上去,百億億次已經(jīng)很近了,近的好像一下子就能觸摸到,然而事實(shí)并非如此。中國計(jì)算機(jī)協(xié)會(huì)高性能計(jì)算專業(yè)委員會(huì)秘書長張?jiān)迫壬赋觯珽級(jí)計(jì)算還有“幾道墻”很難跨越。
“首先是功耗墻”,張?jiān)迫硎?,如果不采用新的半?dǎo)體技術(shù)、新的加速部件以及新的綜合處理器的話,按照現(xiàn)在CPU堆積的方式,E級(jí)HPC功耗將達(dá)到50-100兆瓦,電費(fèi)一年就是幾個(gè)億,一般的超算中心根本無法承擔(dān)。
另外兩個(gè)障礙是“可靠性墻和并行墻”,以太湖之光為例,節(jié)點(diǎn)數(shù)量超過4萬個(gè),處理器數(shù)量達(dá)到兩萬多個(gè),核心數(shù)量上千萬,E級(jí)計(jì)算可能會(huì)有更多的節(jié)點(diǎn)和核心,部件多了更加容易出錯(cuò),同時(shí)更大的并行度也更難于管理和擴(kuò)展。
但E級(jí)計(jì)算并非遙不可及。張?jiān)迫赋?,美國、歐盟、日本和中國都有E級(jí)計(jì)算的計(jì)劃,但是目前美國是比較悲觀的,預(yù)測(cè)2022年以后才能實(shí)現(xiàn)E級(jí)系統(tǒng);而其它的國家都比較樂觀,包括中國:“中國太湖之光為我們下一步實(shí)現(xiàn)E級(jí)計(jì)算呈現(xiàn)了一絲曙光,根據(jù)推算,大概三到四年左右計(jì)算峰值應(yīng)該會(huì)有十倍的增長,E級(jí)計(jì)算到了2020年應(yīng)該是比較有希望的。”
聯(lián)想HPC的“二、三、五”
用“前景是光明的,道路是曲折的”來形容E級(jí)計(jì)算最恰當(dāng)不過。這一目標(biāo)的實(shí)現(xiàn)需要HPC整個(gè)產(chǎn)業(yè)鏈的共同努力,包括Intel、NVIDIA、Mellanox等上游廠商,自然也包括聯(lián)想這樣的HPC系統(tǒng)廠商。
斬獲佳績之后,聯(lián)想HPC的道路更加清晰。聯(lián)想并沒有喊出“XX年實(shí)現(xiàn)E級(jí)計(jì)算”的口號(hào),而是規(guī)劃出了一系列的策略和方向,概括而言,有“兩支柱、三方向、五持續(xù)”。
據(jù)聯(lián)想集團(tuán)商用業(yè)務(wù)企業(yè)級(jí)解決方案和ISV總監(jiān)李煒介紹,聯(lián)想將集中在高性能架構(gòu)的優(yōu)化和智能管理兩個(gè)領(lǐng)域,細(xì)分起來有“綠色節(jié)能、智能管理、深度學(xué)習(xí)”三大發(fā)展方向,滿足和預(yù)判聯(lián)想HPC未來三到五年的技術(shù)需求。
在聯(lián)想2016全球超算峰會(huì)上,聯(lián)想發(fā)布了深騰x8800超級(jí)計(jì)算機(jī)解決方案,體現(xiàn)了架構(gòu)優(yōu)化和智能管理的理念。硬件架構(gòu)上,深騰x8800包含了NextScale高密度服務(wù)器、刀片系統(tǒng)、機(jī)架服務(wù)器、GSS高性能存儲(chǔ)以及網(wǎng)絡(luò)設(shè)備;更為重要的是包含了聯(lián)想自主研發(fā)的LiCO管理軟件,李煒將其比喻為深騰x8800的“中樞和大腦”,是將“寶石和珍珠”串結(jié)起來的鏈條。