日前,美國(guó)政府發(fā)表公告,禁止英特爾公司和英偉達(dá)公司向中國(guó)的4家國(guó)家超級(jí)計(jì)算機(jī)中心出售英特爾至強(qiáng)系列高端型號(hào)至強(qiáng)CPU、至強(qiáng)Phi協(xié)處理器以及英偉達(dá)公司的Tesla系列協(xié)處理器。理由是這些高性能計(jì)算產(chǎn)品可能用于模擬核試驗(yàn)工作。
看到這條消息的第一感覺(jué)是無(wú)理取鬧,因?yàn)槊绹?guó)的超級(jí)計(jì)算機(jī)里很可能也有中國(guó)企業(yè)制造的元器件,雖然不是CPU、協(xié)處理器這種核心部件,但也可能是網(wǎng)線、IC、晶振或其他,那么是不是中國(guó)也可以對(duì)其禁運(yùn)呢?另一方面,再高性能計(jì)算領(lǐng)域,除了汽車(chē)、化工、物探、生物醫(yī)藥之外,武器模擬和設(shè)計(jì)是超級(jí)計(jì)算機(jī)工人的主要應(yīng)用領(lǐng)域,以此為理由禁運(yùn)顯然過(guò)于牽強(qiáng)。再筆者看來(lái),美國(guó)政府出此下策顯然是在包括超算性能在內(nèi)的很多方面落后于中國(guó)之后惱羞成怒的決定。此前,中國(guó)超級(jí)計(jì)算機(jī)天河二號(hào)的性能已經(jīng)接近美國(guó)頂級(jí)超算“泰坦”性能的一倍。
不過(guò)既然事已至此,還是讓我們冷靜的分析下這一禁運(yùn)對(duì)中國(guó)來(lái)說(shuō)是機(jī)會(huì)還是噩耗吧。
外國(guó)“芯”再中國(guó)超算中的作用
花開(kāi)兩朵,各表一枝,咱們先來(lái)說(shuō)說(shuō)此次禁運(yùn)產(chǎn)生的短期負(fù)面效果。
根據(jù)公開(kāi)的資料,中國(guó)頂級(jí)超算“天河二號(hào)”采用英特爾至強(qiáng)E5-2600系列處理器并搭配至強(qiáng)Phi系列協(xié)處理器。而協(xié)處理器的加入正式天河2號(hào)能夠蟬聯(lián)全球超算排行榜冠軍寶座的最重要原因之一。
缺少了高端CPU和協(xié)處理器,中國(guó)的下一代超算講很難在性能上有所突破。因?yàn)槟壳跋拗瞥阈阅馨l(fā)展的主要原因是規(guī)模太大導(dǎo)致的功耗、散熱、管理和網(wǎng)絡(luò)問(wèn)題。因此,目前全球超算發(fā)展的主要方向還是在一定的規(guī)模內(nèi),依靠提升單個(gè)計(jì)算節(jié)點(diǎn)的性能和效率來(lái)提升超算的整體性能。而如果缺少了新一代的處理器和協(xié)處理器,中國(guó)超算講很難在整體性能上有飛質(zhì)的提升。
中國(guó)“芯”的發(fā)展情況
首先,我們必須要澄清一點(diǎn),那就是中國(guó)在計(jì)算機(jī)領(lǐng)域并不是沒(méi)有“芯”。中國(guó)完全自主研發(fā)的的飛騰1000和SW1600等處理器雖然在絕對(duì)性能上無(wú)法與國(guó)外產(chǎn)品相抗衡,但這兩款處理器在通用性上已經(jīng)取得了很多突破。
目前,飛騰1000已經(jīng)在天河1號(hào)、天河2號(hào)等超算上進(jìn)行了部署和應(yīng)用,從目前的情況來(lái)看,飛騰1000已經(jīng)能夠與協(xié)處理器等其他計(jì)算單元協(xié)同工作。除此之外,飛騰1000的適用性也相當(dāng)廣泛,能夠在商用服務(wù)器、交換機(jī)等眾多設(shè)備中使用。而浪潮、曙光等公司對(duì)于這款處理器目前也有比較全面的技術(shù)儲(chǔ)備和多種成熟解決方案。
SW1600處理器是江南計(jì)算機(jī)所根據(jù)Alpha架構(gòu)所開(kāi)發(fā)的第三代處理器,擁有16個(gè)RISC內(nèi)核。SW1600也是2012年中國(guó)建造的神威藍(lán)光超算的核心。由于SW1600在浮點(diǎn)性能上表現(xiàn)突出,神威藍(lán)光也是當(dāng)年世界排名非??壳暗捻敿?jí)超算之一。
除了兩大處理器產(chǎn)品之外,中國(guó)在超算另一大核心部件——高速互聯(lián)芯片上也已經(jīng)達(dá)到了自主研發(fā)的水平。之前我們提到,除了CPU和協(xié)處理器之外,內(nèi)部互聯(lián)架構(gòu)同樣是超算的最核心組成。而天河2號(hào)所采用的Express-2高速互聯(lián)架構(gòu)則完全由國(guó)內(nèi)自主研發(fā)。這一光電混合的網(wǎng)絡(luò)能夠有效承載超算所擁有的數(shù)萬(wàn)個(gè)節(jié)點(diǎn)之間的互聯(lián)互通需求,并對(duì)超算內(nèi)部網(wǎng)絡(luò)低延遲、分包小的特點(diǎn)進(jìn)行了細(xì)致的優(yōu)化。可以說(shuō)Express-2高速互聯(lián)網(wǎng)絡(luò)對(duì)天河2號(hào)蟬聯(lián)全球超算性能寶座同樣起到了至關(guān)重要的作用。
被禁運(yùn)之后我們要在哪方面發(fā)奮?
雖然我國(guó)在眾多核心部件上取得了很大的突破,但距離建造和使用全球頂尖超算還是有距離的。
因此首當(dāng)其沖的還是要繼續(xù)在中國(guó)芯的研發(fā)上繼續(xù)投入,并早日推出新一代國(guó)產(chǎn)高性能處理器芯片。
雖然我們有中國(guó)芯,但在中國(guó)芯相關(guān)的軟件應(yīng)用開(kāi)發(fā)方面,我國(guó)目前所儲(chǔ)備的人才并不多。因?yàn)槲覈?guó)現(xiàn)有的大部分超算軟件編程人員所熟悉的架構(gòu)依舊是傳統(tǒng)的OpenMP(英特爾平臺(tái))和CUDA(英偉達(dá)協(xié)處理器所使用的開(kāi)發(fā)環(huán)境)。而在國(guó)產(chǎn)平臺(tái)上,除了軍工領(lǐng)域之外,其他科研領(lǐng)域的相關(guān)人才儲(chǔ)備依舊非常欠缺。而如果相關(guān)禁運(yùn)將持續(xù)很長(zhǎng)時(shí)間的話,這方面的人才培養(yǎng)和儲(chǔ)備將是未來(lái)我國(guó)超算事業(yè)發(fā)展的主要方向之一。
另外,超算商用化是目前國(guó)際上對(duì)超算行業(yè)發(fā)展的共識(shí)。但如果中國(guó)超算在架構(gòu)上與普通商用平臺(tái)有太大差距的話,超算中心和整個(gè)超算行業(yè)將很難擺脫政府輸血度日的尷尬局面。因此,如何來(lái)兩種平臺(tái)之間推出一套通用且高效的開(kāi)發(fā)編譯環(huán)境同樣是超算行業(yè)發(fā)展索要解決的一個(gè)難題。