2018年8月5日,國家超級計算濟南中心宣布:核心器件全部獨立自主研發(fā)的神威E級超算原型機順利通過科技部專家組驗收,投入使用,為我國在2020年研制成功百億億次計算機打下堅實基礎(chǔ)。
九三學社社員、國家超級計算濟南中心主任張云泉介紹,“E級原型計算機將在全球氣候變化、空氣動力學、新藥設(shè)計、新材料發(fā)現(xiàn)、海洋大數(shù)據(jù)、人工智能等領(lǐng)域發(fā)揮重要作用。”“通過超級計算機的加入,可以把過去新藥侯選化合物的發(fā)現(xiàn)周期,從過去的幾年時間,縮短到幾星期的時間,極大地降低新藥的研發(fā)成本。”
“神威·太湖之光”初露鋒芒
超級計算,簡稱超算,也叫高性能計算,在科學與工程領(lǐng)域應用非常廣泛,它與理論研究、科學實驗一起成為人類探索未知世界的三大科學手段,被稱為支撐科學發(fā)現(xiàn)的第三個支柱。
超算也是人工智能的重要支持平臺,為人工智能提供強大的算力支持??梢哉f超算與國民經(jīng)濟、工業(yè)企業(yè)創(chuàng)新、國防科技、國家安全等國計民生的方方面面都息息相關(guān)。
而用于高端能力計算的高性能計算機也被譽為計算機中的“珠穆朗瑪峰”。
2017年11月,美國超算大會公布新一期全球超級計算機500強榜單,中國自主芯片研制的“神威·太湖之光”超級計算機再次蟬聯(lián)榜首,以每秒12.5億億次的峰值計算能力、每秒9.3億億次的持續(xù)計算能力實現(xiàn)“四連冠”。
“神威·太湖之光”完全采用“中國芯”——“申威26010”眾核處理器——這個只有5厘米見方的小小薄塊集成了260個運算核心,數(shù)十億晶體管,達到了每秒3萬多億次計算能力,單芯片計算能力相當于3臺2000年全球排名第一的超級計算機,1分鐘的計算能力相當于72億人同時用計算器不間斷計算32年,相當于200多萬臺普通電腦——它也是全球第一臺運行速度超過10億億次/秒的超級計算機。
“核武器都要靠超算模擬,核禁試會禁止所有地下核實驗,只能用超級計算機模擬,如果沒有這個能力意味著核武器的落后,落后就要挨打。”
神威·太湖之光’超級計算機已經(jīng)應用于若干代表未來“黑科技”的研究領(lǐng)域,涉及天氣氣候、航空航天、先進制造、生物醫(yī)藥、新材料、新能源等20個方面,支持國家重大科技應用、先進制造等領(lǐng)域計算任務(wù)幾百項。”張云泉說。
“神威E級超算原型機”再發(fā)神威
E級超算是指每秒可進行百億億次數(shù)學運算的超級計算機。作為大國綜合實力的象征、衡量科技創(chuàng)新實力的標志,E級超算已成為當前各國競相角逐的戰(zhàn)略制高點。E級超算將在解決人類共同面臨的能源危機、污染和氣候變化等重大問題上發(fā)揮巨大作用。目前,美國、日本及歐洲等國家和地區(qū)先后提出了自己的E級超算研發(fā)計劃,我國也將E級超算的研究寫入了國家“十三五”規(guī)劃。E級計算機作為新一代信息技術(shù)領(lǐng)域的大科學裝置,對交叉學科的推動效應、對科技研發(fā)的支撐效應、對高層次人才的凝聚效應、對相關(guān)產(chǎn)業(yè)的帶動效應相當顯著,是新舊動能轉(zhuǎn)換的強勁引擎。
神威E級原型機由硬件、軟件和應用三大系統(tǒng)組成。硬件系統(tǒng)由運算系統(tǒng)、互連網(wǎng)絡(luò)系統(tǒng)、存儲系統(tǒng)、維護診斷系統(tǒng)、供電與冷卻系統(tǒng)組成,軟件系統(tǒng)由基礎(chǔ)軟件、并行操作系統(tǒng)環(huán)境、存儲管理系統(tǒng)、并行語言及編譯環(huán)境組成,應用系統(tǒng)由行業(yè)應用計算平臺、人工智能框架和典型示范應用組成。
面向E級計算機研制需求,研制團隊在多態(tài)融合計算體系結(jié)構(gòu)、新一代申威眾核處理器、互連網(wǎng)絡(luò)、軟件定義海量存儲、高效供電和強化相變冷卻等方面,取得了重大技術(shù)突破,對E級計算機研制方案和技術(shù)路線進行了全面系統(tǒng)驗證,為E級計算機的研制成功鋪平了道路。
芯片完全自主可控
1996年,為加強我國高端并行計算機系統(tǒng)的研制,國家并行計算機工程技術(shù)中心正式掛牌成立,開始了神威系列大規(guī)模并行計算機系統(tǒng)的研制。近年來從神威藍光、神威太湖之光,到神威E級原型機,我國已經(jīng)走出了一條核心技術(shù)自主可控之路。神威E級原型機的處理器、網(wǎng)絡(luò)芯片組等核心器件全部實現(xiàn)國產(chǎn)化。運算系統(tǒng)全部采用具有完全自主知識產(chǎn)權(quán)的申威26010+眾核處理器構(gòu)建;高速互連網(wǎng)絡(luò)系統(tǒng)全部采用完全自主知識產(chǎn)權(quán)的申威網(wǎng)絡(luò)交換芯片、申威消息處理芯片構(gòu)建;存儲和管理系統(tǒng)采用申威多核處理器構(gòu)建,實現(xiàn)了對該領(lǐng)域產(chǎn)品的國產(chǎn)化替代。
軟件生態(tài)日益完善
隨著神威系列超級計算機系統(tǒng)的部署與應用,神威系列超級計算機系統(tǒng)從基礎(chǔ)軟件、并行操作系統(tǒng)、存儲管理系統(tǒng)、并行語言、編譯環(huán)境、高性能數(shù)學庫到應用軟件等生態(tài)得到日益完善。系統(tǒng)軟件由完全自主研發(fā)的神威睿思操作系統(tǒng)、神威睿智編譯器、高性能數(shù)學庫等構(gòu)建,在此基礎(chǔ)上,神威E級原型計算機首次在國產(chǎn)超級計算機上構(gòu)建了人工智能軟件生態(tài)鏈,基于神威深度學習庫和框架,開展了對弈系統(tǒng)、醫(yī)療影像識別、機器翻譯多個大規(guī)模人工智能應用,其中機器翻譯應用的數(shù)據(jù)規(guī)模、并行規(guī)模和訓練速度世界領(lǐng)先。截至目前,E級原型計算機已完成包括全球氣候變化、海洋數(shù)值模擬、生物醫(yī)藥仿真、大數(shù)據(jù)處理和類腦智能等十二個領(lǐng)域的35項重大計算任務(wù)。其中,22項應用具備擴展到E級計算機整機規(guī)模的能力,6項應用入圍被稱作超級計算應用領(lǐng)域諾貝爾獎的“戈登貝爾獎”。
未來應用前景廣闊
神威E級計算機系統(tǒng)研制始終與應用緊密結(jié)合,應用領(lǐng)域日益拓寬,從氣候氣象預報、深空/深海/深地探測、生命科學、天體物理、航空航天等國家戰(zhàn)略領(lǐng)域,進一步拓展到互聯(lián)網(wǎng)、云計算、大數(shù)據(jù)、人工智能、基因測序、金融計算、先進制造、現(xiàn)代海洋等領(lǐng)域。神威E級計算機作為大科學裝置,一方面為國家海洋強國戰(zhàn)略打造“深藍大腦”,另一方面滿足健康醫(yī)療、航空航天、氣候氣象、生物信息、先進制造等領(lǐng)域的一批國家科學與工程計算重大需求,成為促進國家科技創(chuàng)新、經(jīng)濟發(fā)展以及中國制造走向中國創(chuàng)造的助推器。刻在里程碑背后
“神威系”“大顯神威”的背后,是科學家們長期不懈的追逐和創(chuàng)造。
十幾年來,張云泉在各個場合和媒體為中國超算的發(fā)展“鼓與呼”,他認為:一是要抓住歷史機遇,將我國超算的發(fā)展模式從超算機器性能拉動,向應用需求拉動轉(zhuǎn)變,探索出一條健康的超級計算系統(tǒng)發(fā)展道路。二是成立若干國家級超算行業(yè)應用軟件國家工程實驗室,制定我國超級計算機應用中長期研究規(guī)劃和路線圖。三是轉(zhuǎn)變“重硬輕軟”思維,持續(xù)穩(wěn)定支持超算應用軟件研發(fā)。四是鼓勵國家超算中心聯(lián)合應用部門組建行業(yè)應用聯(lián)合實驗室,進行程序移植,自主研發(fā)大型并行應用軟件。五是重視計算科學學科建設(shè)和人才激勵機制。推廣“超算理論+多學科應用”課程,促進多學科交叉融合。六是加強人才隊伍的建設(shè),為超級計算的發(fā)展提供源源不斷的人才供應,“將超級計算與大數(shù)據(jù)和人工智能等進行深度融合創(chuàng)新,將成為進行新舊動能轉(zhuǎn)換的主要手段。”張云泉說。
在努力為中國超算研究掃除障礙、創(chuàng)造條件的同時,張云泉也在不斷通過自己的研究為中國超算跨越式發(fā)展做出應有的貢獻。
過去十幾年,張云泉研究員的主要工作是做為項目負責人為神威超級計算機研發(fā)了三代高性能數(shù)學庫,為包括申威系列處理器在內(nèi)的多款國產(chǎn)處理器研發(fā)國產(chǎn)高性能多核和眾核并行數(shù)學庫CLeXML和WeXML,主要包含BLAS、LAPACK、FFT、直接解法器和迭代解法器等模塊,具有完全自主知識產(chǎn)權(quán),遵循國際主流高性能數(shù)學庫接口標準,且性能高于國際主流高性能數(shù)學庫。高性能數(shù)學庫作為支持2016年我國首次獲得戈登貝爾獎的三大底層技術(shù)之一,獲得2017年中國科學院杰出科技成就獎。
然而,做國產(chǎn)超算軟件的研究必然是困難重重,最大的困難還是沒有先例可循。張云泉說,在研發(fā)高性能數(shù)學庫核心算法時,需要深入體系結(jié)構(gòu)層面利用匯編語言高效實現(xiàn)核心算法的核心循環(huán)性能,在我國自行設(shè)計的申威處理器上開展這種優(yōu)化工作是開創(chuàng)性的,國內(nèi)外可參考借鑒工作少。“我們創(chuàng)新性的提出了一種適用于數(shù)學核心算法的“模板法”優(yōu)化方法AUGEM,用于自動提升多種關(guān)鍵核心函數(shù)的性能,具有重要的實用價值,相關(guān)工作已發(fā)表在CCF A類國際高水平會議SC和PPoPP上。”
神威E級原型機的研制成功,標志著研制E級計算機的技術(shù)條件和工程條件全面就緒,E級計算正擁抱未來。
神威E級計算機于2020年完成研制部署,將率先跨越百億億次量級臺階。采用的新一代眾核處理器有望成為世界運算速度最快的處理器,節(jié)點規(guī)??蓴U展至數(shù)十萬量級,支持系統(tǒng)性能從1E到10E量級的跨越。E級計算機將面向國家戰(zhàn)略需求,解決一批科學與工程計算領(lǐng)域的重大課題,為國防安全和經(jīng)濟建設(shè)提供國際領(lǐng)先的計算環(huán)境。
------------------------------------------------------------------------------------
本文作者中國計算網(wǎng)專家專欄張云泉 轉(zhuǎn)載請注明出處
搜索微信公眾號: cncompute_Mall 直接關(guān)注,更多驚艷的資訊等你來關(guān)注~您也可以來投稿~
微信關(guān)注公眾號“cncompute_com ”,為您奉上最新最熱的計算頭條資訊,干貨滿滿。