2015年全國(guó)高性能計(jì)算學(xué)術(shù)年會(huì)(HPC China 2015)今日在無(wú)錫開(kāi)幕。全球視覺(jué)計(jì)算的行業(yè)領(lǐng)袖NVIDIA(英偉達(dá))及應(yīng)用其GPU的眾多企業(yè)和科研機(jī)構(gòu),帶來(lái)近20場(chǎng)報(bào)告和演講,針對(duì)GPU的最新技術(shù)以及GPU在科學(xué)計(jì)算、大數(shù)據(jù)分析、深度學(xué)習(xí)乃至自動(dòng)駕駛汽車領(lǐng)域的應(yīng)用和創(chuàng)新,做了深度解讀和分享。隨著深度學(xué)習(xí)爆發(fā)式發(fā)展,GPU成為HPC 領(lǐng)域受關(guān)注的焦點(diǎn)。
在大會(huì)首日上午的特邀報(bào)告中,NVIDIA解決方案工程架構(gòu)副總裁Marc Hamilton提到:“在NVIDIA的推動(dòng)下,過(guò)去7年間整個(gè)加速計(jì)算領(lǐng)域獲得了10倍的增長(zhǎng),NVIDIA的GPU加速器占據(jù)了加速器市場(chǎng)85%的份額。同時(shí)在GPU的驅(qū)動(dòng)下全球和中國(guó)都掀起了深度學(xué)習(xí)熱潮,GPU也已成為深度學(xué)習(xí)研究的首選技術(shù)平臺(tái)。此次大會(huì)我們非常高興地看到GPU幫助了眾多企業(yè)和研究機(jī)構(gòu)在HPC和深度學(xué)習(xí)領(lǐng)域?qū)崿F(xiàn)大量創(chuàng)新應(yīng)用,相信我們將于明年面世的下一代GPU架構(gòu)Pascal和NVLink高速互聯(lián)技術(shù),將為數(shù)據(jù)中心和深度學(xué)習(xí)提供更加強(qiáng)大的加速動(dòng)力?!?/p>
“后摩爾定律”時(shí)代 GPU提供強(qiáng)大加速動(dòng)力
計(jì)算核心并沒(méi)有越來(lái)越快,只不過(guò)處理器正朝著并行化的方向發(fā)展。如今我們已步入了“后摩爾定律時(shí)代”,處理器單線程性能的增速放緩,邏輯核心數(shù)量則在不斷增加,由CPU和加速器構(gòu)成的加速計(jì)算體系,成為整個(gè)計(jì)算領(lǐng)域的必然趨勢(shì)。
目前,加速器發(fā)展勢(shì)頭迅猛,自2010年到今天的短短幾年時(shí)間,全球超級(jí)計(jì)算機(jī)TOP 500榜單中采用加速器的系統(tǒng)就已經(jīng)達(dá)到90臺(tái)。同時(shí),最常用的50款HPC應(yīng)用中有70%已支持加速器加速。
NVIDIA在整個(gè)加速計(jì)算領(lǐng)域中居于主導(dǎo)地位,其推出的Tesla GPU加速器和CUDA?并行計(jì)算架構(gòu),在過(guò)去7年中引領(lǐng)了加速計(jì)算領(lǐng)域10倍以上的增長(zhǎng),例如支持CUDA的應(yīng)用數(shù)量從27款增長(zhǎng)至334款,Tesla GPU加速器的使用量從6,000個(gè)增加至45萬(wàn)個(gè),占據(jù)整個(gè)加速器市場(chǎng)85%的份額。
2008年全球首臺(tái)GPU超級(jí)計(jì)算機(jī)即由Tesla GPU加速器驅(qū)動(dòng),隨后幾年內(nèi)Tesla GPU加速器更成就多臺(tái)頂級(jí)超級(jí)計(jì)算機(jī),例如美國(guó)的泰坦系統(tǒng)。而當(dāng)前美國(guó)基于Tesla GPU加速器正構(gòu)建兩臺(tái)新一代超級(jí)計(jì)算機(jī)高峰和峰巒,將距離百億億次級(jí)計(jì)算目標(biāo)更近一步。
NVIDIA的Tesla GPU加速器還在2013年幫助科學(xué)家實(shí)現(xiàn)重大突破,首次確定了HIV"病毒衣殼"的準(zhǔn)確化學(xué)結(jié)構(gòu)。而如果不使用GPU,則需要5倍的處理器規(guī)模才能達(dá)到近似的性能;Tesla GPU加速器還可顯著提升成本效益,例如谷歌大腦系統(tǒng)在使用Tesla加速器后,性能提升到之前的6倍,而能耗卻從原先的600千瓦降低到4千瓦。
高密度GPU服務(wù)器也已成為主流,Cray、DELL、HP以及Quanta都已推出支持Tesla GPU加速器的產(chǎn)品,可為HPC客戶提供直接、完整的解決方案。
圍繞Tesla GPU加速器和CUDA并行計(jì)算架構(gòu),NVIDIA推出了Tesla加速計(jì)算平臺(tái),專門(mén)針對(duì)大數(shù)據(jù)分析與科學(xué)計(jì)算領(lǐng)域的密集型計(jì)算需求,構(gòu)建了一個(gè)由軟件開(kāi)發(fā)者、軟件供應(yīng)商以及數(shù)據(jù)中心系統(tǒng)OEM廠商組成的綜合生態(tài)系統(tǒng)。Tesla平臺(tái)可為高性能計(jì)算專業(yè)人士提供所需的工具,使其能夠在數(shù)據(jù)中心輕松地打造、測(cè)試和部署加速的應(yīng)用。
當(dāng)前Tesla加速計(jì)算平臺(tái)的最新旗艦是Tesla K80雙GPU加速器,它可提供最快的數(shù)據(jù)分析和科學(xué)計(jì)算性能,被眾多對(duì)計(jì)算有較高要求的企業(yè)和研究機(jī)構(gòu)列為首選升級(jí)方案。Tesla K80擁有帶寬極高的24GB內(nèi)存、高達(dá)8.74TFlops的單精度峰值浮點(diǎn)性能和高達(dá)2.91 TFlops的雙精度峰值浮點(diǎn)性能。在數(shù)百款HPC應(yīng)用中,Tesla K80比當(dāng)今最快CPU快10倍。
得益于優(yōu)秀的性能表現(xiàn),Tesla K80已開(kāi)始在全球得到廣泛應(yīng)用。瑞士聯(lián)邦氣象氣候局利用基于Tesla K80的超級(jí)計(jì)算機(jī),將氣象模型解析度和能源使用效率分別提升到之前的兩倍和三倍。同時(shí),Tesla K80也在各項(xiàng)超算大賽中發(fā)揮重要優(yōu)勢(shì),幫助清華大學(xué)先后在今年ASC和ISC兩次超算大賽中獲得總冠軍。也因此讓Tesla GPU加速器公認(rèn)成為在超算大賽中獲得優(yōu)勝的首選加速方案。
作為能夠讓開(kāi)發(fā)人員輕松為應(yīng)用實(shí)現(xiàn)GPU加速的并行編程標(biāo)準(zhǔn),NVIDIA一直推動(dòng)其在HPC領(lǐng)域中的普及,并促進(jìn)其在更多的加速器平臺(tái)和CPU架構(gòu)上的應(yīng)用。目前全球已經(jīng)有超過(guò)8,000名研究人員在采用OpenACC。NVIDIA在今年推出的OpenACC工具包可以幫助開(kāi)發(fā)人員快速利用OpenACC實(shí)現(xiàn)應(yīng)用加速;在上月末推出的新增對(duì)x86多核CPU的OpenACC支持的新版PGI加速器編譯器,讓開(kāi)發(fā)者能夠?qū)贠penACC的源代碼進(jìn)行編譯,使其可以在多核CPU或GPU加速器上并行執(zhí)行,為開(kāi)發(fā)者帶來(lái)巨大的靈活性。