NVIDIA今日發(fā)布了全新OpenACC工具套件,通過這款全新的套件,未來科學(xué)研究將可以做更多事情,并大幅提升計(jì)算效率。
雖然計(jì)算核心在短時間內(nèi)不會變得更快,但處理器的并行計(jì)算能力則越來越強(qiáng)大。這一趨勢在過去的十年里一直存在,而且還會持續(xù)下去。
OpenACC現(xiàn)已在HPC行業(yè)中得到廣泛支持,因?yàn)樗軌蚝喕疓PU等現(xiàn)代處理器的并行編程。自2011年Cray、PGI以及NVIDIA等領(lǐng)先的HPC供應(yīng)商推出OpenACC編程標(biāo)準(zhǔn)以來,如今已有8000多名研究人員和科學(xué)家采用了這一標(biāo)準(zhǔn)。
為了讓更多的研究人員享受到這一好處,NVIDIA宣布推出全新的OpenACC工具套件,它是一套免費(fèi)的多合一OpenACC并行編程工具。
學(xué)術(shù)界免費(fèi)使用
此次發(fā)布的OpenACC工具套件將讓用戶更快地實(shí)現(xiàn)OpenACC入門。如果你是一名研究人員,那么它幾乎可以提供你所需的一切,讓你能夠快速而輕松地對GPU進(jìn)行編程。
全新的OpenACC工具套件包含行業(yè)領(lǐng)先、用于Linux系統(tǒng)的PGI加速器Fortran/C語言工作站編譯器套裝軟件,該軟件支持OpenACC 2.0標(biāo)準(zhǔn)。NVIDIA將在該工具套件中首次向?qū)W術(shù)開發(fā)者和研究人員免費(fèi)提供這一編譯器,同時商業(yè)用戶可通過注冊獲得90天免費(fèi)試用版。
全新的OpenACC工具套件還包括NVProf Profiler工具,它可指導(dǎo)用戶在哪里添加 OpenACC“指令”或簡單的編譯器提示,以加速代碼。另外它還包含真實(shí)的代碼實(shí)例來幫助用戶快速入門。
一次編程、多平臺運(yùn)行
這些簡單的指令不僅僅讓研究人員能夠享受到加速計(jì)算的好處,同時還不會破壞現(xiàn)有的CPU代碼,不會浪費(fèi)之前所有代碼編寫所花費(fèi)的時間。
OpenACC的一大主要特性是高性能移植,而PGI OpenACC編譯器則把這一優(yōu)勢推向全新高度。該編譯器首次能夠在x86多核CPU和GPU上加速OpenACC代碼。
因此,當(dāng)你沒有一臺配備GPU的系統(tǒng)時,該編譯器會在多個x86 CPU核心上完成代碼并行化以便提升性能。當(dāng)系統(tǒng)中有GPU時,該編譯器將會針對GPU做代碼并行化的優(yōu)化,最終與多核CPU相比可帶來5~10倍的性能提升。
不到100行代碼帶來12倍速度提升
Janus Juul Eriksen是丹麥奧胡斯大學(xué)qLEAP中心的一位理論化學(xué)博士后,他發(fā)表了一篇關(guān)于OpenACC的應(yīng)用案例。在該案例中,他提到了一款名為LS-DALTON的應(yīng)用,該應(yīng)用主要用于復(fù)雜的大規(guī)模分子模擬。
他想要在基于GPU打造的Titan超級計(jì)算機(jī)上,利用LS-DALTON來模擬更大的科學(xué)難題。然而像許多研究人員一樣,Eriksen的Fortran編程技能是自學(xué)的,他并沒有在計(jì)算機(jī)科學(xué)這方面接受過正規(guī)教育。
但是借助OpenACC,他只用了短短數(shù)日、修改了不到100行代碼便使LS-DALTON中的關(guān)鍵算法比CPU版本快了12倍。而且他不需要更改應(yīng)用中的任何算法即可在一臺全球頂級的超級計(jì)算機(jī)上運(yùn)行這一應(yīng)用。
如果你有一款C語言或Fortran應(yīng)用并且想要使其在配備GPU的計(jì)算機(jī)系統(tǒng)上運(yùn)行,那么現(xiàn)在正是時候。