国产福利小电影,国产网红无码福利在线播放 ,色窝窝午夜福利视频

免費(fèi)又好用 NVIDIA發(fā)布ACC編程工具套件

　　NVIDIA今日發(fā)布了全新OpenACC工具套件，通過這款全新的套件，未來科學(xué)研究將可以做更多事情，并大幅提升計(jì)算效率。

　　雖然計(jì)算核心在短時間內(nèi)不會變得更快，但處理器的并行計(jì)算能力則越來越強(qiáng)大。這一趨勢在過去的十年里一直存在，而且還會持續(xù)下去。

　　OpenACC現(xiàn)已在HPC行業(yè)中得到廣泛支持，因?yàn)樗軌蚝喕疓PU等現(xiàn)代處理器的并行編程。自2011年Cray、PGI以及NVIDIA等領(lǐng)先的HPC供應(yīng)商推出OpenACC編程標(biāo)準(zhǔn)以來，如今已有8000多名研究人員和科學(xué)家采用了這一標(biāo)準(zhǔn)。

　　為了讓更多的研究人員享受到這一好處，NVIDIA宣布推出全新的OpenACC工具套件，它是一套免費(fèi)的多合一OpenACC并行編程工具。

　　學(xué)術(shù)界免費(fèi)使用

　　此次發(fā)布的OpenACC工具套件將讓用戶更快地實(shí)現(xiàn)OpenACC入門。如果你是一名研究人員，那么它幾乎可以提供你所需的一切，讓你能夠快速而輕松地對GPU進(jìn)行編程。

　　全新的OpenACC工具套件包含行業(yè)領(lǐng)先、用于Linux系統(tǒng)的PGI加速器Fortran/C語言工作站編譯器套裝軟件，該軟件支持OpenACC 2.0標(biāo)準(zhǔn)。NVIDIA將在該工具套件中首次向?qū)W術(shù)開發(fā)者和研究人員免費(fèi)提供這一編譯器，同時商業(yè)用戶可通過注冊獲得90天免費(fèi)試用版。

　　全新的OpenACC工具套件還包括NVProf Profiler工具，它可指導(dǎo)用戶在哪里添加 OpenACC“指令”或簡單的編譯器提示，以加速代碼。另外它還包含真實(shí)的代碼實(shí)例來幫助用戶快速入門。

　　一次編程、多平臺運(yùn)行

　　這些簡單的指令不僅僅讓研究人員能夠享受到加速計(jì)算的好處，同時還不會破壞現(xiàn)有的CPU代碼，不會浪費(fèi)之前所有代碼編寫所花費(fèi)的時間。

　　OpenACC的一大主要特性是高性能移植，而PGI OpenACC編譯器則把這一優(yōu)勢推向全新高度。該編譯器首次能夠在x86多核CPU和GPU上加速OpenACC代碼。

　　因此，當(dāng)你沒有一臺配備GPU的系統(tǒng)時，該編譯器會在多個x86 CPU核心上完成代碼并行化以便提升性能。當(dāng)系統(tǒng)中有GPU時，該編譯器將會針對GPU做代碼并行化的優(yōu)化，最終與多核CPU相比可帶來5~10倍的性能提升。

　　不到100行代碼帶來12倍速度提升

　　Janus Juul Eriksen是丹麥奧胡斯大學(xué)qLEAP中心的一位理論化學(xué)博士后，他發(fā)表了一篇關(guān)于OpenACC的應(yīng)用案例。在該案例中，他提到了一款名為LS-DALTON的應(yīng)用，該應(yīng)用主要用于復(fù)雜的大規(guī)模分子模擬。

　　他想要在基于GPU打造的Titan超級計(jì)算機(jī)上，利用LS-DALTON來模擬更大的科學(xué)難題。然而像許多研究人員一樣，Eriksen的Fortran編程技能是自學(xué)的，他并沒有在計(jì)算機(jī)科學(xué)這方面接受過正規(guī)教育。

　　但是借助OpenACC，他只用了短短數(shù)日、修改了不到100行代碼便使LS-DALTON中的關(guān)鍵算法比CPU版本快了12倍。而且他不需要更改應(yīng)用中的任何算法即可在一臺全球頂級的超級計(jì)算機(jī)上運(yùn)行這一應(yīng)用。

　　如果你有一款C語言或Fortran應(yīng)用并且想要使其在配備GPU的計(jì)算機(jī)系統(tǒng)上運(yùn)行，那么現(xiàn)在正是時候。