早在2011年1月,NVIDIA就宣布將基于64位ARM指令集自主研發(fā)的處理器架構(gòu),和自家GPU組成完整的平臺(tái),但三年間幾乎沒(méi)有任何細(xì)節(jié)披露。在2013年英偉達(dá)(Nvidia)GTC活動(dòng)上,英偉達(dá)(Nvidia)已經(jīng)透露出基于“Denver”項(xiàng)目的首款商用芯片Parker預(yù)計(jì)2015年上市,該產(chǎn)品將搭載2014年版Maxwell GPU以及全新的64位定制化ARM處理器。
近日HOT CHIP大會(huì)上,英偉達(dá)(Nvidia)揭開(kāi)其定制化64位ARM核心處理器神秘面紗,這款代號(hào)“丹佛(Denver)”的處理器采用微指令(microcode)架構(gòu),具備新一代執(zhí)行優(yōu)化功能。
Android平臺(tái)產(chǎn)品
該款Nvidia預(yù)定在今年推出的是Tegra K1升級(jí)版雙核心處理器,主要是針對(duì)平板設(shè)備應(yīng)用,32位版本Tegra K1目標(biāo)應(yīng)用是Android平臺(tái)產(chǎn)品。Nvidia聲稱,64位的Tegra K1將可讓移動(dòng)設(shè)備具備PC等級(jí)的性能,支持游戲、企業(yè)應(yīng)用等,基準(zhǔn)測(cè)試數(shù)據(jù)顯示Denver效能與英特爾Haswell處理器相當(dāng),且超越蘋果A7系列處理器10~25%。
配備64位ARM通用核心的GPU
不過(guò)Nvidia并沒(méi)有提供Denver與ARM的標(biāo)準(zhǔn)64位A57核心之性能比較。而在針對(duì)服務(wù)器與網(wǎng)絡(luò)設(shè)備應(yīng)用,AMD已經(jīng)開(kāi)始提供采用A57核心的處理器樣品,而Applied Micro也推出了定制化64位ARM核心的樣品,英偉達(dá)在64位方面并沒(méi)有提供相關(guān)信息。
Nvidia GPU路線圖(來(lái)源eetimes網(wǎng)站)
對(duì)于英偉達(dá)而言,下一代顯卡核心架構(gòu)Maxwell是重點(diǎn),是英偉達(dá)名為“丹佛計(jì)劃”的一個(gè)關(guān)鍵項(xiàng)目,而其中最為重要的是Maxwell將是第一個(gè)配備64位ARM通用核心的GPU核心,據(jù)悉計(jì)劃在2014年推出Maxwell將支持可GPU與ARM CPU之間共享虛擬內(nèi)存的能力。
但是,因?yàn)槿狈?biāo)準(zhǔn)與定制化64位ARM核心處理器的性能測(cè)試比較數(shù)據(jù),Denver能否提升在移動(dòng)設(shè)備應(yīng)用領(lǐng)域的份額尚不明朗,在該領(lǐng)域落后Qualcomm。
第2頁(yè):Denver處理器核心架構(gòu)
基于“Denver”項(xiàng)目Nvidia芯片產(chǎn)品細(xì)節(jié)并未透露過(guò)多,但從發(fā)展藍(lán)圖的一些愿景,英偉達(dá)下一重大市場(chǎng)動(dòng)作是即將推出Logan,這款Tegra 5 SoC將針對(duì)智能手機(jī)和平板電腦的芯片中整合Kepler GPU,首個(gè)基于ARM SoC支持其CUDA軟件環(huán)境,CUDA并行運(yùn)算原本僅用于基于x86服務(wù)器和超級(jí)計(jì)算機(jī)中。
Tegra K1處理器
從現(xiàn)有資料了解,NVIDIA最新公開(kāi)的Tegra K1雙核處理器,采用兩組Denver處理器心、64位ARMv8架構(gòu)、最多能執(zhí)行7個(gè)指令集,最高運(yùn)作頻率2.5GHz,128+64KB L1高速緩存令,除了能支持更多RAM的數(shù)目外,整體效能也大幅提高,而且兩款處理器的針腳亦相互兼容。
同時(shí),Tegra K1 Denver處理器同樣內(nèi)建 NVIDIA Kepler架構(gòu)的192 CUDA核心GPU,其功耗表現(xiàn)卻與上代產(chǎn)品相同,特別圖像處理器性能上優(yōu)化。此外,Cahce方面其整合128KB及64K的一級(jí)指令及數(shù)據(jù)緩存,并加入2MB二級(jí)緩存,相對(duì)32bit版本效能倍級(jí)提升。
與此同時(shí),最新Denver架構(gòu)中加設(shè)Dynamic Code Optimization技術(shù),主要常用將應(yīng)用程序軟件優(yōu)化并轉(zhuǎn)譯,提升指令的執(zhí)行效率。據(jù)NVIDIA表示,該優(yōu)化程序鏈結(jié)了相關(guān)的例行程序(routines),并應(yīng)用了128MB的主存儲(chǔ)器,在操作系統(tǒng)開(kāi)機(jī)之前進(jìn)行安全分割,優(yōu)化程序可帶來(lái)兩倍以上的速度提升。
如果Denver真是一個(gè)代碼融合/模擬CPU產(chǎn)品,那么64位版本的Tegra K1將是一個(gè)全新的芯片。事實(shí)上,ARM仍持續(xù)尋求混合搭配32位與64位核心的解決方案。作為英偉達(dá)尚未指定應(yīng)用市場(chǎng)領(lǐng)域,盡管Denver的特點(diǎn)包括重復(fù)使用內(nèi)存管線(pipeline)以統(tǒng)整流量,以及可補(bǔ)償高速緩存遺漏的預(yù)先擷取(pre-fetch)功能,但無(wú)論是移動(dòng)或服務(wù)器產(chǎn)品上,芯片仍然需進(jìn)行大量的測(cè)試和優(yōu)化。
Tegra K1預(yù)計(jì)將在2014年下半年上市。