正如英偉達所言,這款產(chǎn)品會很受計算機用戶歡迎,他們對此很有信心,理由也很充分。Tesla P100 已經(jīng)成了神經(jīng)網(wǎng)絡程序員中的搶手貨,現(xiàn)在,研究人員們又有了適合工作站的顯卡。
與此同時,該產(chǎn)品的第二市場也是傳統(tǒng)的高端 CAD/CAE 市場。對于那些需要快速 FP64 性能和 ECC 存儲器的工作站顯卡(為了實現(xiàn)最大的精確性和可靠性)的特別用戶來說,Quadro GP100 是第一個自 K6000 后提供此種功能的 Quadro 顯卡??梢哉f,這是一個利基市場,因為幾乎所有的 CAD 用戶都不需要那種可靠性,但是,對于那些從事復雜工程模擬之類工作的用戶來說,這個產(chǎn)品非常具有吸引力(更別提這是英偉達的又一個利潤市場了)。滿足這一市場需求也讓 Quadro GP100 顯得與眾不同,因為這是唯一的一款開啟圖形功能的 GP100 顯卡。
不過,當涉及到圖形工作載荷時,Quadro GP100 和 P 6000 之間的區(qū)別就變得很模糊了。Quadro P6000 能夠達到 12Tflops 的 FP32,而 GP 100 的描述是「大于 10 Tflops」, 同樣 Quadro GP100 的紋理吞度量大約能達到這個數(shù)字的 83%。當然,紙面性能并非全部,但是,在純信號吞吐限制場景下,P6000 的速度會更快。這也是更加緊湊(以及可制造)GP102 較之龐大的 GP100 的優(yōu)勢所在。
這里,一個出其不意的設計是 HBM2 存儲器以及相關的 ROPs。英偉達正在專門兜售 Quadro GP100,在合適的適用場景下,能提供最快的詮釋性能。英偉達并沒披露 Quadro GP100 的官方存儲頻率,不過,如果類似 Tesla 對應的產(chǎn)品,那么,每秒達 720G,Quadro P6000 僅達每秒 432G。加上 ROP 計數(shù)上的優(yōu)勢——英偉達仍然沒有披露 GP100 的 ROP 計數(shù),不過,根據(jù)我們對 GP102 架構的了解,128ROP 的猜測是靠譜的——而且,Quadro GP100 純像素處理能力要比 P6000 強勁 60%。考慮到 CAD/CAE 任務非常依賴于像素處理能力,對于某些 Quadro 用戶來說,這是一個摸得到的優(yōu)點。
它的一個缺點是存儲容量。雖然由于 GDDR5X 更好的實際容量 Quadro P6000 能提供 VRAM 24 GB,但和所有的 GP100 產(chǎn)品一樣,Quadro GP 100 最多是 HBM2 16GB。
這意味著對大數(shù)據(jù)集用戶而言,單個 Quadro GP100 是好的選擇,只是比 P6000 能獲得的容量更小一點。值得一提的是,英偉達正在兜售 NVLink 幫助解決容量問題,但或許這種問題根植于計算,而非圖顯中。