大數(shù)據(jù)已成為HPC最重要的應(yīng)用領(lǐng)域,戴爾PowerEdge FX2集刀片和多節(jié)點機(jī)架式服務(wù)器的技術(shù)優(yōu)勢于一身,不僅為用戶化解計算密度、空間占用、網(wǎng)絡(luò)布線的權(quán)衡之困,更令用戶輕松獲得頂級計算密度、存儲性能,以及超快網(wǎng)絡(luò)應(yīng)用。在之前的《從HPC到大數(shù)據(jù):戴爾-Intel Lustre存儲解決方案》一文中,我們曾經(jīng)談到用于高性能計算的文件系統(tǒng)已經(jīng)開始添加大數(shù)據(jù)(Hadoop)方面的支持。
如上圖,從中國超算Top100來看大數(shù)據(jù)已經(jīng)成為HPC最重要的應(yīng)用領(lǐng)域。
那么,大數(shù)據(jù)分析對高性能計算設(shè)備——服務(wù)器、存儲和網(wǎng)絡(luò)方面有什么新的要求嗎?在本文中我們?nèi)跃劢够A(chǔ)架構(gòu),為大家介紹上述領(lǐng)域的創(chuàng)新,包括幾款已經(jīng)或者即將發(fā)布的特色產(chǎn)品,以及真實的客戶案例。
HPC服務(wù)器進(jìn)化方向計算密度、GPU/協(xié)處理器
這張圖是戴爾服務(wù)器產(chǎn)品線在HPC計算單元中的布局,藍(lán)色箭頭最底下一行是通用節(jié)點,即標(biāo)準(zhǔn)化的1U/2U/4U服務(wù)器。上面則是HPC優(yōu)化型產(chǎn)品,最左邊的PowerEdge C4130是1U高度,支持4塊NVIDIA Tesla GPU或者Intel Xeon Phi co-processors計算加速卡;C6320則是比較典型的2U 4節(jié)點;安裝FC430節(jié)點高密度CPU的FX2是本文要討論的重點;再往右有M630刀片服務(wù)器;最右邊是定制的模塊化數(shù)據(jù)中心。
HPC應(yīng)用多為大規(guī)模集群部署,計算密度直接關(guān)系著空間占用,進(jìn)而影響到機(jī)房設(shè)計、網(wǎng)絡(luò)布線等方面。早期的計算能力基本上是堆CPU;后來隨著GPU/協(xié)處理器在通用計算領(lǐng)域的應(yīng)用,算是第二個設(shè)計方向。當(dāng)然后者還要特別考慮編程和效率的問題。
本文討論重點之一就是提高HPC的CPU計算密度。
服務(wù)器形態(tài)進(jìn)化來自Dell的極限密度
回首當(dāng)年,服務(wù)器從機(jī)架式衍生出刀片式,不僅提高了計算密度,集成了網(wǎng)絡(luò)交換單元,還可以集成共享存儲單元(DAS或者iSCSI刀片存儲模塊)。刀片最大的優(yōu)勢是管理,能降低運維工作量。
曾經(jīng)有一段時間,連超大型HPC集群都開始選擇刀片式服務(wù)器。不過一方面它在同等計算能力下的成本要高于機(jī)架式服務(wù)器,另一方面它的計算密度還有沒有可能再提高?
于是在數(shù)年前,開始出現(xiàn)一些多節(jié)點機(jī)架式服務(wù)器,比如1U雙節(jié)點、2U四節(jié)點——被人們稱為雙子星和四子星。在保持刀片計算密度的同時,成本上顯著降低,加上機(jī)架空間的節(jié)省,TCO比傳統(tǒng)機(jī)架式服務(wù)器還要低,因此受到一些云計算和HPC用戶的青睞,比如戴爾PowerEdge C系列中的C6320。
多節(jié)點機(jī)架式服務(wù)器中目前最流行的就是2U四節(jié)點,門檻不高(自己做不了的品牌可以找ODM供應(yīng)商)。與刀片相比,它們沒有集成網(wǎng)絡(luò)交換和強(qiáng)大的管理功能;與機(jī)架式相比,它們的存儲和I/O擴(kuò)展性一般;為了優(yōu)先考慮成本,品質(zhì)上就可能有所取舍。
當(dāng)我們看到戴爾PowerEdge FX2時,第一印象是它集合了刀片和多節(jié)點機(jī)架式服務(wù)器的技術(shù)優(yōu)勢。首先是計算密度——2U內(nèi)最多可以支持8個雙插槽Xeon CPU節(jié)點;其次是靈活性——可選多種服務(wù)器節(jié)點;還有擴(kuò)展性——包括可拆分的DAS存儲節(jié)點、多種網(wǎng)絡(luò)直通/交換模塊;以及CMC機(jī)箱集中式管理。
戴爾PowerEdge FX2組件全家福
以上是PowerEdge FX2模塊化系統(tǒng)支持的組件,這里除了服務(wù)器節(jié)點、還包括存儲單元和網(wǎng)絡(luò)交換模塊(I/O聚合器)。圖中的數(shù)量比較多,是因為每種型號還有不同的硬盤/SSD驅(qū)動器托架可選。
正是這種靈活性,使FX2可以有多種應(yīng)用方向,比如我們在《硬件輔助超融合:任意云中的全閃存VSAN》一文中介紹的分布式存儲/超融合。而本文既然是談HPC,自然是討論計算密度最高的FC430。
使用當(dāng)前Intel Xeon處理器的FX2 w/FC430,計算性能密度可達(dá)業(yè)界領(lǐng)先的4.1TFLOPS/U