對于高性能計算來說,制造是一方面,管理又是另外一方面。由于龐大的體積和超高的性能需求,超算的設(shè)計和制造難度可想而知。而另一方面,如何將超算系統(tǒng)內(nèi)部的數(shù)萬個CPU、PB級內(nèi)存、海量存儲以及無數(shù)的網(wǎng)絡(luò)接口有效的管理起來同樣是相當(dāng)大的考驗。而作為全球頂級高性能計算設(shè)備的制造商,浪潮在配套管理軟件同樣造詣頗深,而這其中的主流就是名為“天眼(Teye)”的超算集群管理軟件。
天眼(Teye)能夠提取高性能應(yīng)用程序在大規(guī)模集群上運行時對系統(tǒng)資源占用的情況,并實時反映應(yīng)用程序的運行特征,從而幫助用戶最大限度的在現(xiàn)有平臺挖掘應(yīng)用的計算潛力,進(jìn)而為系統(tǒng)的優(yōu)化、應(yīng)用程序的優(yōu)化以及應(yīng)用算法的調(diào)整改進(jìn)提供科學(xué)的指引方向。
目標(biāo)客戶及應(yīng)用領(lǐng)域:
高性能計算應(yīng)用開發(fā)、性能優(yōu)化、性能評估等領(lǐng)域,包括:
高性能應(yīng)用軟件開發(fā)者;
高性能應(yīng)用軟件優(yōu)化從業(yè)者;
高性能集群項目驗收系統(tǒng)性能評估人員;
高性能應(yīng)用軟件的性能評估人員和機構(gòu)
功能強大
可抓取40余項微架構(gòu)指標(biāo),極大的滿足高性能應(yīng)用調(diào)優(yōu)的需要
支持實時監(jiān)控集群節(jié)點CPU、MEM、Network、IO性能數(shù)據(jù),提供集群系統(tǒng)中應(yīng)用軟件隨時間變化的運行特征;
支持實時監(jiān)控集群節(jié)點CPU的單、雙浮點運算速度GFlops,X87浮點單元速度,SSE單元及AVX單元的實時運算速度;
支持實時監(jiān)控集群節(jié)點CPU的128bit SSE指令向量化率、256bit AVX指令向量化率、節(jié)點內(nèi)內(nèi)存讀、寫帶寬等數(shù)據(jù);
支持實時顯示所監(jiān)控的集群各節(jié)點的NFS文件系統(tǒng)的吞吐,以及總NFS吞吐流量;
支持實時監(jiān)控PCI-E設(shè)備與內(nèi)存間的數(shù)據(jù)交換帶寬。
完善的監(jiān)控數(shù)據(jù)管理系統(tǒng)
支持并實現(xiàn)與MySQL數(shù)據(jù)庫完美結(jié)合,方便并實現(xiàn)用戶對被監(jiān)測數(shù)據(jù)的數(shù)據(jù)庫化存儲及管理;
支持并提供MySQL數(shù)據(jù)庫數(shù)據(jù)導(dǎo)出工具,方便并實現(xiàn)用戶對數(shù)據(jù)的處理;
圖形化界面易于操作
軟件體積小,數(shù)據(jù)監(jiān)控及時、精確,系統(tǒng)資源占用率低,即使在系統(tǒng)重負(fù)載情況下,天眼對系統(tǒng)資源的需求量也遠(yuǎn)遠(yuǎn)不足千分之一,極大程度上保證了所反映的高性能應(yīng)用程序運行特征的真實性。此外,天眼軟件采用了可視化圖形界面。通過簡單的菜單和鼠標(biāo)的操作,各項微架構(gòu)指標(biāo)的數(shù)據(jù)會以圖表形式呈現(xiàn),一目了然。這使的大多數(shù)用戶,不需要復(fù)雜的培訓(xùn)也可以輕松上手應(yīng)用。