還有一個案例就是在網(wǎng)絡(luò)安全方面的應(yīng)用,此應(yīng)用采用深度學(xué)習(xí)技術(shù),用戶實現(xiàn)基礎(chǔ)的Python算法版本,我們幫助實現(xiàn)GPU的遷移與優(yōu)化,單個GPU計算,其性能比原來CPU基準(zhǔn)版本加速了90倍,采用四塊GPU并行,其性能是基準(zhǔn)CPU版本的270倍。
最后一個應(yīng)用案例是線上語音識別應(yīng)用,采用DNN深度神經(jīng)網(wǎng)絡(luò),幫助用戶把DNN從CPU平臺到FPGA平臺的遷移與優(yōu)化,1塊FPGA卡的性能相當(dāng)于兩塊CPU的2.8倍。功耗只有CPU的15.7%,性能功耗是CPU的18倍。
基于AI系統(tǒng)四個層次設(shè)計所面臨的挑戰(zhàn)和相應(yīng)解決方案,我們設(shè)計了整個AI端到端的解決方案,針對不同的數(shù)據(jù)源,如圖像、視頻、語音、文字等首先會送到我們CPU的處理平臺上面進行預(yù)處理,預(yù)處理完的數(shù)據(jù)我們會存放到共享存儲上去,然后GPU的集群訓(xùn)練平臺會從存儲里把訓(xùn)練數(shù)據(jù)并行讀取過來進行訓(xùn)練,整個訓(xùn)練平臺我們可以采用4 GPU、8 GPU或16 GPU BOX設(shè)備,在訓(xùn)練平臺我們會部署深度學(xué)習(xí)管理系統(tǒng)AIStation和天眼工具。訓(xùn)練完之后的生成的模型,將會加載到不同的計算設(shè)備上去,如P8000 GPU 工作站、FPGA卡、GPU AI云平臺進行推理識別的服務(wù)。最后實現(xiàn)各種智能結(jié)果。就是說我們整個AI端到端計算的解決方案。
鈦坦白群友互動
1.浪潮面向人工智能開發(fā)的計算平臺,如之前發(fā)布的GX-2,相對于其他的計算產(chǎn)品有什么特點?
張清:GX-2目前是全球最高密度的GPU服務(wù)器,他在2U的空間里可以插8塊GPU卡,既可以支持PCIE,而且還可以支持NVLINK 2.0。
2.浪潮的方案都是基于GPU,請問張總浪潮的人工智能平臺和其云計算解決方案或超融合架構(gòu)有何匹配及聯(lián)系?數(shù)據(jù)如何獲???硬件方面都是采用通用服務(wù)器?
張清:浪潮的方案在模型訓(xùn)練主要是GPU方案,推理我們還有FPGA方案。目前浪潮的人工智能平臺和其云計算解決方案或超融合架構(gòu)沒有對應(yīng)匹配及聯(lián)系。數(shù)據(jù)有些來自開源社區(qū)、有些來自客戶,還有些是公共平臺數(shù)據(jù)。硬件方面主要采用通用服務(wù)器,也有與用戶定制化開發(fā)的服務(wù)器,如SR-AI Rack.
3.公共數(shù)據(jù)平臺主要指?包含運營商等渠道吧?用戶是在平臺上沉淀的用戶數(shù)據(jù),應(yīng)該不會直面最終用戶吧?
張清:公共數(shù)據(jù)平臺主要是指浪潮的天元大數(shù)據(jù),有政府公開數(shù)據(jù)、聯(lián)盟伙伴數(shù)據(jù)、浪潮自有數(shù)據(jù)。用戶在平臺上沉淀的數(shù)據(jù)僅作為實驗使用,用戶實際場景的數(shù)據(jù)不會直面給其他最終用戶。
群友:相當(dāng)于應(yīng)用層能力開放,人工智能平臺聚合開發(fā)者做的應(yīng)用,然后用戶數(shù)據(jù)直接積累到平臺。
張清:嗯,用戶的實驗數(shù)據(jù)會積累到平臺。