故障率低于業(yè)界15%,阿里質(zhì)量大獎與騰訊最佳供應(yīng)商榮耀加持,通過FMEA、HALT與EMC等高大上測試的檢驗,這一切描述的是華為服務(wù)器。
憑借創(chuàng)新、可靠、安全、開放四大原則,華為服務(wù)器秉持“持續(xù)創(chuàng)新 讓計算變簡單”的理念,連續(xù)7個季度出貨量排在全球第四,覆蓋金融、政府、互聯(lián)網(wǎng)服務(wù)提供商與大企業(yè)。
華為服務(wù)器擁有穩(wěn)定可靠、綠色節(jié)能、性能領(lǐng)先、持續(xù)創(chuàng)新和基于業(yè)務(wù)優(yōu)化的特點,為企業(yè)關(guān)鍵業(yè)務(wù)保駕護航。這是如何做到的呢?
設(shè)計:精益求精
在華為看來,高質(zhì)量、高可靠性的服務(wù)器是設(shè)計出來的。例如獲得挑剔的日本客戶認(rèn)可的華為FusionServer RH8100 V3關(guān)鍵業(yè)務(wù)服務(wù)器,憑借創(chuàng)新的高可靠性設(shè)計、靈活擴展能力和卓越的計算性能,在Interop展上贏得了“BestofShowAward”大獎。它采用RAS2.0技術(shù),包括電源、風(fēng)扇等關(guān)鍵模塊的熱插拔技術(shù)、全冗余的硬件和軟件設(shè)計架構(gòu),以及提升管理維護效率的“黑匣子”等。
華為FusionServer RH8100 V3
同時,使用高可靠硬盤設(shè)計,實現(xiàn)服務(wù)器內(nèi)存和硬盤的自動裝配,減少內(nèi)存、硬盤人工裝配引發(fā)問題的幾率。再如華為刀片服務(wù)器E9000采用無源背板設(shè)計,進(jìn)一步提升可靠性,避免單點故障,同時使用獨立風(fēng)道設(shè)計,耐40度高溫,有效地保障了企業(yè)用戶關(guān)鍵業(yè)務(wù)的連續(xù)性。
材料:精挑細(xì)選
服務(wù)器的用材決定著服務(wù)器的品質(zhì)。這不僅僅是外表的健美結(jié)實,也包括強勁的內(nèi)涵。
華為每一臺服務(wù)的材質(zhì)都采用電信級器件,質(zhì)量等級高于業(yè)界標(biāo)準(zhǔn)。同時,堅持被集成戰(zhàn)略,利用EMS(電子制造服務(wù))廠商實現(xiàn)產(chǎn)品設(shè)計、代工生產(chǎn)、后勤管理、產(chǎn)品維修等服務(wù)。
為了掌控整個流程,華為實現(xiàn)嚴(yán)密的稽核制度,不定期稽核供應(yīng)商,并派駐全職駐廠稽核人員。實時監(jiān)控EMS廠質(zhì)量數(shù)據(jù),如質(zhì)量數(shù)據(jù)異常會及時處理。特別是在硬盤與內(nèi)存這種容易出錯的領(lǐng)域,華為會將報錯較多的問題讓供應(yīng)商進(jìn)行出廠前測試,逆向推動供應(yīng)商改進(jìn)產(chǎn)品質(zhì)量。
此外,采用器件降頻設(shè)計。主要實現(xiàn)高頻的配件以較低的頻率工作,從而達(dá)到穩(wěn)定工作的目的,解決頻率過高帶來高發(fā)熱和系統(tǒng)不穩(wěn)定的問題。主要作用是省電,實現(xiàn)節(jié)能減排,還能減少維護工作。
質(zhì)量:固若金湯
有一個水桶,它是由許多塊木板箍成的,盛水量也是由這些木板共同決定。如果其中一塊木板很短,則盛水量就被短板所限制,這就是我們所熟知的短板理論。
HALT(highly accelerated life testing,高加速壽命試驗)由美國軍方延伸出的一種設(shè)計質(zhì)量驗證與制造質(zhì)量驗證的試驗方法,主要用于產(chǎn)品研發(fā)設(shè)計階段,對于暴露產(chǎn)品的潛在缺陷效果明顯,是設(shè)計工程師提高產(chǎn)品可靠性的重要實驗手段。
華為引入HALT測試,利用包括振動、高低溫、溫度循環(huán)、電力開關(guān)循環(huán)、電壓邊際及頻率邊際測試等階梯應(yīng)力,高效激發(fā)產(chǎn)品可靠性潛在缺陷,識別產(chǎn)品的短木板,將設(shè)計問題在研發(fā)階段暴露,發(fā)現(xiàn)產(chǎn)品缺陷、操作設(shè)計邊際以及結(jié)構(gòu)強度極限的方法,涉及到線路設(shè)計、工藝、元部件與結(jié)構(gòu)等方面。它將原來需要花費一年的新產(chǎn)品可靠性實驗縮短到一周,所發(fā)現(xiàn)的產(chǎn)品問題與客戶應(yīng)用后所發(fā)現(xiàn)的問題一致,是華為新產(chǎn)品上市前所必需通過的驗證。
不僅如此,華為還采用FMEA(Failure Mode and Effects Analysis,失效模式與影響分析)這種可靠性設(shè)計方法,發(fā)現(xiàn)、評價產(chǎn)品或過程中潛在的失效及其后果,找到能夠避免或減少潛在失效發(fā)生的措施并且不斷地完善。能夠以低成本對產(chǎn)品或過程進(jìn)行修改,并找到能夠避免或減少這些潛在失效發(fā)生的措施。
為此,華為專門成立一個FMEA團隊,包括生產(chǎn)總監(jiān)、工藝工程師、產(chǎn)品工程師、測試工程師、質(zhì)量工程師、材料采購員以及項目經(jīng)理,由質(zhì)量工程師領(lǐng)導(dǎo)該團隊。從而搭建相應(yīng)的失效分析平臺,配備適當(dāng)?shù)姆治龉ぞ摺?/p>
當(dāng)產(chǎn)品在HALT實驗中出現(xiàn)故障時,分析并確定產(chǎn)品出現(xiàn)故障的根本原因及影響,優(yōu)化故障管理能力。對于嚴(yán)重故障,要求避免。對于需要處理的故障,要求能檢測并定位到FRU((field-replaceable unit,現(xiàn)場置換單元),讓用戶或技術(shù)員快速輕松地拆下電路板或零件并重新安裝,使系統(tǒng)停止運轉(zhuǎn)的時間減少到最小并且使系統(tǒng)可靠性達(dá)到最優(yōu)。