AMD云計(jì)算的自我實(shí)踐
當(dāng)前,云計(jì)算已經(jīng)不僅僅是人們熱議的話題,而且已經(jīng)得到越來越多的應(yīng)用。作為全球領(lǐng)先的半導(dǎo)體廠商,AMD公司擁有業(yè)界領(lǐng)先的APU、CPU和GPU的技術(shù)與產(chǎn)品,能夠提供從云服務(wù)器到云終端的全線產(chǎn)品解決方案。另一方面,AMD在云計(jì)算的部署方面身先士卒。AMD創(chuàng)建了一個(gè)私有云,以此來提高自身的生產(chǎn)力,改善的資源的獲取能力,節(jié)省相關(guān)的成本,以及保持在業(yè)界創(chuàng)新者的地位。其在云計(jì)算方面的自我實(shí)踐很具有借鑒意義。

AMD是一家擁有創(chuàng)新傳統(tǒng)的半導(dǎo)體設(shè)計(jì)公司,它的各種創(chuàng)新技術(shù)打造了現(xiàn)代計(jì)算的新面目。隨著云計(jì)算的興起,AMD再度擔(dān)當(dāng)了技術(shù)領(lǐng)導(dǎo)者的角色,引領(lǐng)著新一代高能效多核處理器的技術(shù)潮流,正在為全世界的云計(jì)算部署奠定基石。
AMD面臨復(fù)雜性挑戰(zhàn)
設(shè)計(jì)半導(dǎo)體是一項(xiàng)復(fù)雜的工程任務(wù),需要耗費(fèi)巨大的計(jì)算能力。對(duì)于AMD來說,這種計(jì)算能力必須能被遍及全球、多學(xué)科的AMD 工程師輕松、充分地獲取。為此,AMD曾構(gòu)建眾多系統(tǒng)集群來滿足計(jì)算能力需求,包括部署超過15,000 臺(tái)服務(wù)器。這些服務(wù)器上安裝著版本多樣的操作系統(tǒng)與文件系統(tǒng),以及千差萬別的存儲(chǔ)管理與集群軟件。隨著每年基礎(chǔ)設(shè)施規(guī)模擴(kuò)大20-30%, 軟硬件升級(jí)幾乎時(shí)刻不能停頓。
然而,“復(fù)雜性”的挑戰(zhàn)還不止于硬件的操作系統(tǒng)。數(shù)據(jù)的管理與遷移同樣問題重重。由于設(shè)施遍布全球并且互不相連,AMD不得不在各站點(diǎn)之間復(fù)制大型數(shù)據(jù)集。因此,在一個(gè)給定地點(diǎn)建立起可用的項(xiàng)目數(shù)據(jù),可能需要花費(fèi)數(shù)周時(shí)間。
項(xiàng)目一旦開展起來,還會(huì)遇到新的障礙。測(cè)試半導(dǎo)體設(shè)計(jì),需要獲取成千上萬個(gè)計(jì)算核心。然而,為了避免資源浪費(fèi),任何一個(gè)AMD設(shè)施都不會(huì)過度配置。為了完成測(cè)試并符合AMD嚴(yán)格的產(chǎn)品標(biāo)準(zhǔn),工程師們不得不見縫插針地安排時(shí)間,排隊(duì)等待在可用的機(jī)器上運(yùn)行測(cè)試。一方面,AMD 所擁有的服務(wù)器總數(shù)超出所需,另一方面,哪怕在很短時(shí)間內(nèi),將充足的計(jì)算能力轉(zhuǎn)向某個(gè)特定項(xiàng)目組,都很難做到。簡(jiǎn)言之,AMD已具備巨大的計(jì)算能力,但無法滿足靈活性、可管理性、可獲取性、成本效率的要求。