當(dāng)混合云成為普遍選擇時(shí),企業(yè)IT資源的統(tǒng)一管理就會(huì)成為一個(gè)新的挑戰(zhàn)。例如,企業(yè)經(jīng)常需要面對(duì)下面幾個(gè)問題:
◆如何統(tǒng)一管理公有云主機(jī)、私有云主機(jī)和物理機(jī)?
◆如何以應(yīng)用視角管理基礎(chǔ)設(shè)施?
◆如何集成云API,實(shí)現(xiàn)自動(dòng)伸縮?
新型IT運(yùn)維管理體系只有解決以上幾個(gè)基本問題才能實(shí)現(xiàn)對(duì)于不同來源基礎(chǔ)設(shè)施進(jìn)行標(biāo)準(zhǔn)化無差別管理,同時(shí)也充分發(fā)揮IaaS平臺(tái)帶來的彈性基礎(chǔ)設(shè)施的優(yōu)勢。
問題二:DevOps成為新常態(tài)后,如何真正實(shí)現(xiàn)持續(xù)部署和交付
如前所述,現(xiàn)如今IT系統(tǒng)的交付周期越來越短。而且還需要在持續(xù)交付的過程中保證服務(wù)的高可用和性能的高穩(wěn)定。但是,整個(gè)IT系統(tǒng)的持續(xù)部署和交付需要一個(gè)較長的流程來保障。例如,下圖就是一個(gè)典型的從代碼到最終服務(wù)的流程。
在這過程中,阻礙整個(gè)持續(xù)交付流程順利進(jìn)行下去的常見問題有:
◆如何建立統(tǒng)一的Artifact倉庫?
◆如何保證測試環(huán)境和生產(chǎn)環(huán)境的一致性?
◆如何在部署后實(shí)現(xiàn)快速反饋?
企業(yè)在實(shí)施IT持續(xù)交付過程中經(jīng)常會(huì)因?yàn)槲唇鉀Q以上常見問題而導(dǎo)致最終的持續(xù)交付流程流于形式,未能達(dá)到支持業(yè)務(wù)創(chuàng)新的目標(biāo)。
問題三:IT服務(wù)能力成為企業(yè)核心競爭力后,如何高效運(yùn)維管理越來越龐大的IT系統(tǒng)
隨著互聯(lián)網(wǎng)+浪潮的逐步深入推進(jìn),企業(yè)IT系統(tǒng)承載的業(yè)務(wù)會(huì)越來越多,也越來越重要。這也意味著需要更高效的運(yùn)維方式管理越來越龐大的IT系統(tǒng),尤其是需要管理日益增多的虛機(jī)。同樣來自于RightScale 2015年的報(bào)告,大部分企業(yè)的虛機(jī)數(shù)量已經(jīng)超過50臺(tái)(如下圖)。
一般來說,超過50臺(tái)虛機(jī)的規(guī)模意味著傳統(tǒng)手工運(yùn)維管理已經(jīng)很難保證效率和質(zhì)量。這時(shí)企業(yè)就會(huì)在日常運(yùn)維管理中,遇到以下常見的問題:
◆如何同時(shí)給1000臺(tái)虛機(jī)打補(bǔ)丁?
◆如何實(shí)現(xiàn)端到端的監(jiān)控?
◆如何實(shí)現(xiàn)故障自動(dòng)修復(fù)?
要解決企業(yè)IT系統(tǒng)規(guī)模增加帶來的運(yùn)維挑戰(zhàn),自動(dòng)化成為現(xiàn)代運(yùn)維管理系統(tǒng)普遍的選擇。這其中就包括自動(dòng)化構(gòu)建、自動(dòng)化測試,自動(dòng)化部署、自動(dòng)化修復(fù)等一系列最佳實(shí)踐。
三、新常態(tài)下的IT運(yùn)維管理解決方案
針對(duì)IaaS和DevOps成為新常態(tài)下的IT運(yùn)維管理需求,傳統(tǒng)以ITIL為標(biāo)準(zhǔn)的ITOM管理軟件及相關(guān)運(yùn)維管理實(shí)踐已經(jīng)無法適用??朔@些問 題,除了需要新的理念,新的組織架構(gòu),也同樣期待新型的統(tǒng)一云管理平臺(tái)(Cloud Management Platform,CMP),這個(gè)平臺(tái)需要具備如下幾個(gè)方面的能力:
◆管理平臺(tái)能夠統(tǒng)一管理不同來源的IT基礎(chǔ)設(shè)施,解決企業(yè)IT基礎(chǔ)設(shè)施碎片化的問題。同時(shí)需要深度對(duì)接主流IaaS平臺(tái),響應(yīng)企業(yè)業(yè)務(wù)對(duì)于新型IaaS的需求。
◆管理平臺(tái)需要以應(yīng)用為核心構(gòu)建整個(gè)管理體系,而不再是以管理IT基礎(chǔ)設(shè)施為核心。無論是IT資源的組織方式、服務(wù)監(jiān)控告警的展示方式,還是各種日常運(yùn)維的操作和部署都需要從應(yīng)用的角度設(shè)計(jì)。
◆管理平臺(tái)需要提供一站式的全棧工具鏈集成能力,讓開發(fā)、測試和運(yùn)維人員都能在其上對(duì)于一個(gè)應(yīng)用進(jìn)行協(xié)作和管理。并且,這個(gè)平臺(tái)還需要能夠構(gòu)建應(yīng)用的全面反饋體系(需要全面的自動(dòng)化測試和監(jiān)控),并基于這個(gè)反饋體系實(shí)現(xiàn)整個(gè)工具鏈的自動(dòng)化。
對(duì)于企業(yè)級(jí)用戶來說,選型統(tǒng)一的云管理平臺(tái)也就需要充分考慮以上這些要素。具體實(shí)施來說,企業(yè)可以有以下幾種可能途徑:
◆基于IaaS平臺(tái)控制臺(tái)及相關(guān)管理類服務(wù)搭建。這種方式是企業(yè)用戶最容易上手的途徑,尤其是在企業(yè)IaaS供應(yīng)商非常單一的情況下可以很快有初步結(jié)果。但是這個(gè)途徑的最大風(fēng)險(xiǎn)在于會(huì)被某一個(gè)IaaS供應(yīng)商所鎖定(lock-in)。越深入的使用云供應(yīng)商的管理服務(wù)就會(huì)越深的被它鎖定。
◆基于開源軟件完全自建。自建自己的統(tǒng)一云管理平臺(tái)對(duì)于很多企業(yè)用戶非常有吸引力,尤其是在開源軟件如此豐富的今天。如果選擇自建云管理平臺(tái)(尤其是直接利用開源軟件搭建)時(shí),企業(yè)用戶要非常注意傳統(tǒng)平臺(tái)經(jīng)常會(huì)出現(xiàn)的“煙囪效應(yīng)”,即不同應(yīng)用場景下使用的工具完全不一樣,且相互的信息無法打通。例如,運(yùn)維管理平臺(tái)最基礎(chǔ)的CMDB層應(yīng)該在監(jiān)控、運(yùn)維以及代碼部署等很多運(yùn)維場景中復(fù)用,以便始終保持?jǐn)?shù)據(jù)的一致性,降低運(yùn)維維護(hù)負(fù)擔(dān)。但是常見的開源軟件基本是以單一場景出發(fā),并未提供一體化解決方案,所以需要用戶自身來完成相關(guān)整合工作。另外,企業(yè)最好還要評(píng)估自建平臺(tái)的成本及收益,做到有的放矢。