“舊時王謝堂前燕, 飛入尋常百姓家?!笔翘拼娙藙⒂礤a《烏衣巷》中的句子,充分地表達(dá)了對時光力量的感嘆,就如同我們今天要談到的雙機集群容災(zāi)方案一樣,它已經(jīng)不再是企業(yè)信息化建設(shè)中的奢侈品,而是漸漸地走下神壇,開始融入到尋常企業(yè)之中。愛數(shù)無疑是這個進程中強有力的推動力。
摁下葫蘆起來瓢 容災(zāi)問題呈多元
目前的中國,正處在工業(yè)化、信息化的大潮中。經(jīng)過多年的發(fā)展,各大企事業(yè)單位的業(yè)務(wù)體系對IT系統(tǒng)產(chǎn)生了巨大的依賴,使得目前業(yè)務(wù)連續(xù)性需求和系統(tǒng)的穩(wěn)定性之間的矛盾成了IT建設(shè)中的首要矛盾。在這種矛盾的催化下,大量的容災(zāi)和容錯技術(shù)紛紛面世,比如雙機和集群技術(shù),它提供了一種較為快速和經(jīng)濟的方式解決這種矛盾。雙機集群方案的出現(xiàn)更大幅提升了業(yè)務(wù)系統(tǒng)的容錯性,但隨著時間的推移,傳統(tǒng)的雙機集群方案開始面臨諸如業(yè)務(wù)量的提高、業(yè)務(wù)連續(xù)性的需求增強、異地容災(zāi)能力缺乏、設(shè)備老化等方方面面的瓶頸,用戶不僅需要面對現(xiàn)有數(shù)據(jù)和業(yè)務(wù)系統(tǒng)得不到全面保護的問題,還需要面對如何針對現(xiàn)有的雙機/集群環(huán)境進行容災(zāi)保護的難題,摁下葫蘆起來瓢,頭疼問題接踵而來。
這時候你可能會想是不是還是傳統(tǒng)的災(zāi)備方案好,那我們就來回顧一下傳統(tǒng)災(zāi)備方案到底利好如何:
對容災(zāi)而言,應(yīng)用系統(tǒng)的穩(wěn)定性和數(shù)據(jù)的有效性是兩個重要因素。而在 IT 基礎(chǔ)設(shè)計建設(shè)的早期,人們在應(yīng)用系統(tǒng)的穩(wěn)定性上投入了更多的關(guān)注,因此傳統(tǒng)的雙機集群方案采用共享存儲作為數(shù)據(jù)載體。這樣一來,如果存儲服務(wù)器發(fā)生故障,則整個業(yè)務(wù)系統(tǒng)就會發(fā)生癱瘓。同時對于軟件本身的Bug、管理員誤操作、或者來自網(wǎng)絡(luò)的病毒以及木馬的襲擊等對存儲造成的邏輯錯誤,傳統(tǒng)的方案也缺乏有效的防范措施。
盡管大多數(shù)的雙機集群方案都使用了Raid 技術(shù),并有一定的定時備份保護,但依然無法完全克服共享存儲所帶來的存儲的單點故障和任意時刻數(shù)據(jù)可追溯性需求。因此,對傳統(tǒng)的雙機集群進行容災(zāi)保護,成了新的專注點。但由于雙機集群系統(tǒng)的特殊架構(gòu),容災(zāi)方案往往變得異常復(fù)雜且價格不菲。這對于中小型用戶而言望塵莫及,使得容災(zāi)方案的普及變得難上加難。
災(zāi)備一體稱王道 雙機集群吞入肚
這樣看來,如想讓“雙機集群容災(zāi)事,飛入尋常企業(yè)家”,就必須提出保證業(yè)務(wù)和數(shù)據(jù)安全的前提下,成本更加經(jīng)濟的容災(zāi)方案。最理想的方式是在原有的雙機方案基礎(chǔ)上進行升級,盡量不去改變用戶現(xiàn)有的網(wǎng)絡(luò)和存儲架構(gòu),最大限度地保證初期 IT 建設(shè)的成本不被浪費。這也正是愛數(shù)進行雙機集群容災(zāi)方案設(shè)計時最基本的出發(fā)點。
最利于操作和部署的雙機集群容災(zāi)方案,應(yīng)該是不需要生產(chǎn)服務(wù)器雙機及集群和容災(zāi)服務(wù)器型號完整一致,不用擔(dān)心后端存儲系統(tǒng)的兼容性問題,無需改變原有的網(wǎng)絡(luò)架構(gòu),只需在網(wǎng)絡(luò)中部署愛數(shù)備份存儲柜或愛數(shù)備份軟件,并在雙機集群中的每個服務(wù)器上安裝客戶端軟件,劃分相應(yīng)的存儲空間,部署相對簡單,而且能夠在 同一Web 界面上進行統(tǒng)一管理,大大降低了操作難度和管理成本。同時,新的故障檢測技術(shù)、CDP 技術(shù)的引入,該方案可以滿足較高的 RTO/RPO 的指標(biāo)要求,下面讓我們來簡單分析一下這個方案是如何工作的:
在生產(chǎn)服務(wù)器端,雙機集群系統(tǒng)將被視為一個有機的整體,任意一臺服務(wù)器在對外提供服務(wù)的時候,該機器上掛載的共享資源都會被客戶端程序?qū)崟r監(jiān)控,變化的數(shù)據(jù)會源源不斷地被輸送到愛數(shù)備份存儲柜或愛數(shù)備份軟件這個中間層中。同時基于源端的重復(fù)數(shù)據(jù)刪除技術(shù)不斷地精簡實時復(fù)制數(shù)據(jù),減少網(wǎng)絡(luò)傳輸量和存儲數(shù)據(jù)量。在愛數(shù)備份存儲柜或愛數(shù)備份軟件端,任何生產(chǎn)服務(wù)器上的發(fā)生變化的數(shù)據(jù)都將生成一個時間點,保證了任一時刻數(shù)據(jù)的可追溯性,實現(xiàn)了對存儲數(shù)據(jù)的 CDP 保護,能夠有效避免應(yīng)用邏輯錯誤,同時愛數(shù)獨有的時間點生成策略為用戶提供了個性化的數(shù)據(jù)存放方案,不但滿足了不用用戶對數(shù)據(jù)保存周期的需求,而且降低了空間使用率。
容災(zāi)服務(wù)器可部署在愛數(shù)備份存儲柜內(nèi)置的虛擬化平臺中,容災(zāi)存儲也是如此,這樣就無需增加額外的物理設(shè)備。除了 CDP 數(shù)據(jù)以外,容災(zāi)存儲上永遠(yuǎn)會保留一份最新的生產(chǎn)數(shù)據(jù),使得共享存儲端在發(fā)生故障時,該份數(shù)據(jù)可直接被使用系統(tǒng)使用。