災(zāi)備系統(tǒng)的有效性問(wèn)題涉及到災(zāi)備建設(shè)的實(shí)際目標(biāo)和符合目標(biāo)的災(zāi)備技術(shù)路線,清楚認(rèn)識(shí)災(zāi)備系統(tǒng)的有效性問(wèn)題人們必須領(lǐng)悟到一個(gè)更深層次的道理:災(zāi)備系統(tǒng)的建設(shè)要求災(zāi)難防御全方位,不能只防小概率的自然災(zāi)害,更要防止概率大的設(shè)備故障和邏輯故障,嚴(yán)密的多方位防護(hù)網(wǎng)才是取勝之道。
建設(shè)一個(gè)永不失效的災(zāi)難防御體系,需要踏踏實(shí)實(shí)地從以下四個(gè)方面著手:
1) 防御災(zāi)難的目標(biāo)要細(xì)化
不能僅籠統(tǒng)的說(shuō)大災(zāi)防御,而對(duì)于各種設(shè)備和網(wǎng)絡(luò)的易發(fā)事故卻缺少針對(duì)性,甚至于認(rèn)為備份系統(tǒng)就已經(jīng)完成了這類防御目標(biāo),這只能說(shuō)繼續(xù)走著傳統(tǒng)失靈的眾多災(zāi)備建設(shè)的老路。在一些傳統(tǒng)的早期災(zāi)備系統(tǒng)建設(shè)中,的的確確只有大災(zāi)的應(yīng)急機(jī)制,而根本沒(méi)有把頻發(fā)的故障列入防御目標(biāo),這本身已經(jīng)造成了我國(guó)許多災(zāi)備建設(shè)的資金浪費(fèi),導(dǎo)致必須推到重建災(zāi)備系統(tǒng),或者重復(fù)投資建立更高級(jí)的防護(hù)體系。在信息系統(tǒng)的安全事故中,比較容易導(dǎo)致災(zāi)備體系不作為的事故往往是:數(shù)據(jù)庫(kù)系統(tǒng)癱瘓無(wú)法運(yùn)行、數(shù)據(jù)文件損壞或者丟失、存儲(chǔ)設(shè)備故障等等。在我國(guó),已經(jīng)有多個(gè)企業(yè)領(lǐng)教了這類故障的破壞力。
2) 建設(shè)分層次的恢復(fù)體系
人們往往認(rèn)為,建設(shè)異地災(zāi)備中心就是什么故障都在異地運(yùn)行或者恢復(fù)。這著實(shí)是一個(gè)特大的誤區(qū)。人們必須知道,建設(shè)異地災(zāi)備中心只能防御大災(zāi)。啟用異地災(zāi)備中心,不僅要經(jīng)過(guò)嚴(yán)格的業(yè)務(wù)連續(xù)性流程的審核(例如預(yù)警機(jī)制和宣告機(jī)制),而且要?jiǎng)佑么罅康臑?zāi)備中心處理人員,數(shù)據(jù)向生產(chǎn)中心的恢復(fù)也是復(fù)雜而漫長(zhǎng)的過(guò)程。而部分災(zāi)備技術(shù)路線無(wú)法保證啟動(dòng)的應(yīng)用系統(tǒng)的數(shù)據(jù)一致性和完整性,這也是很多完成建設(shè)的企業(yè)一般不啟動(dòng)災(zāi)備中心或者恐懼災(zāi)備中心啟動(dòng)的重要原因。而各類易發(fā)的故障(例如邏輯故障、設(shè)備故障),如果其恢復(fù)依賴在災(zāi)備中心的啟動(dòng)和修復(fù)上,無(wú)疑是風(fēng)險(xiǎn)放大、家丑外揚(yáng)之舉,恢復(fù)的效果也根本無(wú)法預(yù)料。這就是故障發(fā)生后,災(zāi)備系統(tǒng)不作為的眾多因素之一。
怎么辦? 根本解決就在于啟動(dòng)先進(jìn)的災(zāi)備技術(shù)路線,完成分層次的恢復(fù)體系,就是設(shè)備故障(包括邏輯故障)本地修復(fù)、系統(tǒng)災(zāi)難異地啟動(dòng)這十四字方針。
目前,部分先進(jìn)的災(zāi)備技術(shù)(如飛康的持續(xù)數(shù)據(jù)保護(hù)災(zāi)備技術(shù))具備瞬間的本地修復(fù)能力,這樣,就可以在極短的時(shí)間完成設(shè)備故障的應(yīng)急響應(yīng)(一般甚至于可以達(dá)到幾秒鐘)。對(duì)于業(yè)務(wù)體系而言,業(yè)務(wù)連續(xù)性的保證化解了內(nèi)部故障帶來(lái)的可能造成的巨大社會(huì)風(fēng)險(xiǎn)和經(jīng)濟(jì)風(fēng)險(xiǎn)(例如大量的索賠等)
3) 修復(fù)技術(shù)采用先驗(yàn)證技術(shù)
以往,人們認(rèn)識(shí)的修復(fù)技術(shù)往往是“回存” 技術(shù),就是要把備份數(shù)據(jù)介質(zhì)倒回生產(chǎn)系統(tǒng)中,然后等待恢復(fù)的效果和業(yè)務(wù)的啟動(dòng),這種技術(shù)存在眾多風(fēng)險(xiǎn)。首先是在漫長(zhǎng)的數(shù)據(jù)恢復(fù)之前,完全無(wú)法預(yù)料恢復(fù)時(shí)間和恢復(fù)可靠性。其次,一旦恢復(fù)成功,卻發(fā)現(xiàn)恢復(fù)的數(shù)據(jù)并非自己需要的時(shí)間點(diǎn),或者需要的數(shù)據(jù)不存在,這已完全無(wú)法回退到初始狀態(tài),系統(tǒng)將進(jìn)入更為嚴(yán)重的不可控狀態(tài)。在這類技術(shù)中,業(yè)務(wù)連續(xù)性根本就不在考慮范圍,人們盼著數(shù)據(jù)能夠回來(lái)就已經(jīng)興高采烈了,哪里還能奢望瞬間業(yè)務(wù)繼續(xù)運(yùn)行呢?
目前,許多行業(yè)的領(lǐng)導(dǎo)者已經(jīng)將目光延伸到先驗(yàn)證的災(zāi)難恢復(fù)技術(shù)上,這類技術(shù)的特點(diǎn)就是在出現(xiàn)數(shù)據(jù)損壞時(shí),可以立即提供原格式的數(shù)據(jù)時(shí)間點(diǎn)供驗(yàn)證,業(yè)務(wù)系統(tǒng)立即運(yùn)行,在確保了業(yè)務(wù)連續(xù)性的極為重要的目標(biāo),此后,可以利用其余空閑時(shí)段,再行修復(fù)生產(chǎn)設(shè)備。這一體系被稱為“先生產(chǎn),后修復(fù)”。
4) 注重傳輸帶寬的研究
異地容災(zāi)的一個(gè)重要領(lǐng)域就是傳輸帶寬技術(shù),這一技術(shù)的不足往往可以導(dǎo)致由于帶寬不足造成數(shù)據(jù)延遲過(guò)大,造成災(zāi)備中心數(shù)據(jù)不可用等等。許多災(zāi)備技術(shù)路線都在傳輸帶寬的精簡(jiǎn)技術(shù)上練內(nèi)功,比拼能力,這是十分正確的。有效的精簡(jiǎn)帶寬傳輸技術(shù)能夠使得災(zāi)備建設(shè)的成本大為降低,也可以使災(zāi)備中心的數(shù)據(jù)實(shí)時(shí)性大為提高,對(duì)于數(shù)據(jù)向生產(chǎn)中心的恢復(fù)也能獲得十分有效的速度提升。