進行數(shù)據(jù)保護最重要的是能夠及時進行可靠且具有成本效益的數(shù)據(jù)恢復(fù),無論是在本地還是遠程,這一點都很重要。
如果你像大多數(shù)的IT專業(yè)人士一樣,那么你肯定已經(jīng)思考過重復(fù)數(shù)據(jù)刪除技術(shù)怎樣改善數(shù)據(jù)保護操作這個問題了。你可能已經(jīng)聽說了,廠商們正在利用很多指標(biāo)使自己的產(chǎn)品與眾不同:資源與基于目標(biāo)的,在線處理和后期處理的,文件級別與子文件級別指紋的,固定窗口與窗口長度可變的,單一的與全局重復(fù)數(shù)據(jù)刪除保存的等等,讓人們很難作出決定。
做出災(zāi)難恢復(fù)(DR)操作的決策需要遵循的一個關(guān)鍵指標(biāo)是恢復(fù)所用的時間(TTR)。
探討關(guān)于重復(fù)數(shù)據(jù)刪除技術(shù)方面的文章有很多,但是“不同的方法怎樣影響災(zāi)難恢復(fù)技術(shù)恢復(fù)數(shù)據(jù)所用的時間”這個話題卻一直沒有得到很適當(dāng)?shù)亟鉀Q。隨著數(shù)據(jù)保護操作變得越來越以磁盤為基礎(chǔ),企業(yè)把數(shù)據(jù)從基于磁帶的設(shè)備上遷移出來時應(yīng)該大量利用重復(fù)數(shù)據(jù)刪除技術(shù)和數(shù)據(jù)復(fù)制等技術(shù)。
本文我們將了解將備份數(shù)據(jù)從分散站點遷移到集中式站點,然后為了災(zāi)難恢復(fù)而再將其遷移到遠程站點的整個的系統(tǒng)流程,我們將會按照恢復(fù)點目標(biāo)(RPO)與恢復(fù)時間目標(biāo)(RTO)對以目標(biāo)為基礎(chǔ)的兩個主要的重復(fù)數(shù)據(jù)刪除架構(gòu)的影響進行評估,這兩個架構(gòu)分別是在線處理和后期處理。
為了進行這樣的一個比較,我們的頭腦中需要始終保持的一個重要的觀念是:這會影響到災(zāi)難恢復(fù)的最終結(jié)果以及整個重要的數(shù)據(jù)保護過程的成本;僅僅側(cè)重于對這一過程中的一個或者多個中間步驟進行比較,就足以讓你能夠充分理解獲得底線目標(biāo)的能力:需要用具有成本效益的做法來滿足你的RPO/RTO要求。
在線處理與后期處理
要想說明在線處理與后期處理間的不同之處的最佳做法是描述兩者在備份過程中分別是怎么工作的。在這兩種情況中,你有自己的備份資源(通常稱為“備份客戶”)和備份目標(biāo)。在線處理過程中,重復(fù)數(shù)據(jù)刪除設(shè)備被定義為備份目標(biāo)。在數(shù)據(jù)被寫入目標(biāo)之前將那些處于運行的數(shù)據(jù)刪除;只有經(jīng)過了重復(fù)數(shù)據(jù)刪除操作之后,數(shù)據(jù)才會被存儲起來。后期處理過程中,重復(fù)數(shù)據(jù)刪除設(shè)備同樣被定義為備份目標(biāo),但是數(shù)據(jù)一開始就會以原本的形式被寫入磁盤。然后在接下來的過程中會挑選出這些數(shù)據(jù),對它們進行重復(fù)數(shù)據(jù)刪除,并將其再以重復(fù)數(shù)據(jù)刪除形式寫入設(shè)備中。
在線處理中,重復(fù)數(shù)據(jù)刪除過程可能會增加一定的潛伏期,而且在過去人們會有這樣的一個擔(dān)心:在線設(shè)備可能會影響備份的性能。而在后期處理重復(fù)數(shù)據(jù)刪除過程中,人們需要增加比預(yù)先更多的存儲空間(以便將備份數(shù)據(jù)寫為“未重復(fù)數(shù)據(jù)刪除”的格式)和更多的時間(一旦備份開始,重復(fù)數(shù)據(jù)刪除就變成兩個獨立的連續(xù)的進程)來將備份數(shù)據(jù)處理為重復(fù)數(shù)據(jù)刪除格式。
一直以來廠商都在努力解決這一問題,現(xiàn)在市場上有一些在線重復(fù)數(shù)據(jù)刪除設(shè)備可以500MBps的單數(shù)據(jù)流技術(shù)的速度或者更高的速度來提取備份數(shù)據(jù)(并將其轉(zhuǎn)換為重復(fù)數(shù)據(jù)刪除格式)。這些在線重復(fù)數(shù)據(jù)刪除設(shè)備可讓備份數(shù)據(jù)提取的性能低于預(yù)期(假設(shè)在最有限的網(wǎng)絡(luò)備份情況下)的性能,但是卻可帶來最高的性能環(huán)境。為了后期處理可與備份數(shù)據(jù)提取操作同時進行,后期處理做法已經(jīng)進行了一些改變,大大縮減了將數(shù)據(jù)提取和處理為重復(fù)數(shù)據(jù)刪除格式所需的時間。夜間備份工作往往被分為大量按順序作業(yè)的備份工作,在這樣的情況下,一些后期處理廠商現(xiàn)在已經(jīng)可以對全面的備份工作進行重復(fù)數(shù)據(jù)刪除,同時他們還可以從其它設(shè)備中提取數(shù)據(jù)。
假設(shè)數(shù)據(jù)一直都停留在磁盤上,那么從備份資源上遷移數(shù)據(jù)到災(zāi)難恢復(fù)站點往往需要一個分三步走的過程(備份、重復(fù)數(shù)據(jù)刪除和數(shù)據(jù)復(fù)制)。但是需要知道的是,在線處理做法會同時進行備份和重復(fù)數(shù)據(jù)刪除,有效地將其分為兩步走的過程。
評估人們對TTR認知程度的一些關(guān)鍵的必要因素有哪些?讓我們更加深入地認識一下這幾個因素:
網(wǎng)絡(luò)帶寬
什么時候和在哪里進行重復(fù)數(shù)據(jù)刪除會嚴重影響備份所需的時間。
在備份環(huán)境中,重復(fù)數(shù)據(jù)刪除往往會減少10倍到20倍甚至更多的備份工作規(guī)模。如果在靠近資源的地方進行重復(fù)數(shù)據(jù)刪除,那么重復(fù)數(shù)據(jù)刪除的好處可減少一定量的數(shù)據(jù),而以前這些數(shù)據(jù)必須通過LAN/WAN才能實現(xiàn)從備份資源到主站點的傳輸,例如讓更小的更廉價的重復(fù)數(shù)據(jù)刪除設(shè)備與遠程辦公室或分支機構(gòu)(ROBO)的本地備份目標(biāo)一樣進行工作。這個因素能夠幫助大大降低帶寬和時間需求。這一過程中你會面臨的取舍是:備份的同時進行重復(fù)數(shù)據(jù)刪除會增加時間的需求,而必須在網(wǎng)絡(luò)中傳輸數(shù)量明顯更少的數(shù)據(jù)的話又可能會節(jié)約大量的時間。網(wǎng)絡(luò)帶寬在這一比較過程中是一個關(guān)鍵的變量。