過去的幾年里,有關(guān)于備份技術(shù)的話題始終聚焦在目標(biāo)介質(zhì)領(lǐng)域——磁帶和磁盤之間的PK。這場競爭的結(jié)果似乎已見分曉,大多數(shù)用戶和IT供應(yīng)商更傾向于使用磁盤介質(zhì)。因此,用戶現(xiàn)在的關(guān)注點已經(jīng)轉(zhuǎn)移到了備份過程的前端環(huán)節(jié),即數(shù)據(jù)的捕捉和傳輸。
據(jù)ESG調(diào)查統(tǒng)計,2004年之前約60%的受訪企業(yè)直接將數(shù)據(jù)備份到磁帶上,而沒有使用過任何磁盤備份技術(shù)。但是到了2010年,這一比例下降到只有20%。在此期間,約有80%的受訪機(jī)構(gòu)告訴ESG他們在備份過程中使用了磁盤技術(shù),該技術(shù)幫助他們縮小了備份窗口,也滿足了更高的RTO(恢復(fù)時間點)指標(biāo)要求。然而,數(shù)據(jù)量目前仍然在以指數(shù)級的速度不斷增長,這也意味著對備份系統(tǒng)的要求會越來越高,備份的流程也需要更新。其結(jié)果促進(jìn)了CDP技術(shù)、復(fù)制技術(shù)、源端重復(fù)數(shù)據(jù)刪除技術(shù)以及快照技術(shù)的廣泛應(yīng)用。ESG研究發(fā)現(xiàn),這些技術(shù)的使用情況有不同程度的明顯增長:在從2008到2010年,快照的應(yīng)用增加了2%,復(fù)制增長了34%,CDP增長了58%,而同樣在這兩年之內(nèi),重復(fù)數(shù)據(jù)刪除的應(yīng)用則大幅提高了66%。
快照和鏡像備份
在什么樣的情況下,我們能壓縮備份窗口,加速系統(tǒng)恢復(fù),并且達(dá)成高效的容災(zāi)呢?高效率,那是基于快照和鏡像備份的最大特點??煺帐蔷砘蛘呶募到y(tǒng)在指定時間點創(chuàng)建的拷貝,利用快照的功能優(yōu)勢做數(shù)據(jù)備份,能夠極其明顯的降低備份過程對應(yīng)用系統(tǒng)的影響??煺諅浞菘梢詨嚎s備份窗口,提供秒級或分鐘級的RTO指標(biāo),通過每天更多頻次的快照,還可以獲得更好的RPO指標(biāo)。
鏡像備份也可以利用快照技術(shù),為系統(tǒng)數(shù)據(jù)創(chuàng)建一個指定時間點的完整拷貝。系統(tǒng)數(shù)據(jù)可以是硬件配置信息、操作系統(tǒng)、應(yīng)用程序或業(yè)務(wù)數(shù)據(jù)等等。鏡像是一個獨立的可移動的文件?;跁r間點的快照備份屬于熱備份,所以關(guān)鍵的應(yīng)用系統(tǒng)在備份過程中不需要中斷??煺諅浞輼O大地削減了備份窗口,并且能夠快速進(jìn)行系統(tǒng)的整體恢復(fù),恢復(fù)的目標(biāo)可以是虛擬機(jī)或物理機(jī),也可以恢復(fù)到異構(gòu)的硬件平臺??煺蘸顽R像備份在數(shù)據(jù)的捕捉、傳輸和存儲環(huán)節(jié)的效率都非常高,最初需要做一次完整的數(shù)據(jù)初始化拷貝,之后進(jìn)行的數(shù)據(jù)捕捉和存儲則都是針對增量數(shù)據(jù)塊。
CDP
CDP技術(shù)的原理是連續(xù)捕獲變化中的數(shù)據(jù)。它可以基于文件、也可以在數(shù)據(jù)塊層或者在應(yīng)用層,支持細(xì)粒度水平的數(shù)據(jù)捕獲和精度恢復(fù)選項。CDP引擎會給每個寫操作都打上時間戳標(biāo)記,然后將這些經(jīng)過處理的寫操作鏡像保存到一個記錄日志中,從而連續(xù)跟蹤數(shù)據(jù)的變化。當(dāng)需要做數(shù)據(jù)回滾時,CDP引擎會根據(jù)我們指定的時間點,為產(chǎn)生卷創(chuàng)建一個在該時間點的映像卷,而這個過程不會影響到生產(chǎn)應(yīng)用程序的運行。
塊級CDP在邏輯卷層進(jìn)行操作,記錄每一個寫操作。這種類型的CDP技術(shù)的突出特點在于透明捕捉數(shù)據(jù),而且能夠形成任意時間點的數(shù)據(jù)視圖。通常,CDP引擎與被保護(hù)的應(yīng)用程序在同一臺服務(wù)器上運行。文件級CDP在文件系統(tǒng)層面進(jìn)行操作,可以記錄文件系統(tǒng)上發(fā)生的任何改變。應(yīng)用感知型CDP則能夠在CDP數(shù)據(jù)流中跟蹤關(guān)鍵應(yīng)用程序的檢查點信息,有了這些信息之后,數(shù)據(jù)的回滾恢復(fù)會變得異常簡單。比如跟蹤數(shù)據(jù)庫的交易一致性檢查點,或是Email等應(yīng)用程序的一致性檢查點。
CDP連續(xù)數(shù)據(jù)保護(hù)技術(shù)完全摒棄了離散的備份形式,代之以透明的、連續(xù)數(shù)據(jù)采集過程,生產(chǎn)服務(wù)器只需要很低的備份開銷。此外,應(yīng)用數(shù)據(jù)一旦產(chǎn)生就立即被CDP捕獲,因此基于CDP的備份解決方案可以恢復(fù)最新產(chǎn)生的數(shù)據(jù),RPO指標(biāo)接近為零。
復(fù)制
復(fù)制技術(shù)是所有這些備份策略的基石,目前也越來越多地被用于數(shù)據(jù)保護(hù)。復(fù)制是一個獨立的進(jìn)程,可以保護(hù)應(yīng)用程序,提供可操作的災(zāi)難恢復(fù)能力,且具有最佳的RPO和RTO指標(biāo)。作為一種為文件級集中備份而整合分散數(shù)據(jù)的技術(shù),復(fù)制可以同快照或者CDP結(jié)合使用,維護(hù)一份遠(yuǎn)程的數(shù)據(jù)備份,從而實現(xiàn)容災(zāi)應(yīng)用。通過復(fù)制技術(shù),我們可以在本地或遠(yuǎn)程維護(hù)一份精確的數(shù)據(jù)鏡像,發(fā)生災(zāi)難時,復(fù)制卷能夠快速掛載到主機(jī)恢復(fù)生產(chǎn)數(shù)據(jù)。在數(shù)據(jù)初始化拷貝結(jié)束之后,通過塊級增量復(fù)制以及網(wǎng)絡(luò)壓縮過程,存儲的容量和帶寬都可以得到優(yōu)化。
在主機(jī)層、存儲層和網(wǎng)絡(luò)層都可以實現(xiàn)數(shù)據(jù)復(fù)制。通常,磁盤陣列和網(wǎng)絡(luò)層產(chǎn)品使用的都是基于塊的復(fù)制技術(shù),而主機(jī)層復(fù)制主要在文件系統(tǒng)層。主機(jī)層大多提供異步復(fù)制,而磁盤陣列和網(wǎng)絡(luò)層則通過配置,可選異步或同步復(fù)制。同步復(fù)制的原理是,只要生產(chǎn)系統(tǒng)發(fā)生數(shù)據(jù)寫操作,這些操作都會實時復(fù)制到目標(biāo)系統(tǒng)。異步復(fù)制則是一種準(zhǔn)實時的操作,只有當(dāng)數(shù)據(jù)在生產(chǎn)系統(tǒng)上寫完之后,才會復(fù)制到目標(biāo)系統(tǒng)。