這個架構還為存儲庫保護的部分提供了故障切換(Failover)功能。
支持分布式應用
重復數(shù)據(jù)刪除技術,不只是能為單個數(shù)據(jù)中心帶來利益,對于具有多個分支機構或多個站點的大型企業(yè)來說,它可以讓整個企業(yè)的分布式應用受益無窮。一個包含復制和多級重復數(shù)據(jù)刪除解決方案可以將這一技術的優(yōu)勢發(fā)揮到極致。
舉例來說,一個企業(yè)由1個總部和3個區(qū)域代表機構構成,可以在區(qū)域代表機構部署一臺具備重復數(shù)據(jù)刪除功能的容災設備,使本地存儲及向遠程中央站點的復制更為高效。這種解決方案使數(shù)據(jù)復制到中央站點的帶寬需求降到最低,它只不過是用來確定遠程的數(shù)據(jù)是否已經(jīng)包括在中央的存儲庫中。所有站點中,只有唯一的數(shù)據(jù)會被復制到中央站點或是容災站點,否則所需的帶寬就會增大。
能夠對存儲庫提供實時保護
保證對刪除重復數(shù)據(jù)的存儲庫的訪問是非常關鍵的,因此它不能允許有單點故障發(fā)生。一個優(yōu)秀的重復數(shù)據(jù)刪除解決方案應該包括可以在本地存儲故障發(fā)生時提供保護的鏡像功能,同時也應該具備復制功能以在災難發(fā)生時提供保護。這種解決方案還應該在出現(xiàn)節(jié)點故障時具備故障切換能力,即使是一個集群中的多個節(jié)點出現(xiàn)故障,企業(yè)也必須能夠及時恢復數(shù)據(jù),同時還要保證業(yè)務持續(xù)運營。
效率及有效性
與基于文件的重復數(shù)據(jù)刪除解決方案相比,在SUBFILE或數(shù)據(jù)塊級分析數(shù)據(jù)的方式刪除的冗余數(shù)據(jù)會更多。比如,一個4MB大小的文件被修改了一行內(nèi)容,如果是文件級解決方案,整個4MB的文件都必須再被保存,而存儲上就需要保存兩遍。如果這個文件被發(fā)送給多個人(這種情況非常普遍),這種負面的效應也會隨之倍增。
大多數(shù)SUBFILE重復數(shù)據(jù)刪除處理是通過將大量的數(shù)據(jù)分割成“塊”,就像虛擬磁帶匣一樣,在相對小尺寸的數(shù)據(jù)塊中搜索重復數(shù)據(jù)。分割成大塊的數(shù)據(jù)處理速度更快,但發(fā)現(xiàn)的重復數(shù)據(jù)也比較少;而分割成小塊的數(shù)據(jù)可以更輕松地發(fā)現(xiàn)更多重復數(shù)據(jù),但它在掃描數(shù)據(jù)時所需的開銷也會更高。
如果數(shù)據(jù)在磁帶(或其他應用的數(shù)據(jù)流)的時候就被分割成“塊”,重復數(shù)據(jù)刪除處理在備份軟件創(chuàng)建的元數(shù)據(jù)上就能進行。優(yōu)秀的解決方案可以分離元數(shù)據(jù),從而在分割成“塊”的實際數(shù)據(jù)文件中發(fā)現(xiàn)重復數(shù)據(jù),這種方式使找到重復數(shù)據(jù)的機率更高。有些重復數(shù)據(jù)刪除解決方案甚至可以按照所掌握的數(shù)據(jù)格式來調(diào)節(jié)分割的“塊”的大小。如果能將這些技術結合應用,將使發(fā)現(xiàn)的重復數(shù)據(jù)數(shù)量大幅增加。這在重復數(shù)據(jù)刪除解決方案的經(jīng)濟效益標準方面影響重大。