隨著企業(yè)對數(shù)據安全的重視程度加強,適合企業(yè)不同特性的從存儲備份方案也應運而生。重復刪除技術就是其中的一種。在這篇中就跟大家談談,什么樣的企業(yè)適合采用重復數(shù)據刪除技術。
一、數(shù)據量大、且冗余大的企業(yè)適合使用重復數(shù)據刪除技術。
在對企業(yè)的信息化數(shù)據進行存儲與備份時,超大的容量一直是項目管理員比較頭疼的問題。有不少企業(yè),可能一年就需要升級一下存儲設備的容量。在這種情況下,采用重復數(shù)據刪除技術能夠起到一定的效果。
通常情況下,當企業(yè)的數(shù)據量越大,備份數(shù)據中所包含的冗余部分也就越多。雖然說增量的數(shù)據備份策略只是備份哪些有變化的文件,可以在一定程度上提高備份的效率、縮小磁盤空間。但是這個贈量備份策略通常也會包含比較多的冗余的數(shù)據塊。為此對節(jié)省磁盤空間的效果并不是很理想。
此時企業(yè)可以嘗試使用重復數(shù)據刪除技術來消除冗余的數(shù)據塊。通常情況下重復數(shù)據刪除技術的核心優(yōu)勢就是保存唯一一份備份數(shù)據的數(shù)據段。簡單的說,當數(shù)據寫入到備份設備時,數(shù)據會被分割成可變長度的數(shù)據段。重復數(shù)據刪除解決方案會實時的將該數(shù)據段與已經存儲的各個數(shù)據段進行對比。如此的話,就可以保證每個唯一的數(shù)據段在存儲設備上只保留一份。因為重復數(shù)據刪出技術可以在文件內或者文件間,甚至數(shù)據塊內發(fā)現(xiàn)重復的文件和數(shù)據段,所以實際所需要的存儲空間也就比所需要保存的數(shù)據量低一個數(shù)據級別。容量優(yōu)化效率的高低主要取決于所采采用的算法。
為此如果企業(yè)想大幅度的降低其存儲容量,并且企業(yè)的數(shù)據存在比較大的冗余(如2011年的報表是在2010年的基礎上延續(xù)下去的),此時就可以使用重復數(shù)據刪出技術來解決存儲容量過大的問題。
不過這里需要提醒的是,其數(shù)據壓縮的效果直接跟其所采用的算法相關。現(xiàn)在針對重復數(shù)據刪除解決方案,有不少對應的算法。在選型時,需要評估各種算法的優(yōu)劣。甚至可以直接測試一下,看看其容量優(yōu)化效果到底有多大。然后再根據實際情況來選型。
二、數(shù)據恢復時要客戶增量備份所帶來的困擾。
增量備份只備份有變化的文件或者數(shù)據。其可以在一定程度上降低備份的開銷、提高備份的效率。但是其也存在一些負面的效應。如以Oracle數(shù)據庫為例,有時候全備份方式的備份恢復執(zhí)行起來要比增量備份快。這主要是因為在增量備份過程中經常要對整個數(shù)據庫進行掃描,以便發(fā)現(xiàn)改變的數(shù)據塊。而且增量方式在數(shù)據恢復時還需要一個完全備份和多個增量備份文件。此時就會增加數(shù)據恢復的復雜性、降低數(shù)據恢復的速度。如果企業(yè)的數(shù)據管理員,正在為增量備份所帶來的這些問題所困擾,那么可以試著使用以下重復數(shù)據刪出技術,看看能否幫你解決問題。
筆者還是以Oracle數(shù)據庫為例。如果現(xiàn)在我們利用重復數(shù)據刪除技術對Oracle數(shù)據庫文件進行備份,會有什么樣的改善呢?此時數(shù)據庫文件備份所需要的時間是由遍歷數(shù)據塊的時間和數(shù)據時間所構成的。對于增量備份來說,數(shù)據塊的遍歷是對數(shù)據庫進行全表掃描,以便發(fā)現(xiàn)改變的數(shù)據塊。這往往需要比較長的時間。而且其所需要的時間與數(shù)據庫的容量成正比。而以磁盤為介質的備份設備具有高性能和在線重復數(shù)據刪除的功能。為此在對Oracle數(shù)據庫進行多個完全備份時,只用了很少的存儲空間(因為消除了冗余的數(shù)據塊)。此時企業(yè)進行完全備份和數(shù)據塊級的增量備份所占用的存儲空間基本相同。而與普通的備份設備相比,使用重復數(shù)據刪除技術的設備做完全備份時,可以節(jié)省95%以上的存儲空間消耗。在某些場合中,其磁盤節(jié)省的效率比增量備份還要高。
簡單的說,從數(shù)據存儲空間、備份效率等綜合效果來看,重復刪除技術+完全備份〉增量備份。如果企業(yè)采用了重復刪除技術的存儲設備,那么就不需要再對數(shù)據庫進新增量備份,而直接采用完全備份即可。此時即不用擔心磁盤空間的問題,也不用再顧慮采用增量備份時所帶來的負面作用。
三、對數(shù)據進行異地備份。
在數(shù)據安全要求比較高的企業(yè),光本地備份還不行,往往還需要對數(shù)據進行異地備份。如現(xiàn)在的電子商務網站,其可能在北京、上海各有分支機構。為了數(shù)據的安全,不同分支機構的數(shù)據要進行相互之間的異地備份,以提高數(shù)據的安全性。在進行異地備份時,數(shù)據管理人員最關心的莫過于數(shù)據的容量。當數(shù)據的容量比較大時,不僅需要比較多的備份空間,而且在異地備份時對于帶寬的要求也比較高。正是由于這種原因,異地備份需要企業(yè)比較高的成本。這也限制了異地備份策略在企業(yè)中的應用。