三、重復(fù)數(shù)據(jù)刪除產(chǎn)品的去重比率
真要計算出你的數(shù)據(jù)的去重比率,并非易事。廠商所公布的去重比率其實是在一種特定條件下的人為控制因素介入之后的結(jié)果?!坝袕S商竟然夸張的聲稱可以達到400:1的比率,這種情況基本上你永遠無法遇到。” “假設(shè)你對一個由500個文件組成的數(shù)據(jù)集進行去重操作,為了便于備份,每個文件1GB大小?!?EMC的CTO Dan Codd說道,“第二天,有一個文件變化了,你對其進行了去重操作,這樣的話,備份相當(dāng)于只備份了這個變化的文件,那么此時的去重比率是多少呢?你可以說它是500:1”。
對于同一個重復(fù)數(shù)據(jù)刪除過程,其結(jié)果隨著你計算式所使用的時間段的不同而不同。“結(jié)果可能是40:1甚至20:1。因此這個指標僅有參考意義。
四、火星艙重復(fù)數(shù)據(jù)刪除技術(shù)優(yōu)勢
火星艙提供數(shù)據(jù)塊級重復(fù)數(shù)據(jù)刪除功能,重復(fù)數(shù)據(jù)刪除是在內(nèi)部進行的,可根據(jù)文件系統(tǒng)的大小進行調(diào)整,不需要使用特殊的存儲陣列來對數(shù)據(jù)進行重復(fù)刪除?;鹦桥撛跀?shù)據(jù)集級上的適用性表明你只需對包含冗余數(shù)據(jù)的數(shù)據(jù)集進行重復(fù)刪除,而不用牽扯到其他的數(shù)據(jù)集。由于它是內(nèi)部重復(fù)數(shù)據(jù)刪除功能,因此增加處理核心和內(nèi)存就可以提高重復(fù)數(shù)據(jù)刪除的速度。
目前數(shù)據(jù)備份的需求主要在數(shù)據(jù)中心、信息中心,而數(shù)據(jù)中心、信息中心需要備份的主要是數(shù)據(jù)庫數(shù)據(jù),并且數(shù)據(jù)中心、信息中心的瓶頸不在于網(wǎng)絡(luò)帶寬,但重復(fù)數(shù)據(jù)刪除引擎通過檢查冗余數(shù)據(jù)中的唯一重復(fù)特征來判斷是否可以將冗余的部分存儲為一個符號鏈接,從而降低數(shù)據(jù)對存儲空間的需求。這個過程是一個極其消耗CPU資源的過程。所以一般源端的重復(fù)數(shù)據(jù)刪除不能很好的運行在數(shù)據(jù)庫或者其他事物性系統(tǒng)上,因為它會在主機端增加處理負載,可能高達25%。當(dāng)這些類型的應(yīng)用在目標端進行重復(fù)數(shù)據(jù)刪除時就不會產(chǎn)生那種負載了。因此火星艙的重復(fù)數(shù)據(jù)刪除無需擔(dān)心由于重復(fù)刪除處理使CPU 負擔(dān)加重而導(dǎo)致備份服務(wù)器和二級存儲目標之間出現(xiàn)瓶頸。
對于遠程備份而言,火星艙是通過自己專有的遠程傳輸技術(shù)來達到數(shù)據(jù)壓縮、穩(wěn)定傳輸?shù)哪康?。而如果僅僅只考慮重復(fù)數(shù)據(jù)刪除技術(shù),會遇到網(wǎng)絡(luò)斷線數(shù)據(jù)重傳等問題。