越來越多的業(yè)務(wù)需求都在傳達(dá)一個(gè)信號(hào),那就是用戶對(duì)在他們的虛擬化環(huán)境中部署重復(fù)數(shù)據(jù)刪除技術(shù)都表現(xiàn)出了強(qiáng)烈的興趣,因?yàn)樵谔摂M化環(huán)境下,冗余的數(shù)據(jù)越來越多。
在這篇來自Taneja集團(tuán)的高級(jí)分析師Jeff Boles的訪談?dòng)涗浿?,我們可以了解到為什么越來越多的組織和企業(yè)對(duì)服務(wù)器虛擬化中的重復(fù)數(shù)據(jù)刪除技術(shù)表現(xiàn)出了更多的興趣,究竟虛擬化環(huán)境中更合適源端還是目的端的去重,我們用什么樣的標(biāo)準(zhǔn)來決定何時(shí)對(duì)虛擬機(jī)進(jìn)行去重處理,以及VMware公司的vStorage API接口為我們帶來了什么。
問:據(jù)您所了解的,那些部署了服務(wù)器虛擬化的組織或企業(yè),是不是越來越對(duì)重復(fù)數(shù)據(jù)刪除技術(shù)感興趣?如果是這樣的話,您能詳細(xì)解釋一下在備份虛擬服務(wù)器時(shí),有哪些因素及優(yōu)勢(shì)驅(qū)使他們傾向于選擇去重技術(shù)嗎?
答:是這樣的。之所以有越來越多的用戶對(duì)虛擬化環(huán)境下的重復(fù)數(shù)據(jù)刪除技術(shù)感興趣是因?yàn)樵谔摂M機(jī)環(huán)境下有太多的冗余數(shù)據(jù)占用了大量的空間。隨著時(shí)間的推移,我們?cè)谌绾尾渴鹛摂M化服務(wù)器方面已經(jīng)變得越來越有經(jīng)驗(yàn)。
我們已經(jīng)完成了許多年前我們就應(yīng)該已經(jīng)完成的工作,在整體架構(gòu)上帶來的好處是,我們能更好的將核心操作系統(tǒng)數(shù)據(jù)和應(yīng)用數(shù)據(jù)剝離開來。因此,我們今天看到的虛擬化環(huán)境都是嚴(yán)格遵照了最佳實(shí)踐的,核心的操作系統(tǒng)鏡像包含了大多數(shù)操作系統(tǒng)文件以及配置信息等。虛擬化環(huán)境能將這些文件和應(yīng)用數(shù)據(jù)或者文件數(shù)據(jù)區(qū)分出來,一般來說,一臺(tái)虛擬機(jī)后面,都會(huì)有許多有著類似的黃金鏡像文件以及核心操作系統(tǒng)鏡像文件。因此,在使用了重復(fù)數(shù)據(jù)刪除后,用戶將不再會(huì)為大量的冗余數(shù)據(jù)所困擾。如果用戶選擇在虛擬化資源池中使用重復(fù)數(shù)據(jù)刪除技術(shù),那么使用普通去重算法帶來的去重率甚至高于非虛擬化環(huán)境中的生產(chǎn)環(huán)境。因此,僅從容量使用率的角度考慮,在服務(wù)器虛擬化環(huán)境中使用重復(fù)數(shù)據(jù)刪除技術(shù)就會(huì)有著許多的優(yōu)勢(shì)。
問:針對(duì)這種應(yīng)用,一般會(huì)選擇使用哪種重復(fù)數(shù)據(jù)刪除技術(shù)?您認(rèn)為,究竟是源端去重還是目的端去重我們使用的更多一些,哪種優(yōu)勢(shì)更大?
答:如今不同的重復(fù)數(shù)據(jù)刪除產(chǎn)品之間的確有著差異。用戶可以根據(jù)自己的偏好,選擇使用備份目的端的去重,比如介質(zhì)服務(wù)器,或者選擇使用備份源端的去重技術(shù),源端去重的產(chǎn)品有Symantec公司的PureDisk、EMC公司的Avamar產(chǎn)品和其他一些專注于虛擬化環(huán)境的其他廠商的產(chǎn)品。
比起過去,如今源端重復(fù)數(shù)據(jù)刪除技術(shù)越來越多的被采用,尤其在虛擬化環(huán)境中。首先在虛擬化環(huán)境中,I/O上的競(jìng)爭(zhēng)不可避免,這是備份任務(wù)一開始就需要面對(duì)的問題。一般來說,當(dāng)開始實(shí)施虛擬化的時(shí)候,其實(shí)備份的方式和物理機(jī)上一樣,都是裝上一個(gè)代理,然后將數(shù)據(jù)備份到外部介質(zhì)服務(wù)器上,與之前在物理機(jī)上使用的是相同的備份方法。與在物理機(jī)上不同的是,用戶不再需要為每一臺(tái)機(jī)器的信息打包,他們需要關(guān)注的僅僅是包含所有虛擬機(jī)的物理設(shè)備,因此,實(shí)際上是將一整套的備份任務(wù)寫進(jìn)同一個(gè)硬件設(shè)備里。不管是使用WAN還是稍好些的LAN,用戶都面臨著I/O上的壓力。然而實(shí)際上在物理硬件層的的I/O瓶頸是不能被忽視的。因此,傳統(tǒng)的備份方式會(huì)讓備份窗口拉的更長,甚至?xí)绊懙交謴?fù)時(shí)間目標(biāo)(RTOs)和恢復(fù)點(diǎn)目標(biāo)(RPOs),因?yàn)閮H通過一個(gè)硬件設(shè)備上的I/O讀寫會(huì)更慢一些。
因此源端的重復(fù)數(shù)據(jù)刪除技術(shù)上有著一些有意思的產(chǎn)品應(yīng)用,它們可以在從虛擬機(jī)剝離前,將全部數(shù)據(jù)分成不重復(fù)的數(shù)據(jù)塊。大量的這些使用源端去重的代理方法的出現(xiàn),有力的推動(dòng)了不斷的變革。因?yàn)檎嬲枰獋浞莸臄?shù)據(jù)越來越少,用戶可以更為頻繁的備份數(shù)據(jù),并且在后臺(tái)也一直在追蹤著數(shù)據(jù)的變化。它們往往知道奧妙在哪里,因此它們可以將需要備份的數(shù)據(jù)量達(dá)到最小。
同樣,在源端重復(fù)數(shù)據(jù)刪除技術(shù)的幫助下,用戶可以實(shí)現(xiàn)高度優(yōu)化的針對(duì)虛擬化環(huán)境的備份效果。到最后真正需要被移動(dòng)的數(shù)據(jù)少之又少,因此真正通過物理層鏈路的數(shù)據(jù)也是相當(dāng)少的。從而就不再需要因?yàn)镮/O上資源的爭(zhēng)奪而大傷腦筋,長久下來就可以實(shí)現(xiàn)良好的RTOs和RPOs,且虛擬機(jī)備份的備份窗口也會(huì)更小。
問:在虛擬化環(huán)境下使用重復(fù)數(shù)據(jù)刪除,會(huì)引起某些問題嗎?用戶應(yīng)該注意什么?