也就是說,CommVault開始進(jìn)入醫(yī)療數(shù)據(jù)歸檔軟件領(lǐng)域的競爭中,深入行業(yè)的做法能夠挖掘更多的用戶需求,也可能說明原有備份功能的用戶希望有統(tǒng)一的供應(yīng)商解決方案。
第四代重復(fù)數(shù)據(jù)刪除:并行、SSD hash加速
在我們翻譯的“IDC:2012年4季度全球?qū)S脗浞菰O(shè)備市場增長9.7%”中,可以看到賽門鐵克在PBBA領(lǐng)域的顯著增長。結(jié)合硬件的NBU 5200和BE 3600系列的成功,主要得益于原有備份軟件的用戶基礎(chǔ)。而這樣做也有代價(jià)——失去了像戴爾這樣的合作伙伴,這可能就是CommVault堅(jiān)持做一家軟件公司的原因(通過戴爾這個(gè)渠道的銷售曾占到CommVault整體收入的1/4)。如今戴爾收購的AppAssure和Quest都有數(shù)據(jù)保護(hù)軟件,而CommVault與他們的合作仍然保持。
盡管沒有做像賽門鐵克那樣的軟硬件備份一體機(jī),但CommVault也在加強(qiáng)他們軟件對(duì)應(yīng)的功能。Simpana 10帶來的第四代重復(fù)數(shù)據(jù)刪除技術(shù)提出了并行去重的概念(目前支持2節(jié)點(diǎn)),由于沒找到合適的示意圖,下面我們拿曾經(jīng)在《重復(fù)數(shù)據(jù)刪除競爭白熱化:軟硬結(jié)合成關(guān)鍵》一文中參與對(duì)比,同樣為雙節(jié)點(diǎn)的IBM TS7650G ProtecTIER來做個(gè)參考。
IBM ProtecTIER HYPERFACTOR重復(fù)數(shù)據(jù)刪除示意圖
我們看到左邊是介質(zhì)服務(wù)器,數(shù)據(jù)由它們寫到ProtecTIER目標(biāo)端去重網(wǎng)關(guān)設(shè)備上——也就是中間的雙線內(nèi)重復(fù)數(shù)據(jù)刪除引擎,經(jīng)過處理后存放在單一存儲(chǔ)庫(全局文件系統(tǒng))上。
由于CommVault實(shí)現(xiàn)的是在介質(zhì)服務(wù)器和源端(備份代理)的軟件去重,所以它的雙節(jié)點(diǎn)就相當(dāng)于把中間那兩個(gè)引擎換成了Simpana介質(zhì)服務(wù)器,左邊直接就是應(yīng)用服務(wù)器,右邊應(yīng)該是共享的磁盤陣列。
目前賽門鐵克NetBackup 7.5和運(yùn)行該版本軟件的NBU 5220能夠支持全局重復(fù)數(shù)據(jù)刪除,但看資料需要配合使用多節(jié)點(diǎn)的NBU 5000系列目標(biāo)端去重硬件設(shè)備,而不能在通用硬件上實(shí)現(xiàn)。而目標(biāo)端設(shè)備方面,惠普StoreOnce B6200可以擴(kuò)展到4個(gè)節(jié)點(diǎn)對(duì),而高端VTL廠商Sepaton也是Scale-out(橫向擴(kuò)展)最多8個(gè)節(jié)點(diǎn)。CommVault未來應(yīng)該可以擴(kuò)展到2節(jié)點(diǎn)以上。
在回答筆者的問題時(shí),蔡報(bào)永表示:“CommVault的多節(jié)點(diǎn)去重可以針對(duì)單一任務(wù)(備份數(shù)據(jù)流),容量和性能都有加強(qiáng)。根據(jù)生成hash(哈希值)的奇偶性隨機(jī)分配到A/B兩個(gè)節(jié)點(diǎn),進(jìn)行重復(fù)數(shù)據(jù)刪除處理再寫入后端共同連接的盤陣。”根據(jù)我的理解,這應(yīng)該是使用到了源端重復(fù)數(shù)據(jù)刪除,因?yàn)閿?shù)據(jù)在發(fā)送到介質(zhì)服務(wù)器之前,就已經(jīng)生成過hash了。那么如果只使用介質(zhì)服務(wù)器去重的話,情況應(yīng)該有所不同,但估計(jì)也能多節(jié)點(diǎn)并行操作。
有了雙節(jié)點(diǎn)之后,CommVault的介質(zhì)服務(wù)器+去重也具備了高可用功能。因?yàn)樵诿總€(gè)節(jié)點(diǎn)上只存放hash庫而沒有實(shí)際數(shù)據(jù),在出現(xiàn)單節(jié)點(diǎn)故障時(shí)備份數(shù)據(jù)流可以由另一個(gè)節(jié)點(diǎn)承擔(dān),與本地的hash進(jìn)行對(duì)比并寫入后端存儲(chǔ)。在故障節(jié)點(diǎn)恢復(fù)后再重建上面的hash庫。
ChinaByte比特網(wǎng):我們看到Simpana 10的增強(qiáng)功能包括SSD的支持,這個(gè)是為了存儲(chǔ)重復(fù)數(shù)據(jù)刪除元數(shù)據(jù)、備份索引等用途嗎?
蔡報(bào)永:“沒錯(cuò),SSD就是在使用重復(fù)數(shù)據(jù)刪除功能時(shí),推薦來存放hash去重庫的?!?/P>
上表來自CommVault的資料,最左邊一列是4種重復(fù)數(shù)據(jù)刪除(介質(zhì)服務(wù)器)節(jié)點(diǎn)類型,Sm(?。ed(中等)、Lar(大)和XL(超大)。對(duì)應(yīng)的依次是推薦的DDB(去重?cái)?shù)據(jù)庫?)卷大小、估計(jì)的后端大小(物理存儲(chǔ)容量/RAID保護(hù)前?)、估計(jì)的前端大小(RAID保護(hù)后的物理存儲(chǔ)容量?),以及配置舉例。
最右邊一列,應(yīng)該就是重復(fù)數(shù)據(jù)刪除hash存儲(chǔ)庫的所在。從小到大分別為4-8個(gè)15K