首先,筆者想澄清一下本文的標(biāo)題:“放下磁帶”,不代表最近推出的新版本賽門(mén)鐵克NetBackup 7.5軟件不再支持磁帶(當(dāng)然也不太可能這樣),也不代表NetBackup原有針對(duì)磁帶的功能特性有什么弱化。只是磁盤(pán)在數(shù)據(jù)保護(hù)領(lǐng)域正扮演著越來(lái)越重要的角色,特別是備份應(yīng)用;而未來(lái)若干年中磁帶仍將在海量數(shù)據(jù)歸檔、不活躍數(shù)據(jù)長(zhǎng)期保存等方面發(fā)揮其價(jià)值。(延伸閱讀:來(lái)自磁帶峰會(huì)的報(bào)告(上):71%恢復(fù)失敗的謬論、(下):受投資而非技術(shù)驅(qū)動(dòng))
在討論NetBackup 7.5在虛擬化以及磁盤(pán)支持等方面的新特性之前,我們先提一段小“插曲”,在本月IDC公布《2011年第四季度IDC季度存儲(chǔ)軟件跟蹤》的新聞中,前3名EMC、IBM和賽門(mén)鐵克的市場(chǎng)份額分別為25.7%、19.8%和15.4%。當(dāng)時(shí)這個(gè)令筆者有點(diǎn)意外,因?yàn)樵谥暗暮荛L(zhǎng)一段時(shí)間賽門(mén)鐵克都排在第2位,而上季度一下就落后IBM這么多?
隨后來(lái)自國(guó)外媒體的一篇報(bào)道解釋了其中緣由:IDC的那個(gè)新聞稿與完整報(bào)告中的統(tǒng)計(jì)數(shù)字有出入,應(yīng)該是前者出現(xiàn)了錯(cuò)誤,實(shí)際情況應(yīng)該是賽門(mén)鐵克—15.4%和IBM—14.2%。
IDC統(tǒng)計(jì)的存儲(chǔ)軟件市場(chǎng)包括存儲(chǔ)設(shè)備管理、數(shù)據(jù)保護(hù)備份和歸檔軟件等7個(gè)功能性市場(chǎng)。我們認(rèn)為EMC排名第一與他們?cè)诖鎯?chǔ)硬件上的業(yè)績(jī)是分不開(kāi)的,EMC自稱(chēng)擁有市場(chǎng)排名第三的備份軟件(Netwoker),IBM的Tivoli Storage Manager(TSM)有可能是第二,而第一應(yīng)該就是賽門(mén)鐵克全功能跨平臺(tái)的NetBackup。再加上主要支持Windows環(huán)境并強(qiáng)調(diào)易用性的Backup Exec,賽門(mén)鐵克在備份軟件方面的占有率應(yīng)該還是最高的。
永久增量——適合磁盤(pán)時(shí)代的備份方式
上面的小標(biāo)題如果換一種方式,也可以說(shuō)全備份和增量備份是磁帶時(shí)代的產(chǎn)物。不知大家對(duì)這種說(shuō)法是不是都認(rèn)可,接下來(lái)請(qǐng)看一下我的解釋是否有道理?對(duì)于存儲(chǔ)備份領(lǐng)域的專(zhuān)家和賽門(mén)鐵克NBU的用戶(hù)來(lái)說(shuō),筆者在此可能有點(diǎn)班門(mén)弄斧了。
首先,初始的全備份很好理解,而當(dāng)過(guò)了一段時(shí)間數(shù)據(jù)有不同程度改變之后,按照傳統(tǒng)的備份方式用戶(hù)通常有兩種選擇:再次全備份和增量備份。選擇前者將會(huì)重新備份整個(gè)數(shù)據(jù)集,即使有了重復(fù)數(shù)據(jù)刪除技術(shù)之后,很多情況下還是需要將生產(chǎn)服務(wù)器/被保護(hù)主機(jī)上的全部?jī)?nèi)容通過(guò)網(wǎng)絡(luò)再次發(fā)送至備份軟件介質(zhì)服務(wù)器(如果是源端重復(fù)數(shù)據(jù)刪除或者在快照功能上與NetBackup集成的陣列,應(yīng)該不需要傳輸冗余數(shù)據(jù)),盡管減少了備份占用的磁盤(pán)空間,但備份時(shí)間不見(jiàn)得會(huì)縮短,處理資源和網(wǎng)絡(luò)帶寬可能也沒(méi)有節(jié)省。
那么,增量備份只會(huì)對(duì)全備份之后新增加或者改變的數(shù)據(jù)進(jìn)行操作,這樣就避免了上述反復(fù)全備份的一些問(wèn)題。不過(guò),增量備份在進(jìn)行恢復(fù)到某一個(gè)時(shí)間點(diǎn)時(shí),必須先恢復(fù)全備份,然后按順序逐個(gè)恢復(fù)該備份時(shí)間點(diǎn)之前的所有增量。如果其中有任何一個(gè)失效,恢復(fù)就會(huì)失敗。因此,很多用戶(hù)都是每周至每個(gè)月做一次全備份,其間每天進(jìn)行增量備份。
再來(lái)看一下備份介質(zhì)。磁帶不具備像硬盤(pán)移動(dòng)磁頭那樣的隨機(jī)數(shù)據(jù)訪問(wèn)能力,因此備份、歸檔軟件等對(duì)磁帶的訪問(wèn)方式通常都是順序流式讀寫(xiě)。LTO-5規(guī)范的LTFS文件系統(tǒng)中索引分區(qū)的出現(xiàn)對(duì)媒體等行業(yè)有所幫助,但無(wú)法改變磁帶本身固有的特點(diǎn)。
對(duì)于傳統(tǒng)的全備份和增量備份來(lái)說(shuō),一盤(pán)或者多盤(pán)磁帶連續(xù)寫(xiě)入/讀出正好符合這樣的訪問(wèn)規(guī)則。不過(guò)到了磁盤(pán)時(shí)代,如果用戶(hù)不需要多個(gè)恢復(fù)時(shí)間點(diǎn)的話,原有全備份+增量備份的的方式似乎就不太適合了。
我們認(rèn)為這就是CommVault、飛康等新興的數(shù)據(jù)保護(hù)軟件廠商力推磁盤(pán)解決方案的原因。飛康CDP(連續(xù)數(shù)據(jù)保護(hù))的工作原理類(lèi)似于建立在精細(xì)粒度快照基礎(chǔ)上的備份,在一些情況下能夠?qū)崿F(xiàn)很小的RTO(恢復(fù)時(shí)間目標(biāo))和RPO(恢復(fù)點(diǎn)目標(biāo)),這種方式利于實(shí)現(xiàn)數(shù)據(jù)的高可用和容災(zāi)。不過(guò)根據(jù)筆者進(jìn)行過(guò)的測(cè)試,完全同步的CDP依賴(lài)于網(wǎng)絡(luò)帶寬和備份存儲(chǔ)性能,會(huì)不同程度的影響生產(chǎn)存儲(chǔ)性能(需要等待備份存儲(chǔ)也寫(xiě)入返回ok),特別是在通過(guò)WAN進(jìn)行復(fù)制時(shí)。因此實(shí)際使用更多的應(yīng)該為15分鐘左右的異步CDP。
也就是說(shuō),備份和CDP仍然各有各的市場(chǎng)。另一種產(chǎn)品——VTL(虛擬磁帶庫(kù))則是過(guò)渡的產(chǎn)物,它無(wú)法充分發(fā)揮磁盤(pán)隨機(jī)訪問(wèn)的能力。就像有的業(yè)內(nèi)人士所說(shuō):磁帶備份時(shí)代領(lǐng)先廠商的產(chǎn)品系列,比如CA ARCserve、被EMC收購(gòu)的(Legato)Netwoker、IBM Tivoli Storage Manager(簡(jiǎn)稱(chēng)TSM),可能還有賽門(mén)鐵克Veritas,有些不愿放棄原來(lái)在磁帶設(shè)備支持上的“遺產(chǎn)”,希望憑借這個(gè)門(mén)檻繼續(xù)賺錢(qián),而不想一下子轉(zhuǎn)向磁盤(pán)備份。