對(duì)于SSD用于加速去重的hash(元數(shù)據(jù)),盡管筆者在這方面不夠?qū)I(yè),但也能想起這些年來(lái)了解到的昆騰Dxi系列重復(fù)數(shù)據(jù)刪除陣列,以及親手測(cè)試過(guò)的Exar BitWackr加速卡+軟件(來(lái)自收購(gòu)的Hifn)方案。畢竟內(nèi)存的單位容量成本較高,而且是易失性存儲(chǔ)介質(zhì),因此用閃存來(lái)處理這種需要大量隨機(jī)訪(fǎng)問(wèn)的用途相當(dāng)合適。
蔡報(bào)永表示:“使用硬盤(pán)存放hash的話(huà),一般情況下我們支持最大不超過(guò)7億條記錄,按照128KB的數(shù)據(jù)塊來(lái)計(jì)算就是90TB的容量。而這個(gè)數(shù)據(jù)塊大小可以根據(jù)需要在8-256KB之間調(diào)節(jié)?!睘榱?B>控制hash比對(duì)的數(shù)據(jù)量規(guī)模(應(yīng)該還有避免哈希沖突),每個(gè)重復(fù)數(shù)據(jù)刪除存儲(chǔ)庫(kù)的大小有一定的限制,超過(guò)之后會(huì)將這個(gè)hash庫(kù)封存。新寫(xiě)入的數(shù)據(jù)會(huì)重建一個(gè)新的hash庫(kù)進(jìn)行比對(duì)和存儲(chǔ)。
對(duì)于CommVault能夠?qū)⑷ブ刂蟮臄?shù)據(jù),無(wú)需恢復(fù)到原始狀態(tài)就可以歸檔到磁帶/云存儲(chǔ),蔡報(bào)永解釋道:“我們是將索引和數(shù)據(jù)寫(xiě)在一起的,因此在恢復(fù)時(shí)不一定要經(jīng)過(guò)生成備份并存放hash的介質(zhì)服務(wù)器。相比之下,由于賽門(mén)鐵克的備份索引與去重后的數(shù)據(jù)分開(kāi)存放,因此單獨(dú)將精簡(jiǎn)狀態(tài)的數(shù)據(jù)寫(xiě)到磁帶是不行的,并且在異地恢復(fù)時(shí),需要Master Server上的Catalog文件才能進(jìn)行?!?/P>
希望本文內(nèi)容能給大家?guī)?lái)幫助。如有不準(zhǔn)確之處歡迎指正。