即使是最隨意的觀察家也不得不承認(rèn)過去幾年來重復(fù)數(shù)據(jù)刪除和固態(tài)驅(qū)動(dòng)器(SSD)——以及無處不在的云——是存儲(chǔ)界最熱門的技術(shù)。不過,直到最近,它們還是分別用于非常不同的領(lǐng)域。固態(tài)存儲(chǔ)是用來解決性能問題的,而重復(fù)數(shù)據(jù)刪除——盡管剛剛進(jìn)入主存儲(chǔ)領(lǐng)域——是用來解決效率問題的,而且主要用于二級(jí)存儲(chǔ)系統(tǒng)。
其實(shí),就好像巧克力和花生醬那樣,如果重復(fù)數(shù)據(jù)刪除和SSD合起來發(fā)揮作用,那么它們合力的價(jià)值要高于它們各自發(fā)揮作用的價(jià)值的總和。大多數(shù)存儲(chǔ)人員不愿意在主存儲(chǔ)上部署重復(fù)數(shù)據(jù)刪除技術(shù)或數(shù)據(jù)壓縮技術(shù),擔(dān)心數(shù)據(jù)縮減技術(shù)會(huì)導(dǎo)致系統(tǒng)損失必要的性能。固態(tài)磁盤從單位容量的角度來看很貴,但是從單位IOPS(每秒輸入輸出)的角度來看又比較便宜。如果數(shù)據(jù)縮減技術(shù)和SSD的組合可以排除冗余數(shù)據(jù),同時(shí)又不對(duì)性能產(chǎn)生多少影響,那么這會(huì)是一個(gè)相當(dāng)合理的組合。
在線重復(fù)數(shù)據(jù)刪除會(huì)給磁盤寫入增加一點(diǎn)延遲,因?yàn)橄到y(tǒng)要檢查塊、散列值以觀察數(shù)據(jù)是否是重復(fù)的。任何一個(gè)曾經(jīng)從重復(fù)數(shù)據(jù)刪除數(shù)據(jù)倉庫中恢復(fù)過數(shù)據(jù)的人可以告訴你重復(fù)數(shù)據(jù)刪除還會(huì)給讀取性能帶來一定影響,因?yàn)檫壿嬌享樞驅(qū)懭胂到y(tǒng)的數(shù)據(jù)要重新組合或者說要從數(shù)據(jù)倉庫中寫入塊那里“重構(gòu)”。
如果我們將重復(fù)數(shù)據(jù)刪除過的數(shù)據(jù)存儲(chǔ)在一個(gè)固態(tài)存儲(chǔ)陣列而不是旋轉(zhuǎn)式磁盤陣列上,那么讀取性能問題就解決了。這是因?yàn)镾SD對(duì)隨機(jī)讀取I/O請(qǐng)求的響應(yīng)速度與對(duì)順序I/O請(qǐng)求的響應(yīng)速度一樣。雖然,重復(fù)數(shù)據(jù)刪除或數(shù)據(jù)壓縮可能會(huì)導(dǎo)致數(shù)據(jù)寫入的延遲時(shí)間從500微秒增加到1毫妙,但是由于商業(yè)級(jí)或企業(yè)級(jí)SSD的寫入延遲一般都低于3毫秒,增加后的延遲時(shí)間仍然要低于普通1.5萬轉(zhuǎn)磁盤驅(qū)動(dòng)器的5毫秒延遲時(shí)間。
一個(gè)中端的商業(yè)級(jí)多層單元(MLC)SSD,比如美光的P400e或英特爾的510,每秒可以提供8000次4K IOPS的性能。一個(gè)陣列如果使用20個(gè)這樣的驅(qū)動(dòng)器,同時(shí)配置RAID(獨(dú)立磁盤冗余陣列)10,將可以提供8萬次IOPS的性能。即使我們的重復(fù)數(shù)據(jù)刪除引擎導(dǎo)致速度損失15%,陣列仍然可以提供6.8萬次IOPS的性能,相當(dāng)于340個(gè)1.5萬轉(zhuǎn)旋轉(zhuǎn)式磁盤驅(qū)動(dòng)器的性能。
接下來的問題是寫入耐久性。大多數(shù)管理員對(duì)MLC閃存SSD的主要顧慮就是每頁閃存只能擦除和重寫入3000到5000次。對(duì)數(shù)據(jù)進(jìn)行重復(fù)數(shù)據(jù)刪除可以減少必須寫入閃存的數(shù)據(jù)量,從而延長(zhǎng)閃存的壽命。再加上陣列范圍的負(fù)載均衡和可以限制全頁面寫入的基于日志的數(shù)據(jù)結(jié)構(gòu),重復(fù)數(shù)據(jù)刪除可以減少擦除-重寫入頻率,從而延長(zhǎng)SSD的壽命。
包括Nimbus Data、Pure Storage和Solidfire在內(nèi)的多家廠商已經(jīng)在他們的固態(tài)陣列中加入了重復(fù)數(shù)據(jù)刪除功能。其中一些廠商還聲稱他們的單位容量成本在一定水平的重復(fù)數(shù)據(jù)刪除的作用下可以變得很低,不過另外一些廠商則認(rèn)為這種做法是具有誤導(dǎo)性的。不管怎么說,重復(fù)數(shù)據(jù)刪除和固態(tài)存儲(chǔ)的組合對(duì)我來說很有吸引力。