保持?jǐn)?shù)據(jù)的動態(tài)調(diào)整
根據(jù)Paquet的研究,雖然用戶希望能夠隨時隨地訪問數(shù)據(jù),但是80%的非結(jié)構(gòu)化數(shù)據(jù)在90天以后就不再被訪問。
分級對于降低成本是非常關(guān)鍵的。因為分級不僅僅意味著根據(jù)存儲類型來進(jìn)行(比如最重要的數(shù)據(jù)放在SSD上,而80%的非結(jié)構(gòu)化數(shù)據(jù)放在磁帶上),還要有一些位于二者之間的分級選項。Paquet建議如果數(shù)據(jù)不再使用,則應(yīng)該移到低級別的存儲上。
“慢速的存儲意味著較低的能耗。我們要找到更有效、更有管理性和更具邏輯性的工作方式。”Paquet說。
然而,梳理應(yīng)用并歸檔那些最不常用的信息正變得越來越復(fù)雜,尤其是當(dāng)自動分級技術(shù)會假定所有數(shù)據(jù)都是關(guān)鍵性的時。
而且,一位要求匿名的IT總監(jiān)(來自于一家主流電器制造商)表示:“歸檔過程經(jīng)常中斷。我們通常會對數(shù)月長度的數(shù)據(jù)進(jìn)行歸檔,如果軟件故障導(dǎo)致了中斷,我們不得不解決問題然后再把更長時間段的數(shù)據(jù)歸檔?!?/P>
刪除重復(fù)數(shù)據(jù)以達(dá)成更佳控制
雖然歸檔方案不斷的在改進(jìn),專家認(rèn)為重復(fù)數(shù)據(jù)刪除已經(jīng)成為降低數(shù)據(jù)規(guī)模的標(biāo)準(zhǔn)思路。重復(fù)數(shù)據(jù)刪除可以刪去數(shù)據(jù)拷貝并對文本進(jìn)行優(yōu)化。音頻和視頻文件通常不能很好地進(jìn)行重復(fù)數(shù)據(jù)刪除,因為比如MP3和MP4文件等已經(jīng)是經(jīng)過壓縮的。
在科羅拉多公共安全署,Richey采用CommVault Systems Inc的Simpana產(chǎn)品來存儲和歸檔超過40TB的數(shù)據(jù),其中包括DNA記錄和犯罪檔案:“州警方就生成了7TB的數(shù)據(jù),通過Simpana的重復(fù)數(shù)據(jù)刪除服務(wù),數(shù)據(jù)規(guī)模被壓縮到了原來的60%?!?/P>
“我們的數(shù)據(jù)在持續(xù)增長。我們是否匯集了過多數(shù)據(jù)?劃分粒度是否太細(xì)?如何才能防止粒度過細(xì)?現(xiàn)在,我有三個正式成員全天專注在數(shù)據(jù)采集和報告生成的工作上。”Richey說。