當(dāng)前并不缺乏提高數(shù)據(jù)存儲(chǔ)效率的新技術(shù),但是這些存儲(chǔ)技術(shù)大多關(guān)注備份和歸檔,而不是關(guān)注主存儲(chǔ)。但是,如果公司開始精簡(jiǎn)主存儲(chǔ)的數(shù)據(jù),就必須了解主存儲(chǔ)優(yōu)化具有哪些需求。
主存儲(chǔ)通常稱為Tier 1存儲(chǔ),其特征為用于存儲(chǔ)活動(dòng)數(shù)據(jù)——經(jīng)常需要訪問的數(shù)據(jù),以及要求高性能、低延遲、高可用性的數(shù)據(jù)。主存儲(chǔ)通常用于托管關(guān)鍵任務(wù)程序,如數(shù)據(jù)庫、電子郵件和事務(wù)處理。大多數(shù)重要程序采用隨機(jī)數(shù)據(jù)訪問模式,具有不同的訪問要求,但是都能產(chǎn)生大量數(shù)據(jù),公司可以利用這些數(shù)據(jù)完成業(yè)務(wù)。因此,公司會(huì)創(chuàng)建大量的數(shù)據(jù)副本,復(fù)制數(shù)據(jù)供分布式用途,建立數(shù)據(jù)倉庫,然后將數(shù)據(jù)備份和歸檔,實(shí)現(xiàn)安全保存。
最初,大部分?jǐn)?shù)據(jù)都是主數(shù)據(jù)。隨著數(shù)據(jù)的存在時(shí)間增長(zhǎng),通常移動(dòng)到次級(jí)和三級(jí)存儲(chǔ)。因此,如果公司能夠減少主存儲(chǔ)的足跡,就能充分利用容量,降低整個(gè)數(shù)據(jù)生命周期的成本。換句話說,一部分主存儲(chǔ)足跡轉(zhuǎn)化為更少的數(shù)據(jù),從而實(shí)現(xiàn)復(fù)制、存入倉庫、歸檔和備份。
壓縮和重復(fù)數(shù)據(jù)刪除技術(shù)
主存儲(chǔ)管理員試圖減少主存儲(chǔ)的足跡,可能會(huì)考慮兩種數(shù)據(jù)精簡(jiǎn)方法:實(shí)時(shí)壓縮和重復(fù)數(shù)據(jù)刪除。
直至最近,數(shù)據(jù)壓縮技術(shù)才在主存儲(chǔ)中得到廣泛應(yīng)用,而且是出于對(duì)性能的關(guān)注。但是,Storwize等供應(yīng)商提供的解決方案采用實(shí)時(shí)、隨機(jī)訪問的壓縮/解壓縮技術(shù),能實(shí)現(xiàn)15:1的足跡精簡(jiǎn)比。由于壓縮比例和實(shí)時(shí)性能很高,壓縮方案成為主存儲(chǔ)數(shù)據(jù)精簡(jiǎn)的考慮方案。
重復(fù)數(shù)據(jù)刪除技術(shù)在備份程序中非常流行,同樣也可在主存儲(chǔ)中應(yīng)用。這樣,在成千上萬的文件中識(shí)別數(shù)據(jù)冗余塊非常費(fèi)時(shí),而且使存儲(chǔ)處理器變得非常敏感,活動(dòng)數(shù)據(jù)的性能也會(huì)受到影響。這就意味著只有活動(dòng)數(shù)據(jù)陳舊到一定程度,才會(huì)被處理。這方面的供應(yīng)商包括NetApp、Data Domain和Ocarina Networks等公司。
部署主存儲(chǔ)優(yōu)化方案具有六大需求
需求1:性能零影響
與備份或歸檔存儲(chǔ)不同的是,相比通過某種形式的數(shù)據(jù)精簡(jiǎn)才得以節(jié)省的容量,活動(dòng)數(shù)據(jù)組的性能更為重要。因此,選擇的數(shù)據(jù)精簡(jiǎn)技術(shù)必須對(duì)性能毫無影響。技術(shù)只需簡(jiǎn)單地發(fā)揮作用;相當(dāng)于“打開某個(gè)開關(guān),消耗的存儲(chǔ)就相應(yīng)減少了”。
換句話說,這就意味著只對(duì)這類文件執(zhí)行重復(fù)刪除功能:今后不再訪問,但仍位于活動(dòng)存儲(chǔ)池——不太活躍的存儲(chǔ)層。
重復(fù)數(shù)據(jù)刪除技術(shù)能夠避免性能瓶頸,因?yàn)槠浣ㄗh只刪除簡(jiǎn)單并重復(fù)的I/O工作負(fù)荷。因此,IT基礎(chǔ)架構(gòu)的關(guān)鍵組件通常不能在存儲(chǔ)中得到優(yōu)化。位于關(guān)鍵組件清單之首的是數(shù)據(jù)庫。數(shù)據(jù)庫Tier 1存儲(chǔ)中非常活躍的組件,不僅僅是一種簡(jiǎn)單的工作負(fù)荷,因此重復(fù)刪除過程從來不分析數(shù)據(jù)庫。這樣,數(shù)據(jù)庫占據(jù)的主存儲(chǔ)空間并沒有得到優(yōu)化。
另外,實(shí)時(shí)壓縮系統(tǒng)能即時(shí)壓縮流過產(chǎn)品的所有數(shù)據(jù)。這就具有很大的好處,除了節(jié)省容量,還能提高存儲(chǔ)性能。壓縮以后,每次I/O請(qǐng)求交付的數(shù)據(jù)量會(huì)大大增加,磁盤緩存空間擴(kuò)大,每次讀寫操作的效率提高。
網(wǎng)絡(luò)效應(yīng)也能精簡(jiǎn)磁盤容量,提高存儲(chǔ)的總體性能。
主存儲(chǔ)重復(fù)刪除的第二個(gè)好處是:所有的數(shù)據(jù)都得以精簡(jiǎn),由所有數(shù)據(jù)(包括數(shù)據(jù)庫)分擔(dān)空間節(jié)省要求。Oracle環(huán)境下的實(shí)時(shí)數(shù)據(jù)壓縮功能會(huì)產(chǎn)生性能問題,可以利用測(cè)試過程提高性能。
問題的另一方面在于對(duì)存儲(chǔ)控制器本身的性能影響。今天的存儲(chǔ)控制器需要完成許多工作,而不僅僅是滿足磁盤需求,還要管理各種協(xié)議、執(zhí)行復(fù)制、管理快照。增加一項(xiàng)功能可能會(huì)超過控制器的承受范圍,即使控制器能夠處理附加的工作負(fù)載,存儲(chǔ)管理員也必須認(rèn)識(shí)到:多一項(xiàng)功能,可能帶來I/O瓶頸。將壓縮功能卸載到外部產(chǎn)品中,就移除了一個(gè)性能變量,完全不會(huì)影響存儲(chǔ)控制器。