什么是集群存儲(chǔ)?
集群,可提供按比例增加的服務(wù)器或存儲(chǔ)資源的性能、容量、可靠性及可用性,突破了單機(jī)設(shè)備的種種限制,已成為被廣泛使用的技術(shù)。傳統(tǒng)的存儲(chǔ)系統(tǒng)由于其物理組成(如磁盤驅(qū)動(dòng)器數(shù)量、所連接的服務(wù)器數(shù)量、內(nèi)存大小以及控制器性能)的限制,會(huì)造成很多功能上的局限,如支持文件系統(tǒng)的數(shù)量、快照或復(fù)制的數(shù)量等等。企業(yè)一旦遇到存儲(chǔ)系統(tǒng)的瓶頸,就只能不斷的升級(jí)到更大的存儲(chǔ)系統(tǒng)并添加更多的管理工具。
集群存儲(chǔ)是通過(guò)將數(shù)據(jù)分布到集群中各節(jié)點(diǎn)的存儲(chǔ)方式,提供單一的使用接口與界面,使用戶可以方便地對(duì)所有數(shù)據(jù)進(jìn)行統(tǒng)一使用與管理。集群中所有磁盤設(shè)備整合到單一的共享存儲(chǔ)池中提供給前端的應(yīng)用服務(wù)器,極大提高了磁盤利用率,可以為非結(jié)構(gòu)化數(shù)據(jù)提供具備極高IO帶寬和靈活可擴(kuò)展性的存儲(chǔ)解決方案。
對(duì)于集群存儲(chǔ)產(chǎn)品的實(shí)際能力的評(píng)估,主要通過(guò)其容量及性能伸縮的能力,可訪問(wèn)性(Accessibility,塊或文件級(jí))、可用性和使用的難易程度的幾方面來(lái)考核。不過(guò),集群存儲(chǔ)并非就是那些高不可攀的、聯(lián)合HPC(High performance computing,高性能計(jì)算)環(huán)境一起使用的大型順序帶寬(Sequential bandwidth)或并行文件系統(tǒng)的代名詞,多用途的集群存儲(chǔ)支持傳統(tǒng)的商業(yè)應(yīng)用,如電子郵件、數(shù)據(jù)庫(kù)和在線事務(wù)處理(OLTP)等。
此前,跟各位讀者分享了集群存儲(chǔ)的概念,這里再與各位分享一下集群存儲(chǔ)的六大特點(diǎn):
1. 開(kāi)放式架構(gòu)(高擴(kuò)展性)
它針對(duì)集群存儲(chǔ)內(nèi)部構(gòu)成元素而言。一般集群存儲(chǔ)應(yīng)該包括存儲(chǔ)節(jié)點(diǎn)、前端網(wǎng)絡(luò)、后端網(wǎng)絡(luò)等三個(gè)構(gòu)成元素,每個(gè)元素都可以非常容易地采用業(yè)界最新技術(shù)而不用改變集群存儲(chǔ)的架構(gòu),且擴(kuò)展起來(lái)非常方便,像搭積木一樣進(jìn)行存儲(chǔ)的擴(kuò)展。特別是對(duì)于那些對(duì)數(shù)據(jù)增長(zhǎng)趨勢(shì)較難預(yù)測(cè)的用戶,可以先購(gòu)買一部分存儲(chǔ),當(dāng)有需求的時(shí)候,隨時(shí)添加,而不會(huì)影響現(xiàn)有存儲(chǔ)的使用。
2. 分布式操作系統(tǒng)
這是集群存儲(chǔ)的靈魂所在。所有對(duì)集群存儲(chǔ)的操作都經(jīng)由分布式操作系統(tǒng)統(tǒng)一調(diào)度和分發(fā),分散到集群存儲(chǔ)各個(gè)存儲(chǔ)節(jié)點(diǎn)上完成。使用分布式操作系統(tǒng)帶來(lái)的好處是各節(jié)點(diǎn)之間沒(méi)有任何區(qū)別,沒(méi)有主次、功能上的區(qū)別,所有存儲(chǔ)節(jié)點(diǎn)功能完全一致,這樣才能真正做到性能最優(yōu)。
3. 統(tǒng)一命名空間
統(tǒng)一命名空間在很多廠家的存儲(chǔ)概念中都出現(xiàn)過(guò)。在集群存儲(chǔ)中,統(tǒng)一命名空間強(qiáng)調(diào)的是同一個(gè)文件系統(tǒng)下的統(tǒng)一命名空間。它同樣可以支持上PB級(jí)別的存儲(chǔ)空間。如果是通過(guò)將若干有空間上限的卷掛載到某一個(gè)根目錄的方式來(lái)達(dá)到統(tǒng)一命名空間,其效率和出現(xiàn)存儲(chǔ)熱點(diǎn)時(shí)的性能將會(huì)大大低于把上PB級(jí)別的存儲(chǔ)空間置于同一個(gè)文件系統(tǒng)下管理的統(tǒng)一命名空間。
4. 易管理性
目前存儲(chǔ)業(yè)界的管理方式都是通過(guò)各廠商的管理工具,或通過(guò)Web界面進(jìn)行管理和配置,往往客戶端還需要安裝相關(guān)軟件才能訪問(wèn)到存儲(chǔ)上的空間。隨著需要管理的存儲(chǔ)空間逐漸增大,管理存儲(chǔ)的復(fù)雜度和管理人員的數(shù)量也將會(huì)隨之增加。而集群存儲(chǔ)應(yīng)該提供一種集中的、簡(jiǎn)便易用的管理方式,對(duì)客戶端沒(méi)有任何影響,采用業(yè)界標(biāo)準(zhǔn)的訪問(wèn)協(xié)議(比如NFS,CIFS)訪問(wèn)集群存儲(chǔ)。
5. 負(fù)載均衡
集群存儲(chǔ)通過(guò)分布式操作系統(tǒng)的作用,會(huì)在前端和后端都實(shí)現(xiàn)負(fù)載均衡。前端訪問(wèn)集群存儲(chǔ)的操作,通過(guò)幾種負(fù)載均衡策略,將訪問(wèn)分散到集群存儲(chǔ)的各個(gè)存儲(chǔ)節(jié)點(diǎn)上。后端訪問(wèn)數(shù)據(jù),通過(guò)開(kāi)放式的架構(gòu)和后端網(wǎng)絡(luò),數(shù)據(jù)會(huì)分布在所有節(jié)點(diǎn)上進(jìn)行存放和讀取。
6. 高性能
關(guān)于高性能領(lǐng)域,目前對(duì)集群存儲(chǔ)的討論還僅局限在高帶寬、高并發(fā)訪問(wèn)的應(yīng)用模式下。毫無(wú)疑問(wèn),集群存儲(chǔ)對(duì)于該類應(yīng)用可以提供比傳統(tǒng)存儲(chǔ)架構(gòu)更優(yōu)的性能。但目前應(yīng)用除了高帶寬、高并發(fā)訪問(wèn)類的之外,還有高IOPS、隨機(jī)訪問(wèn)、小文件訪問(wèn)以及備份歸檔等其他類的應(yīng)用,集群存儲(chǔ)應(yīng)該在以上領(lǐng)域同樣提供高性能的解決方案。