在許多IT領(lǐng)域中,開源軟件已經(jīng)變得越來越重要。如今,隨著存儲逐漸變成軟件定義存儲,存儲領(lǐng)域也在發(fā)生著重大的轉(zhuǎn)變。雖然Ceph并不是唯一的可行和流行的選項(xiàng),但它們無疑是開源存儲運(yùn)動(dòng)的寵兒。
統(tǒng)一存儲平臺最早源自加州的一篇博士論文,即便不是最受歡迎的選項(xiàng),Ceph也無疑是最受歡迎的針對OpenStack部署的軟件層中的選項(xiàng)之一。作為OpenStack主導(dǎo)的云計(jì)算消費(fèi),Ceph具有相當(dāng)大的優(yōu)勢。
重要廠商的一路支持也給了這一開源項(xiàng)目許多幫助,因?yàn)楸M管很大一部分用戶樂于使用軟件并依賴于社區(qū)支持,但是還是有很多用戶的開源項(xiàng)目需要付費(fèi)的專業(yè)支持。由開發(fā)者Sage Weil創(chuàng)建的Inktank Storage公司的主要業(yè)務(wù)是為Ceph項(xiàng)目提供商業(yè)化的服務(wù)和支持,該公司在2014年被紅帽所收購,這讓Ceph隨之獲得了紅帽的支持。
Ceph項(xiàng)目的創(chuàng)建者 Sage Weil
除了紅帽對Ceph的研發(fā)支持外,隨著該平臺被多家硬件和系統(tǒng)供應(yīng)商接受,該平臺還獲得了許多專業(yè)廠商的支持,其中最著名的廠商是富士通。與此同時(shí),一些規(guī)模較小的廠商也開始推出自己的超大規(guī)模存儲設(shè)備。
那么,是什么正在推動(dòng)Ceph在正規(guī)的機(jī)構(gòu)和組織中展開部署呢?
為什么Ceph會如此出眾?尤其是在我們能夠選擇像Gluster、Lustre、MogileFS、Skylable,以及OpenStack的 Swift、Cinder和Manilla等免費(fèi)或開源存儲平臺的情況下。這些免費(fèi)或開源存儲平臺也同樣擁有想要實(shí)現(xiàn)超大規(guī)模存儲的雄心壯志。
為什么Ceph如此出眾?
當(dāng)然部分原因是因?yàn)镃eph是軟件定義存儲,正如上面所提到的那樣,同時(shí)它還是開源和企業(yè)級的。另一個(gè)重要的方面是Ceph還是統(tǒng)一存儲,可通過一個(gè)單一的存儲系統(tǒng)提供對象、塊和文件服務(wù)。
Ceph的創(chuàng)始人,如今在紅帽中擔(dān)任Ceph首席架構(gòu)師的Sage Weil說:
“雖然Ceph在云端對象存儲方面正在Swift展開競爭,但是我們常常提及的Ceph的使用案例讓它同時(shí)與那些專利方案展開競爭。Cinder只是一個(gè)代理API,為訪問塊存儲提供了一個(gè)通用接口,它們本身不提供任何存儲,因此它們是一個(gè)賦能者而并非競爭對手。”
開發(fā)者基本上都使用對象存儲的主要原因在于,它能夠很好地滿足超大規(guī)模存儲的需求。實(shí)際上,超大規(guī)模存儲主要是應(yīng)對系統(tǒng)中正飛速增長且規(guī)模不確定的數(shù)據(jù)量,實(shí)現(xiàn)對這些海量信息的高效存儲。
超大規(guī)模存儲在許多方面都不同于傳統(tǒng)的企業(yè)存儲,最顯著的不同之處在于——規(guī)模和應(yīng)用負(fù)載。通常,超大規(guī)模存儲將通過更少的應(yīng)用來服務(wù)更多的用戶,企業(yè)存儲剛好相反,它們支持更多的應(yīng)用,但是支持的用戶數(shù)量卻不多。
超大規(guī)模存儲也趨向于軟件定義,通過自動(dòng)化盡量減少管理員和其他所需人員的人數(shù)、模塊和橫向擴(kuò)展。因此,它們的擴(kuò)展是通過向集群增加節(jié)點(diǎn)的方式進(jìn)行的,并且針對在商用存儲中實(shí)現(xiàn)每拍字節(jié)的最大原始容量和最低成本進(jìn)行了專門的優(yōu)化。
最重要的是,這些系統(tǒng)最終超越了RAID等過時(shí)的技術(shù),因?yàn)榇疟P容量的高速增長已經(jīng)導(dǎo)致無法在短時(shí)間內(nèi)修復(fù)失效的RAID組,從而無力保證安全性和可靠性。Ceph則可以通過更高的吞吐量橫跨多個(gè)節(jié)點(diǎn)復(fù)制單個(gè)文件,這讓它們具有了容錯(cuò)能力和自我修復(fù)能力。此外,它們還可以復(fù)制被頻繁訪問的對象,以提供負(fù)載均衡。
正如Evaluator集團(tuán)的高級分析師Eric Slack所指出來的那樣,Ceph所面臨的挑戰(zhàn)是“超大規(guī)模存儲夢想”和對于普通機(jī)構(gòu)來說其可行程度之間的差距。他說:“人們知道亞馬遜、 facebook和谷歌正在做什么,并且會說‘這很酷呀!’,我也應(yīng)該這么做。然而當(dāng)真正部署時(shí),我們才發(fā)現(xiàn),這些超大規(guī)模存儲的部署者都擁有大量優(yōu)化的人才在幫他們編寫軟件,并且他們會采購數(shù)千個(gè)單元,而這是普通企業(yè)無法做到的。”
Slack認(rèn)為,一個(gè)解決辦法是采取超融合路線,但這常常意味著廠商鎖定;另一個(gè)辦法是通過設(shè)備予以解決。他指出,許多企業(yè)會將超大規(guī)模的軟件定義存儲與硬件、服務(wù)和支持捆綁在一起。
對于那些相信開源商業(yè)故事的用戶來說,Ceph是一個(gè)不錯(cuò)的選擇。幫助客戶管理風(fēng)險(xiǎn)防范詐騙的美國預(yù)測分析公司FICO的云開發(fā)主管Nick Gerasimatos說:“Ceph是我們常用的多用途對象存儲。我們也使用SolidFire全閃存陣列,但當(dāng)我們部署一個(gè)新應(yīng)用時(shí),我們會首先嘗試將它們部署在Ceph上,對它進(jìn)行負(fù)載測試,如果它能夠很好地工作,我們就會把應(yīng)用留在Ceph上。”