對將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為可操作的商業(yè)智能的美好前景感到興奮?你需要做的第一步是創(chuàng)建一個(gè)可以處理PB級數(shù)據(jù)的存儲架構(gòu)。EMC Isilon的Nick Kirsch表示,橫向擴(kuò)展NAS(網(wǎng)絡(luò)附加存儲)是最佳解決方案,他還為首席信息官提供了用以判斷橫向擴(kuò)展NAS的五個(gè)原則。
隨著企業(yè)開始進(jìn)軍大數(shù)據(jù)世界---數(shù)字化紙張文件和保存電子郵件通信,Word文檔、Excel文件和各種其他非結(jié)構(gòu)化數(shù)據(jù)都可能轉(zhuǎn)變成可操作的商業(yè)智能,不過企業(yè)首先需要解決一個(gè)大問題:存儲。
“企業(yè)累積了越來越多的數(shù)據(jù),信息量達(dá)到PB級,”EMC Isilon公司產(chǎn)品管理主管Nick Kirsch表示,“他們面臨著類似的挑戰(zhàn):他們面對如此龐大的信息量,他們該如何利用?他們該如何將這些信息存儲在可擴(kuò)展的架構(gòu)中?”
一種可能性是垂直擴(kuò)展。垂直擴(kuò)展也就是使用新的高容量設(shè)備替換你現(xiàn)有的存儲設(shè)備,讓你現(xiàn)有的存儲節(jié)點(diǎn)變大變快,甚至更強(qiáng)大。以這種方式來加強(qiáng)存儲基礎(chǔ)設(shè)施很有吸引力,因?yàn)檫@種方式簡化了管理,并減少了占地空間和電力消耗。但是這種方式并非沒有問題:它不能簡單地跨越多個(gè)地點(diǎn),它沒有很多固有的整體靈活性,并且大型高性能存儲設(shè)備價(jià)格很昂貴,在處理不斷增加的信息洪水時(shí),最大的問題就是現(xiàn)在的存儲設(shè)備只有那么大。
“你可以建立越來越大的單一單元控制器,”Kirsch表示,“但是在某些時(shí)候,你不能夠讓系統(tǒng)變得更大,你必須添加第二個(gè)系統(tǒng),最終你可能需要管理數(shù)百個(gè)獨(dú)立單元。”
Kirsch表示,水平擴(kuò)展(橫向擴(kuò)展)NAS是一個(gè)不錯(cuò)的選擇。橫向擴(kuò)展NAS架構(gòu)沒有選擇昂貴的高容量存儲設(shè)備來作為存儲元件組合到總存儲池。橫向擴(kuò)展NAS并不是讓節(jié)點(diǎn)變得更大,你按照需要來添加節(jié)點(diǎn)。這種方法的缺點(diǎn)就是你可能很快就會(huì)面臨一個(gè)更為復(fù)雜的管理環(huán)境。但是這種方式可以跨越多個(gè)地點(diǎn),并且有很大的固有靈活性。也許從管理大數(shù)據(jù)的角度來看,最重要的事情在于你能夠快速地低成本地添加存儲。
Kirsch表示:“當(dāng)涉及存儲時(shí),人們最大的抱怨就是真的很容易管理單個(gè)單元,但是當(dāng)你有兩個(gè)或者更多單元時(shí),管理就變得很復(fù)雜。”
對于大數(shù)據(jù),NAS是比SAN更好的選擇,Kirsch表示,因?yàn)镾AN并不是為非結(jié)構(gòu)化數(shù)據(jù)和文件共享而建立的。為了與網(wǎng)絡(luò)協(xié)議(例如NFS或者CIF/SMB)一起使用SAN,然而,你必須在SAN前面部署文件服務(wù)器,這會(huì)增加管理復(fù)雜性,并會(huì)影響可擴(kuò)展性。
橫向擴(kuò)展NAS的五個(gè)原則
Kirsch為首席信息官選擇橫向擴(kuò)展NAS架構(gòu)提供了以下五個(gè)原則,宗旨是簡單至上:
易于擴(kuò)展 “企業(yè)需要選擇的下一代存儲架構(gòu)應(yīng)該是易于擴(kuò)展的,”Kirsch表示,“如果我有1TB驅(qū)動(dòng)器,這就是我可以管理、可以保護(hù)和可以復(fù)制的數(shù)據(jù)卷。為什么管理15PB數(shù)據(jù)不能也像這么簡單?不能因?yàn)閿?shù)據(jù)量變大了,事情就變得復(fù)雜了。”橫向擴(kuò)展架構(gòu)可以通過軟件管理和虛擬化/抽象層(讓這些節(jié)點(diǎn)像單個(gè)系統(tǒng)一樣)來解決這個(gè)問題。
可預(yù)見性 “性能應(yīng)該是具有可預(yù)見性的,”Kirsch表示,如果我這周增加了6TB,下周增加了6TB,我希望在性能方面具有相同的線性可擴(kuò)展性。我不希望還要重新設(shè)計(jì)我的應(yīng)用程序或者重新教育我的用戶。應(yīng)該以可預(yù)見性的方式來擴(kuò)展。我希望根據(jù)預(yù)測的增長情況來增加開支,不要讓我過分投資。我知道摩爾定律下個(gè)月將會(huì)讓我們實(shí)現(xiàn)更快的計(jì)算速度,并且驅(qū)動(dòng)器也會(huì)隨著時(shí)間的推移密度變得更大。下一代存儲架構(gòu)最好能夠利用我現(xiàn)有的存儲基礎(chǔ)設(shè)施的優(yōu)勢,并且應(yīng)該是共享對稱架構(gòu)。不要試圖讓我了解你的架構(gòu)的差異,讓我根據(jù)需要來擴(kuò)展系統(tǒng)。
有效性 “讓我利用我的存儲系統(tǒng)中的所有資源,無論它們在什么位置,”Kirsch表示,“讓我充分利用我的物理磁盤驅(qū)動(dòng)器,不是50%或者55%,而是80%以上的存儲利用率。無論CPU、計(jì)算或緩存在哪里,我能夠利用它們。我想要存儲系統(tǒng)最大化利用應(yīng)用程序的性能。另外,請將分層整合到存儲系統(tǒng)。”換句話說,你需要移動(dòng)數(shù)據(jù)來優(yōu)化性能或者優(yōu)化容量。對付大數(shù)據(jù)的橫向擴(kuò)展NAS應(yīng)該具備足夠的智能能夠?qū)⑦@一過程自動(dòng)化。
可用性 “它必須是在任何時(shí)間都可用的,”Kirsch表示,“利用N-way架構(gòu)的優(yōu)勢。讓我能夠從兩次以上故障中恢復(fù)過來。讓網(wǎng)絡(luò)環(huán)境的某個(gè)機(jī)架出現(xiàn)故障時(shí),讓我也能夠及時(shí)恢復(fù)。同時(shí),必須具有靈活性。讓我可以根據(jù)業(yè)務(wù)部門的需求來保護(hù)系統(tǒng)。如果他們愿意投入更多資金,我可以為他們提供更大的可用性。如果數(shù)據(jù)不太重要,我可以減少這些數(shù)據(jù)的可用性。”歸根到底,由于橫向擴(kuò)展NAS存儲基礎(chǔ)設(shè)施是建立在商業(yè)硬件之上,那么硬件可能會(huì)出現(xiàn)故障,系統(tǒng)應(yīng)該被設(shè)計(jì)為能夠處理較高頻率的硬件故障。
企業(yè)保障 Kirsch表示,“由于這項(xiàng)技術(shù)已經(jīng)成熟,它應(yīng)該是IT的關(guān)鍵部分,這個(gè)系統(tǒng)應(yīng)該具有快照、復(fù)制等所有其他傳統(tǒng)IT功能。這項(xiàng)技術(shù)是從HPC root逐漸發(fā)展出來的,但是如果你打算建立一個(gè)橫向擴(kuò)展系統(tǒng),你必須以適應(yīng)企業(yè)環(huán)境的方式來建立。”(鄒錚編譯)