中國IDC圈8月16日報道:隨著數(shù)據(jù)中心和云環(huán)境中的大型數(shù)據(jù)不斷增長,如何管理同時傳輸數(shù)百萬條記錄的網(wǎng)絡成為前所未有亟待解決的問題。
這不僅僅是數(shù)據(jù)規(guī)模的問題——在涉及大型數(shù)據(jù)網(wǎng)絡解決方案時,不僅是數(shù)據(jù)規(guī)模確實不能小覷,而且工作量也是如此。大型數(shù)據(jù)環(huán)境不能簡單的按照過去的數(shù)據(jù)基礎架構(gòu)來運作。鑒于運行大型數(shù)據(jù)應用軟件的復雜性和速度,大型數(shù)據(jù)需要適合自己的解決方案。
“傳統(tǒng)”的數(shù)據(jù)分析體系結(jié)構(gòu)假設數(shù)據(jù)的來源有限,他們有大量的時間將數(shù)據(jù)存儲在正確數(shù)據(jù)庫的正確表格當中。當涉及到諸如推特,臉譜和谷歌所使用的網(wǎng)絡和應用軟件時,這種對待常規(guī)數(shù)據(jù)庫體系結(jié)構(gòu)的方法就好比將單個燈泡插在核反應堆上一樣問題立顯。
為了克服在短時間內(nèi)處理大容量數(shù)據(jù)的障礙,大型數(shù)據(jù)用戶設計了兩種不同的方法來解決這種問題。首先是部署大規(guī)模實時數(shù)據(jù)庫,比如BigTable, OpenDremel, MongoDB或者Cassandra.這些數(shù)據(jù)庫都共享非關聯(lián)的特性:他們不依賴標準化查詢語言(因此他們又被稱為"NoSQL"),他們也不能滿足關聯(lián)數(shù)據(jù)庫中所有數(shù)據(jù)都必須滿足的ACID需求。
另外一種解決方案是使用分析數(shù)據(jù)庫,諸如Hadoop,通過篩選大容量數(shù)據(jù)進行分類來達到目的。
這就意味著網(wǎng)絡和周圍基礎架構(gòu)關注的中心將從優(yōu)化存儲向優(yōu)化搜索轉(zhuǎn)移。也必須這么做,因為存儲在典型的大型數(shù)據(jù)環(huán)境中已經(jīng)被大大的簡化了,所有的重點是將數(shù)據(jù)分類來滿足有用的數(shù)據(jù)集,然后用于深層結(jié)論的分析。
但不幸的是,這種基礎方法只能應用于普通的大型數(shù)據(jù)網(wǎng)絡。在占地20000平方英尺的數(shù)據(jù)中心里,用來匹配這些數(shù)據(jù)解決方案的方法是多種多樣的。每種方法都有其必須被解決的固有問題。舉例來說,Hadoop使用代表單點故障大型數(shù)據(jù)管理器的NameNode體系結(jié)構(gòu)來應對非常敏感的數(shù)據(jù)。如果NameNode設備對網(wǎng)絡不起作用了,整個Hadoop系統(tǒng)也就癱瘓了,這就給網(wǎng)絡管理員來保障特殊服務器的正常運行造成了很大的壓力。
當然還有非網(wǎng)絡的解決方案。舉例來說,來自DataStax公司的產(chǎn)品Brisk就是要在Apache Cassandra的實時性能與Hadoop的分析能力之間搭建一座橋梁。Brisk將Hadoop的文件系統(tǒng)與Cassandra合并在一起,這就意味著不再會出現(xiàn)單點故障的問題。
大型數(shù)據(jù)和網(wǎng)絡體系結(jié)構(gòu)
這兩種選擇只是來自潛在大型數(shù)據(jù)體系結(jié)構(gòu)的冰山一角。單就這些解決方案的網(wǎng)絡體系結(jié)構(gòu)來說差異就已經(jīng)非常之大了。那么網(wǎng)絡管理者如何應對每天越來越多的大型數(shù)據(jù)呢?
諸如OpenFlow這樣的解決方案能有所幫助。OpenFlow是Open Networking Foundation產(chǎn)品的網(wǎng)絡基礎架構(gòu)協(xié)議。Open Networking Foundation存在的原因就是要執(zhí)行這種圍繞軟件定義網(wǎng)絡概念的協(xié)議OpenFlow.
軟件定義網(wǎng)絡的設計是為了解決諸如下面描述的這類問題:與構(gòu)建一招吃遍天下的網(wǎng)絡解決方案并迫使應用軟件使用這種解決方案來解決問題的方法不同,應用軟件本身就能定義網(wǎng)絡拓撲。OpenFlow通過簡化硬件和網(wǎng)絡管理,能幫助網(wǎng)絡管理員更加輕松的根據(jù)軟件定義網(wǎng)絡的規(guī)則來配置他們的網(wǎng)絡,從而降低大型數(shù)據(jù)網(wǎng)絡的網(wǎng)絡管理成本。
OpenFlow是一種低級別標準,不過廠商已經(jīng)開始尋找將他們自己的軟件設于OpenFlow之上的可能性。舉例來說,是否能設計出一種網(wǎng)絡管理工具能感知網(wǎng)絡流量和信息包工作負載的突然性大規(guī)模遷移,自動轉(zhuǎn)換配置來做出補償,當工作量完成后又返回“正常”模式呢?其實如果這種方法能得到廣泛的普及,OpenFlow將對“云網(wǎng)絡”——隨需效用網(wǎng)絡配置有所幫助。
這種方式非常重要。標準拓撲結(jié)構(gòu)下的交換機和路由器無法實現(xiàn)我們在此探討的帶寬。網(wǎng)絡本身逐漸成為大型數(shù)據(jù)解決方案的組成部分,諸如思科系統(tǒng)公司IOS產(chǎn)品線極力推廣的此類網(wǎng)絡即平臺解決方案應用正在變得越來越普遍。面對如此的復雜程度和數(shù)據(jù)規(guī)模,靈活的光纖連接方式正在快速成為網(wǎng)絡體系結(jié)構(gòu)的新寵。
OpenFlow解決方案將幫助網(wǎng)絡管理員按照需求自動控制網(wǎng)絡光纖的規(guī)模和形態(tài),就像幾年前讓流量按照意想不到的方式實現(xiàn)一樣。
這是一種網(wǎng)絡管理者必須適應的方式。云計算的大規(guī)模應用(公有云,私有云或者混合云)和大型數(shù)據(jù)應用軟件將在不久的將來滲入到每一家企業(yè)的應用環(huán)境當中。