筆者結(jié)合實際工作經(jīng)驗,與大量用戶交流與反饋,閱讀了國內(nèi)外一些書籍、互聯(lián)網(wǎng)資料,在本文就近十網(wǎng)絡(luò)發(fā)展、軟件定義網(wǎng)絡(luò)技術(shù)、發(fā)展趨勢和商業(yè)應(yīng)用等方面給出了業(yè)務(wù)挑戰(zhàn)、技術(shù)、經(jīng)濟分析和解決方案,希望對讀者有所啟發(fā)。
—— 面向云計算虛擬化與自動化的網(wǎng)絡(luò)
在云計算時代,數(shù)據(jù)中心將成為我們應(yīng)用和數(shù)據(jù)交付關(guān)鍵中心,用戶從園區(qū)、遠程分支點、無線和互聯(lián)網(wǎng)不同位置訪問數(shù)據(jù)與服務(wù),連接這些服務(wù)的網(wǎng)絡(luò)比以往來得更重要一些。云計算需要可靠的、橫向擴展和高性能網(wǎng)絡(luò),從用戶接入、互聯(lián)網(wǎng)到數(shù)據(jù)中心。大規(guī)模部署虛擬化與云計算催生了以工作負載為中心的下一代數(shù)據(jù)中心網(wǎng)絡(luò),復(fù)雜的網(wǎng)絡(luò)需要為工作負載提供端對端網(wǎng)絡(luò)資源響應(yīng)。如何應(yīng)對業(yè)務(wù)快速響應(yīng)需求是下一代數(shù)據(jù)中心網(wǎng)絡(luò)人員不得不面對的挑戰(zhàn)。以新觀點來解決網(wǎng)絡(luò)在新應(yīng)用下的挑戰(zhàn),控制平面與轉(zhuǎn)發(fā)平面分離,軟件定義網(wǎng)絡(luò)為人們提供了新思路和新方法。筆者結(jié)合實際工作經(jīng)驗,與大量用戶交流與反饋,閱讀了國內(nèi)外一些書籍、互聯(lián)網(wǎng)資料,在本文就近十網(wǎng)絡(luò)發(fā)展、軟件定義網(wǎng)絡(luò)技術(shù)、發(fā)展趨勢和商業(yè)應(yīng)用等方面給出了業(yè)務(wù)挑戰(zhàn)、技術(shù)、經(jīng)濟分析和解決方案,希望對讀者有所啟發(fā)。
云計算網(wǎng)絡(luò)發(fā)展挑戰(zhàn)
云計算是實現(xiàn)方便、快速、簡單、按需訪問可配置計算資源的管理模型 (部分定義來自nist),云計算是企業(yè)IT資源管理的高級階段,隨業(yè)務(wù)變化而變化,而不僅僅是IT技術(shù)簡單合并與應(yīng)用。云計算所包含內(nèi)容非常廣泛,分成不同層次,從最接近用戶的上層到最下面的物理層,包含有業(yè)務(wù)接口層、應(yīng)用平臺層、分布式操作系統(tǒng)層、虛擬化層、硬件架構(gòu)層和數(shù)據(jù)中心設(shè)施層、運營商網(wǎng)絡(luò)層,同時有支撐不同層次之間管理和平臺,技術(shù)之外就作為商業(yè)模式出現(xiàn)的云服務(wù)交付體系和互聯(lián)互通標準等。而架構(gòu)即服務(wù)云計算是什么呢,很簡單,就是根據(jù)用戶需求,在虛擬化層、硬件層和數(shù)據(jù)中心設(shè)施基礎(chǔ)等實現(xiàn)動態(tài)資源管理與調(diào)配的云計算服務(wù),具備了這些特征計算模式就可以稱之為架構(gòu)即服務(wù)云。
云計算高級智能模式將使每個計算節(jié)點進化成獨立反應(yīng)單元,計算節(jié)點無條件反射處理由本身獨立處理完成,而高級條件反射和智能分析則通過云計算高級神經(jīng)中樞完成。與生物進化過程相比較,云計算進化過程類似于生物從低等到高等進化過程。目前計算資源對業(yè)務(wù)反應(yīng)模式還只是處于無脊椎動物十分有限能力階段,非常不靈活,而隨著芯片技術(shù)和軟件能力進階,慢慢地計算資源調(diào)度模式就會進化到有脊椎動物高級復(fù)雜階段。在進化過程中,計算單元單位體積內(nèi)的芯片處理能力和密度每一年半翻倍提升,與此同時,起著傳輸神經(jīng)信息的網(wǎng)絡(luò)變得更加復(fù)雜,神經(jīng)網(wǎng)絡(luò)路徑數(shù)目與計算細胞單元是幾何平方匹配。
用戶需求不斷變化,導(dǎo)致網(wǎng)絡(luò)越來越復(fù)雜
十年以來,用戶數(shù)量指數(shù)增長,網(wǎng)絡(luò)數(shù)據(jù)、流量和管理發(fā)展使得用戶和網(wǎng)絡(luò)設(shè)備不堪重負。Cisco交換機固件文件大小從原來的300K到現(xiàn)在的幾十兆,路由器IOS軟件從1998的8兆左右到現(xiàn)在幾百兆到幾個G都是常見的的事。網(wǎng)絡(luò)設(shè)備操作系統(tǒng)源代碼行數(shù)也增長到幾百萬條,越來越多的網(wǎng)絡(luò)控制協(xié)議被加入到網(wǎng)絡(luò)操作系統(tǒng)中,廠家的研發(fā)難度不斷加大,用戶的學習成本不斷增加。尤其是控制平面的功能特性,從基本的OSPF、BGP、多播和查分服務(wù)質(zhì)量保證到多協(xié)議標記交換(MPLS)、流量工程Traffic Engineering(又分為基于路由協(xié)議的流量工程如OSPF-TE和基于4層應(yīng)用的流量工程如RSVP-TE)、大規(guī)模地址轉(zhuǎn)換(NAT)、智能分析處理防火墻、不同形式2/3層虛擬專用網(wǎng)VPN、IPv6與IPv4互相混搭、移動 IP網(wǎng)絡(luò)、用戶管理認證授權(quán)和訪問、記錄功能等等,無數(shù)越來越多的用戶要求被加入到網(wǎng)絡(luò)交換節(jié)點里面來,以致領(lǐng)先網(wǎng)絡(luò)公司都宣稱自己是軟件公司而不是硬件公司了。每個網(wǎng)絡(luò)設(shè)備變成了恐龍一樣的怪物,讓人見而生畏。雖然在第一時間解決用戶痛點和滿足市場要求是我們網(wǎng)絡(luò)供應(yīng)商的責任和期望,不夠遺憾的是由于網(wǎng)絡(luò)軟件控制特性與硬件集成度高,從初期協(xié)議想法到協(xié)議標準化大一般需要十年,而從標準化到規(guī)模部署又需要三到五年,導(dǎo)致用戶需求總是被嚴重地推遲滿足。另一方面,由于網(wǎng)絡(luò)協(xié)議與廠家硬件系統(tǒng)架構(gòu)高度集成,而傳統(tǒng)網(wǎng)絡(luò)主體架構(gòu)都是封閉(盡管廠家可能使用通用商業(yè)化產(chǎn)品作為收發(fā)芯片),所以與之配套的軟件開發(fā)和驗證只能由網(wǎng)絡(luò)廠家根據(jù)商業(yè)利益最大化決定推動,用戶不得不忍受被鎖定的痛苦。而用戶被鎖定后,基于用戶最大利益創(chuàng)新愿望對廠家來講就沒有那么強烈了,形成了需求與研發(fā)的負反饋效應(yīng)。
云計算虛擬化移動性,需要更加靈活敏捷的網(wǎng)絡(luò)響應(yīng)
根據(jù)IDC統(tǒng)計(圖6),到2013年底虛擬機部署數(shù)量將是物理機的2.5倍,達到8千2百萬臺,虛擬機節(jié)省了大量的物理購買成本,但在管理復(fù)雜度上面造成運營成本增加也非常顯著,比如虛擬資源脫離了物理設(shè)備相對靜態(tài)信息,排錯難度大大增加。虛擬交換機既要與現(xiàn)有虛擬管理平臺兼容,又要應(yīng)對高度動態(tài)變化端設(shè)備,維護虛擬邏輯抽象鏈接,集成與交換硬件設(shè)備功能,從移動性、機動性、維護性和集成性分類如下:
• 跟蹤設(shè)備移動狀態(tài)。網(wǎng)絡(luò)端節(jié)點實體(比如虛擬機)的網(wǎng)絡(luò)狀態(tài)需要簡單確定,不同主機之間可相互遷移節(jié)點狀態(tài)。
• 響應(yīng)網(wǎng)絡(luò)動態(tài)變化。虛擬化環(huán)境最大特點是網(wǎng)絡(luò)高度狀態(tài)變化,跟蹤虛擬機加入和離開,虛擬機往前或往后即時移動,邏輯網(wǎng)絡(luò)環(huán)境快速變化,開放式控制平面控制流量和全局網(wǎng)絡(luò)自動發(fā)現(xiàn)管理。
• 維護虛擬化邏輯標記。分布式虛擬交換機通常通過增加或管理虛擬機網(wǎng)絡(luò)數(shù)據(jù),來維護虛擬網(wǎng)絡(luò)或邏輯區(qū)域上下文,這是容易理解的簡單方式,需要正確和高效管理這些虛擬化標記。
• 集成操作系統(tǒng)和硬件。把虛擬數(shù)據(jù)轉(zhuǎn)發(fā)路徑設(shè)計成“卸載”模式,數(shù)據(jù)包處理由硬件芯片完成,以獨立軟件或硬件芯片方式實現(xiàn)靈活控制,增加虛擬化網(wǎng)絡(luò)性能。
云計算網(wǎng)絡(luò)管理方式改變——面向工作負載的網(wǎng)絡(luò)資源調(diào)度
要全面實現(xiàn)新一代數(shù)據(jù)中心數(shù)據(jù)管理移動性,就需要虛擬協(xié)調(diào)角色,統(tǒng)一規(guī)劃和部署IT智能基礎(chǔ)架構(gòu),于是催生了工作負載為中心的IT管理模式,傳統(tǒng)分離IT管理模式不再合適,傳統(tǒng)IT資源分配的技術(shù)實現(xiàn)方式也不再合適。
工作負載是計算機所執(zhí)行工作的邏輯分類,它包括誰在做工作(Who)、做什么工作(What)和如何做工作(How),它以業(yè)務(wù)觀點來看工作分類,非IT技術(shù)特征。工作內(nèi)容包括部分系統(tǒng)運行應(yīng)用、用戶應(yīng)用連接和應(yīng)用交互。工作績效指標包括響應(yīng)時間和吞吐量,也就是服務(wù)響應(yīng)水平。響應(yīng)時間是用戶發(fā)出請求與系統(tǒng)響應(yīng)之間的時間差。吞吐量是在一定時間內(nèi)完成了多少工作。工作負載工作內(nèi)容不一樣,IT資源消耗重點就不一樣,可以分為四類,CPU計算型、內(nèi)存緩沖型、存儲IOPS型或存儲帶寬型、網(wǎng)絡(luò)IOPS型或網(wǎng)絡(luò)帶寬型。保證服務(wù)器、存儲和網(wǎng)絡(luò)資源統(tǒng)一視圖,決定了以工作負載為中心的資源調(diào)度模式不但需要統(tǒng)一虛擬角色負責,還需要技術(shù)上對應(yīng)角色平臺保證。