在此次的SPF大會(huì)上,思科大中華區(qū)數(shù)據(jù)中心首席架構(gòu)師謝軍針對(duì)大數(shù)據(jù)解決之道發(fā)表了演講,SP特此將精彩內(nèi)容摘要如下。
大數(shù)據(jù)從IT角度將帶來商務(wù)驅(qū)動(dòng),會(huì)帶來增值業(yè)務(wù),這是大家的共識(shí)。然而,大數(shù)據(jù)架構(gòu)和傳統(tǒng)數(shù)據(jù)中心數(shù)據(jù)管理方式有很大差異。這些差異在IT行業(yè)產(chǎn)生了很多新的變革和挑戰(zhàn),面對(duì)這些挑戰(zhàn)應(yīng)該怎么辦?思科哪些技術(shù)可以幫助克服這些挑戰(zhàn)呢?
事實(shí)上,挑戰(zhàn)主要集中在三個(gè)方面。首先,傳統(tǒng)的HADOOP方式會(huì)有一個(gè)非常關(guān)鍵的節(jié)點(diǎn),這相當(dāng)于工作引擎,所有數(shù)據(jù)管理要通過這個(gè)引擎操作。這個(gè)節(jié)點(diǎn)出現(xiàn)故障則會(huì)使整個(gè)大數(shù)據(jù)系統(tǒng)不可用,業(yè)務(wù)徹底癱瘓。因此要求其具有高可用性。
第二: HADOOP通常有多份數(shù)據(jù)復(fù)本保存數(shù)據(jù),當(dāng)一個(gè)數(shù)據(jù)復(fù)本出現(xiàn)故障系統(tǒng)會(huì)幫助做復(fù)制,這個(gè)復(fù)制通過網(wǎng)絡(luò)實(shí)現(xiàn)。這就可能導(dǎo)致在一些特定情況下產(chǎn)生大量數(shù)據(jù)復(fù)制,特別是當(dāng)分布式系統(tǒng)做得比較大的時(shí)候。
第三,過去數(shù)據(jù)存放是集中式存儲(chǔ)與服務(wù)器相連。整個(gè)數(shù)據(jù)管理層面只需管理幾個(gè)節(jié)點(diǎn)。比如一個(gè)傳統(tǒng)的數(shù)據(jù)庫有兩個(gè)節(jié)點(diǎn)或者三四個(gè)節(jié)點(diǎn),而在HADOOP環(huán)境下會(huì)出現(xiàn)幾十個(gè)甚至上千個(gè),而且是上千個(gè)有可能跨不同數(shù)據(jù)中心的超大集群。這意味著管理點(diǎn)非常多,管理成本大幅上升。以上都是大數(shù)據(jù)可能面臨的挑戰(zhàn)。
針對(duì)以上的挑戰(zhàn),思科做了統(tǒng)一計(jì)算系統(tǒng)。今后數(shù)據(jù)中心發(fā)展,計(jì)算一定是往橫向擴(kuò)展。這意味著虛擬化、云計(jì)算以及大數(shù)據(jù),其實(shí)都有個(gè)共同特點(diǎn)是分布式發(fā)展。分布式系統(tǒng)必然需要和網(wǎng)絡(luò)關(guān)聯(lián),因此思科希望做一個(gè)產(chǎn)品把計(jì)算和網(wǎng)絡(luò)融為一體,這就是思科的UCS服務(wù)器系統(tǒng)。
思科的服務(wù)器系統(tǒng)核心取決于一對(duì)萬兆矩陣,該矩陣是計(jì)算域的管理點(diǎn),所有掛在計(jì)算域上面的服務(wù)器只是一個(gè)計(jì)算單元,它掛在哪個(gè)應(yīng)用上全由網(wǎng)絡(luò)層決定。思科的系統(tǒng)本身實(shí)現(xiàn)了硬件虛擬化,把服務(wù)器的屬性上升到網(wǎng)絡(luò),由網(wǎng)絡(luò)去定義這個(gè)服務(wù)器。
其二,思科的系統(tǒng)將會(huì)使得管理域變大,只要客戶連接到交換群,就可以控制所有的節(jié)點(diǎn),這會(huì)極大的縮短管理點(diǎn)。
第三,思科的系統(tǒng)集成了兩個(gè)自愈的能力,怎樣實(shí)現(xiàn)高可用性,有兩種方式,思科提供的是硬件解決方案。由于思科的系統(tǒng)是AB兩個(gè)矩陣環(huán)路,因此一旦A環(huán)路出現(xiàn)問題,B環(huán)路就能馬上解決,其次,思科的系統(tǒng)實(shí)現(xiàn)了硬件漂移的能力,比如服務(wù)器的CPU壞了,客戶不需要重裝一臺(tái)服務(wù)器,思科的系統(tǒng)可以將其硬件屬性“寫”到另外一臺(tái)機(jī)器上,就可以直接使用。這幫助客戶節(jié)約了很多軟件的維護(hù)成本。
大數(shù)據(jù)的發(fā)展現(xiàn)在基本呈現(xiàn)兩個(gè)趨勢(shì),一個(gè)是堅(jiān)持獨(dú)立自主開源方式。另外一個(gè)是會(huì)提供自己的解決方案,在原先大數(shù)據(jù)架構(gòu)里面提供自己的產(chǎn)品。這兩種方式思科都會(huì)提供很好支撐。
總結(jié)一下,思科的統(tǒng)一計(jì)算系統(tǒng),針對(duì)關(guān)鍵節(jié)點(diǎn),思科可以提供具有硬件漂移能力的技術(shù),出席故障可以快速修復(fù)。
其次,它解決了大范圍管理的問題,假設(shè)160個(gè)服務(wù)器,它可以做一個(gè)非常大的大數(shù)據(jù)集群,這意味著有一百六十個(gè)管理點(diǎn),使用思科的系統(tǒng),管理者只需要對(duì)其中一個(gè)點(diǎn)進(jìn)行管理,就能對(duì)所有的管理點(diǎn)進(jìn)行監(jiān)控。
最后,思科的系統(tǒng)可以保證它的高可用性和提高性能。高可用性是思科有兩個(gè)自愈能力。它對(duì)于節(jié)點(diǎn)快速大量數(shù)據(jù)復(fù)制帶來的好處是不言而喻的。
不妨關(guān)注一下大數(shù)據(jù)的另外一個(gè)趨勢(shì),既很多廠商根據(jù)自身的技術(shù)特點(diǎn)推出了一些新型的解決方案,最近一年最熱的就是SAP的HADOOP,它實(shí)際上是通過內(nèi)存的方式來解決快速數(shù)據(jù)處理的問題。SAP的HANA可以通過一些方式做到節(jié)點(diǎn)的擴(kuò)張,它采取的方式是通過將數(shù)據(jù)都放在內(nèi)存里面。它在思科的解決方案里都有體現(xiàn),主要分為兩部分,第一是單一節(jié)點(diǎn),一般是些小規(guī)模的節(jié)點(diǎn)。還有一種是可擴(kuò)張的節(jié)點(diǎn)。
思科可擴(kuò)展節(jié)點(diǎn)的解決方案,需要本地磁盤的支撐,在存儲(chǔ)方面思科有兩個(gè)合作伙伴,一個(gè)是EMC,一個(gè)是NetApp 。我們的解決方案里融合了網(wǎng)絡(luò)。因此在擴(kuò)展時(shí)不需要考慮擴(kuò)展時(shí)的連接模塊,更不需要重新布線。
今天主要介紹了思科計(jì)算產(chǎn)品,思科計(jì)算不是單純計(jì)算,是以網(wǎng)絡(luò)發(fā)展計(jì)算。相信在今后,特別是越來越多強(qiáng)調(diào)的分布式系統(tǒng)里,思科計(jì)算會(huì)給大家?guī)砗芏囿@喜。(王衛(wèi)東)