2011年5月18日,應用與創(chuàng)新第三屆中國云計算大會云基地專場在北京云基地二層舉辦。中云網(wǎng)作為本屆云計算大會云基地專場官方指定戰(zhàn)略合作門戶網(wǎng)站和官方指定的合作新聞中心,進行全方位的視頻、圖文采訪與直播。
19日下午,“應用高峰論壇”在云基地召開,友友系統(tǒng)副總裁張矩出席大會并發(fā)表主題演講。
友友系統(tǒng)副總裁張矩(中云網(wǎng)攝)
以下是友友系統(tǒng)副總裁張矩的演講全文:
張矩:
大家下午好!
剛才辛總說了友友是專注于云計算核心平臺開發(fā)的公司,其實我們整個產品線是建立在三個核心的基礎之上。首先是怎么解決大規(guī)模系統(tǒng)中各個節(jié)點協(xié)同工作的問題,也就是通訊的產品能夠保證在大規(guī)模的網(wǎng)絡部署情況下各個節(jié)點之間能夠有高可靠的通訊層面。
第二個是把整個系統(tǒng)構建好之后,我怎么把大規(guī)模系統(tǒng)資源聚合起來統(tǒng)一管理和統(tǒng)一調度。第三個就是我們對海量數(shù)據(jù)如何進行存儲、處理,并且能夠從中提煉出我們需要的知識,大概是這么一系列產品。
友友提出一個概念叫做統(tǒng)一存儲,我們希望在企業(yè)內部或者是應用場景內部有一個統(tǒng)一的統(tǒng)計架構或者是存儲體系來支持各種不同的業(yè)務系統(tǒng)在上面應用,這款產品叫做DataCell,這個產品從設計的理念上來講,我們是一款支持非常海量數(shù)據(jù),也就是說一個安裝的部署通??梢灾С諴B級的存儲能力,并且以統(tǒng)一的存儲系統(tǒng)同時能夠支持現(xiàn)在在企業(yè)中能夠經??吹降氖褂梅秶顝V泛的幾種不同類型的數(shù)據(jù),包括結構化,這也是我們常說的數(shù)據(jù)庫的應用,也就是說每一個數(shù)據(jù)是有結構的,具有不同的欄目標識數(shù)據(jù)內容。
另外一種是非結構化數(shù)據(jù),實際上也是企業(yè)最熟悉和最常見的數(shù)據(jù),包括各種辦公的文檔、多媒體的文檔,甚至做設計圖紙、軟件的代碼文檔,我們都認為這些數(shù)據(jù)內部結構并不很明顯,但是我們對內容往往很關心。
我們DataCell支持這四種企業(yè)內部最常見的數(shù)據(jù)類型,首先就是剛才講的數(shù)據(jù)庫結構化數(shù)據(jù)的存儲。另外一個是大規(guī)模的網(wǎng)站和企業(yè)內部經常提到的對象存儲,也就是我們常說搜索和存儲的內容。還有就是大家最常見的存儲內容就是文件。再一個類型我們把它單獨劃出來,我們認為云時代和物聯(lián)網(wǎng)時代增長速度非常快的一類數(shù)據(jù),我們把它稱為時序數(shù)據(jù),甚至包括我們應用比較多的電力系統(tǒng)應用,比如說用電量的采集,這些都是非常典型的時序數(shù)據(jù)。
這個可能稍微技術一點了,講一下我們DataCell數(shù)據(jù)產品,從設計和技術實踐上的體系結構。大家了解類似于Google文件系統(tǒng)分布式存儲,我們這個存儲架構和基于這個類型體系的存儲還是有一定區(qū)別的。一個最明顯的區(qū)別在于對于GMS文件體系它有一個中心節(jié)點,至少在邏輯上會存在一個中心節(jié)點,我如何把存儲系統(tǒng)內部的原數(shù)據(jù)進行統(tǒng)一的存儲和管理,這樣在客戶端訪問存儲系統(tǒng)的時候要通過原數(shù)據(jù)的服務器來獲取數(shù)據(jù)存儲具體的位置和信息。我們試圖改變這種體系結構,我們用一個我們認為狀態(tài)服務器來取代傳統(tǒng)分布式存儲控制節(jié)點或者是原數(shù)據(jù)服務器。
在這里我想給大家稍微解釋一下我們新的設計理念,在傳統(tǒng)的分布式存儲架構中,其實也就是五六年的時間,在傳統(tǒng)分布式數(shù)據(jù)架構中原數(shù)據(jù)服務器或者是中心控制節(jié)點,往往是整個存儲系統(tǒng)無論是從性能上還是從容量上的瓶頸。首先一點客戶對數(shù)據(jù)的訪問,任何一次訪問都要先去中心節(jié)點詢問數(shù)據(jù)基本的屬性和存儲位置的信息,然后才能根據(jù)這些信息對數(shù)據(jù)系統(tǒng)進行訪問,這一來一回首先在增加了訪問的時演,整個重新節(jié)點的吞吐量,也就是說我能夠支持多少個用戶,也決定了整個存儲系統(tǒng)的用戶。
可能大家使用過分布式存儲都會有明顯的感覺,存儲系統(tǒng)穩(wěn)定性的問題,如果存儲系統(tǒng)出了問題往往是中央節(jié)點原數(shù)據(jù)的問題。因為分布式存儲在存儲節(jié)點上往往具有比較多的冗余,一個數(shù)據(jù)存到里面通常是兩到三個備份,來保證數(shù)據(jù)的可靠性的問題。在這種設置下如果有一個存儲節(jié)點或者說一個硬盤出現(xiàn)了故障,這個時候實際上對整個存儲系統(tǒng)的可靠性基本上沒有什么影響,也就是說數(shù)據(jù)是多種拷貝的。往往是因為中心就是我們說的原數(shù)據(jù)服務器或者是控制節(jié)點出了問題,這導致了原數(shù)據(jù)在控制節(jié)點上出現(xiàn)了不一致的情況,這會導致整個存儲系統(tǒng)的穩(wěn)定性下降,甚至在某種情況下會導致數(shù)據(jù)的丟失。
在我們新的體系架構當中,我們把原數(shù)據(jù)的信息,也就是說存儲的數(shù)據(jù)信息的屬性以及存儲位置的信息直接放在存儲節(jié)點之上。這樣的情況下,實際上客戶端對數(shù)據(jù)的訪問是直接到存儲節(jié)點訪問的,在這種情況下我們消除了數(shù)據(jù)端訪問數(shù)據(jù)的時候必須經過原數(shù)據(jù)服務器中心節(jié)點的流程,這個很大程度上影響了訪問的時延。另外由于不存在中央存儲的節(jié)點,這個時候只要存儲節(jié)點自身冗余性能夠保證的話,整個系統(tǒng)穩(wěn)定性和可靠性可以得到很好的保證。
在直接存儲的架構上,我們引入狀態(tài)服務器的概念,我們怎么能夠在完全分布的情況下更好的支持傳統(tǒng)意義下的文件系統(tǒng)的功能,在這個架構下我們既能夠保證性能延展的指標,又能夠很好的保證文件系統(tǒng)。
DataCell有幾個新的架構帶來跟傳統(tǒng)分布式存儲相比較有比較明顯的優(yōu)勢。首先就是我們的性能,剛才給大家解釋了,由于我們不存在中心控制節(jié)點問題的時候,吞吐量和時延會保證比傳統(tǒng)的分布架構要優(yōu)秀。同時在整個體系架構的設計上,我們還特別做了一些設計上的優(yōu)化,其中幾點跟大家分享一下。首先是數(shù)據(jù)水平的均勻分布,我們知道分布式系統(tǒng)比較起一體的單一節(jié)點系統(tǒng)最大的優(yōu)勢是我們可以通過各個節(jié)點的協(xié)作,我可以把任務或者是訪問的數(shù)據(jù)的供給分配到不同的節(jié)點之上,讓大家同時協(xié)同來工作,這樣保證更高的功能。也就是說我可以在每一個單一節(jié)點上,都不需要傳統(tǒng)的陣列或者是傳統(tǒng)的高端設備那樣,但是我結合起來可以實現(xiàn)整合以后的效率或者是性能要比傳統(tǒng)的架構好很多,這里面我怎么更好的把這些數(shù)據(jù)分配到現(xiàn)有的節(jié)點之上,實際上一個很大的挑戰(zhàn)是,數(shù)據(jù)水平分布的挑戰(zhàn)是,如果存儲的節(jié)點狀態(tài)變化了,我怎么還能夠保證數(shù)據(jù)的分配均勻性。比如說存儲節(jié)點原來有一百個后來由于性能的原因我增加五十個或者是二十個,這個是水平分布的優(yōu)化。
我們如何做垂直分布呢?大家都知道在現(xiàn)在硬件技術情況下,硬盤的性能要比內存差兩到三個數(shù)量級,這是現(xiàn)在硬件的基礎現(xiàn)狀。我們如何利用性能上不同硬件做優(yōu)化來提高整體系統(tǒng)的性能,我們也做了一個比較深入的研究和優(yōu)化。首先在現(xiàn)在的硬件體系架構中,如何更大量的使用內存減少對硬盤的操作,這是一點。這個又要談到分布式的架構對優(yōu)化的影響,數(shù)據(jù)的可靠性通常是通過分布在不同節(jié)點上數(shù)據(jù)的多份拷貝實現(xiàn)的,這個比起傳統(tǒng)單一的存儲服務器或者是存儲陣列來講有一個好處,就是說我可以把數(shù)據(jù)寫到硬盤上,這個時間我可以適當?shù)耐坪?。為了保證數(shù)據(jù)的可靠性,一般來講時延應該控制的非常短,我告訴服務器要保存的時候,通常服務器必須要寫到硬盤上,這樣才能告訴訪問端說數(shù)據(jù)已經保存下來了,不然會存在一個風險服務器斷電或者服務器故障的時候,我已經保存下來的數(shù)據(jù)因為服務器的故障而丟失。所以在這個時候我可以適當?shù)难娱L數(shù)據(jù)滯留的時間,這對提高系統(tǒng)整體存儲性能是有幫助的,所以我們在整個優(yōu)化中更多的使用硬盤和控制數(shù)據(jù)在使用中的滯留時間。
實際上包括任何一個計算機的系統(tǒng)很難設計出一個滿足各種應用場景,各種不同的應用,不同的訪問模式下都優(yōu)化的系統(tǒng),這個系統(tǒng)從理論上講是不存在的。我們認為能夠做到或者能夠做的更好的是不同的應用和訪問背景,來對這一類型進行優(yōu)化。我們覺得DataCell存儲系統(tǒng)里面實際上有針對不同的應用和屬性類型有四種基本上面向數(shù)據(jù)訪問模式進行優(yōu)化的存儲引擎。
一類是針對文件的存儲引擎,這類存儲引擎一般具有比較明顯的特色,就是文件的尺寸比較大,像一個多媒體的文件從幾百兆到上GB的量級是非常常見的。這個時候為了它的性能優(yōu)化存儲顯然是跟小文件或者是小的數(shù)據(jù)非常不一樣的使用場景。
另外一個存儲場景實際上是對結構化和半結構化數(shù)據(jù),通常是尺寸比較小,數(shù)據(jù)量在一兆以內,甚至包括一些小的數(shù)據(jù)文件,我們都是針對這種數(shù)據(jù)引擎使用。
第三類就是很明顯以時間為索引點的數(shù)據(jù),通常也是數(shù)據(jù)的大小在一兆以內,有一個非常明顯的特征,就是說數(shù)據(jù)的索引是用時間點索引。而且由于時間的發(fā)展是單向的,時間是不停往前走的,數(shù)據(jù)的累計或者數(shù)據(jù)的讀寫實際上也是單向往后添加的。對此我們做專門的數(shù)據(jù)引擎來負責這一類數(shù)據(jù)的存儲。
最后一個就是我們認為的流媒體數(shù)據(jù),這個數(shù)據(jù)有一個很大的特征就是尺寸比較大。其次對它的訪問就是讀取的過程是具有非常明顯的順序特征,對于這類應用我們有優(yōu)化的流媒體引擎專門負責存儲這樣的數(shù)據(jù),針對不同數(shù)據(jù)特征的存儲引擎,我們可以保證存儲系統(tǒng)能夠達到比傳統(tǒng)的分布式系統(tǒng)性能要優(yōu)化很多和高很多的存儲系統(tǒng)。
在實踐上我們系統(tǒng)存儲的數(shù)據(jù)和讀寫的數(shù)據(jù)流,以及和數(shù)據(jù)訪問控制,包括系統(tǒng)內部的控制信息,它的通道是完全分裂的互不影響,這樣可以保證數(shù)據(jù)讀寫的性能,又可以保證數(shù)據(jù)內部進行重新分工,以及數(shù)據(jù)狀態(tài)遷移的時候有非常高的可靠性。
在新的分布式存儲特點里面有非常高的延展性,這點和傳統(tǒng)相比也是一個非常大的優(yōu)勢。剛才講了文件系統(tǒng)通常都具有中心節(jié)點,而這個中心節(jié)點容量通常會確定一個存儲系統(tǒng)到底能存放多少個文件。其實文件的容量是個次要的約束條件,最主要的約束條件是文件的個數(shù),主要原因是因為每一個文件的原數(shù)據(jù),文件的屬性和文件存儲的地方和位置,這些信息一般在原數(shù)據(jù)服務器或者是控制節(jié)點上都是要放在內存里面,這樣才能保證你的存儲能夠達到滿意的性能。也就是說原數(shù)據(jù)服務器內存的大小,實際上決定了整個存儲系統(tǒng)到底能存多少文件,比如說常用的服務器48G內存和64G內存,可能支持的數(shù)目也就是一億個文件水平左右,由于我們趨中間化的算法,可以保證我們新的分布式系統(tǒng)的延展性要遠遠優(yōu)于傳統(tǒng)的分布式系統(tǒng)。
但是我規(guī)模大了以后需要保證幾點,也是需要特殊考慮,雖然在物理上沒有明顯的限制。但是在具體的實踐上怎么能保證在大規(guī)模的情況下依然具有非常良好的性能和可靠性,其實主要是解決兩個問題。一個是通過存儲系統(tǒng)的方式保證整個存儲系統(tǒng)各個節(jié)點的狀態(tài)是一致的,每個節(jié)點基本上都能夠知道整個系統(tǒng)現(xiàn)在的狀態(tài)。再一個就是剛才給大家提到過的我節(jié)點多了以后,節(jié)點成員的身份發(fā)生了變化,或者是新加了節(jié)點以后,我的系統(tǒng)怎么能很快的達到新的平衡狀態(tài),能夠很快的發(fā)揮對用戶提供數(shù)據(jù)的服務,這也是在系統(tǒng)中經過特殊處理和考慮的。
其實總結起來,首先是高容量,我們DataCell的部署基本上都會在TB的存儲量級上。剛才給大家講了我們延展性的優(yōu)勢,可靠性也是通過數(shù)據(jù)的冗余來實現(xiàn)的。另外就是我們的性能,一會兒跟大家分享幾個案例,特別強調在不同存儲形式下能夠實現(xiàn)性能的參數(shù),剛才跟大家分享的是對不同應用模式的多引擎的支持。
另外想跟大家分享的是基于DataCell分布式存儲之上,我們構建了一個叫做智能存儲的平臺,海量數(shù)據(jù)前幾個演講嘉賓都多多少少提到了,新一代應用無論是企業(yè)的應用、互聯(lián)網(wǎng)的應用,甚至包括即將發(fā)生的物聯(lián)網(wǎng)的應用有一個非常大的特點,各個業(yè)務系統(tǒng)都在面對一個挑戰(zhàn)就是海量數(shù)據(jù)的挑戰(zhàn)。剛才我們跟大家分享了分布式系統(tǒng)解決了怎么能夠高可靠存儲、高性能的存儲大量的海量數(shù)據(jù)的能力,其實這只是解決了整個問題的一部分,海量數(shù)據(jù)的應用帶來的問題實際上是兩個方面。首先一個是這些數(shù)據(jù)你能力采集進來存的下,其次這些你怎么利用這些數(shù)據(jù)。舉一個最簡單的例子,像企業(yè)經過一段時間的運行,一般都會積累很大量的文檔,而且這些文檔具有幾個比較典型的特征。首先這些文檔是由不同的業(yè)務系統(tǒng)生成,有人事部產生的數(shù)據(jù),財務會產生不同的數(shù)據(jù),這些海量的數(shù)據(jù)你把它集中的存儲下來只是解決了問題的一部分。既然把整個數(shù)據(jù)全都放在一個地方存儲下來,我要搜索或者檢索數(shù)據(jù)的時候,或者我要查詢其中一篇文章的時候,你怎么能夠很快很準確的把我想要的東西告訴我,這是另外一個問題。也就是說存儲實際上要提供兩個功能,一個是要存得下,另外你需要數(shù)據(jù)的時候可以很方便、很快捷的把你需要的數(shù)據(jù)返回給你。
智存平臺是構建在分布式系統(tǒng)之上,又構建了一層對數(shù)據(jù)進行高效的分類、檢索和搜索平臺性的產品,它的幾個特征主要是我剛才提到的,首先是對海量數(shù)據(jù)能夠存得下,在存儲容量上有很大的優(yōu)勢。對存儲系統(tǒng)之中的數(shù)據(jù)有很好的管理功能,最為重要的實際上是數(shù)據(jù)存到系統(tǒng)之后給你一個方便使用的接口,能夠讓你很快捷的掌握到并且所使用。
對于無論是在企業(yè)里面的員工或者對于我們平常的生活,數(shù)據(jù)的提取或者是數(shù)據(jù)的檢索通常通過兩種形式實現(xiàn)。第一個是現(xiàn)在非常普遍使用的搜索引擎,我其實知道我需要的信息或者需要的文檔,它講述的關鍵內容是什么,這樣我們通過關健詞搜索我需要的文檔。第二種檢索的方式實際上更像圖書館方式,我知道需要檢索文檔的分類,我根據(jù)分類的體系架構能夠通過一點一滴一步一步最終定位找到我需要的文檔,其實傳統(tǒng)的文件系統(tǒng)或者傳統(tǒng)的文檔管理系統(tǒng)更多的是第二個方式,我有一個目錄結構或者是分類體系像圖書館,這樣我所根據(jù)我所關心內容的目錄來定位我的文檔。在我的智存平臺里,實際上把通常使用的文檔檢索的方式有機的結合起來,我既提供一個良好的全文搜索的體系,又同時支持企業(yè)對你自身文檔或者是自身存儲的數(shù)據(jù)進行分類,并且進行模板化的管理。在這種設置下,我可以很方便對海量數(shù)據(jù)和海量文檔進行定位和提取。這是我們關于海量數(shù)據(jù)最重要的兩個產品給大家做一個匯報和介紹。
下面我想跟大家分享的是友友系統(tǒng)在最近兩年,在一些具體的使用案例,具體為客戶解決了什么樣的問題。
第一個使用案例是我們?yōu)殡娏緲嫿ǖ慕y(tǒng)一的數(shù)據(jù)存儲和訪問系統(tǒng),這個電力公司是在運營了很長時間之后,積累了海量的文檔,文件的數(shù)目可能在我們構建系統(tǒng)的時候大概有7000到8000萬個文檔,現(xiàn)在可能更多了,這是兩年前的狀態(tài)。當時有三十多個業(yè)務系統(tǒng),每一個業(yè)務系統(tǒng)有自己的存儲,也就是我們常說的文件服務器,這個時候它面臨著很大的問題。首先是如果每一個文檔被各個部門都要使用的話,在系統(tǒng)里面往往每一個業(yè)務系統(tǒng)都會把這個文檔拿過來存到自己的文件服務器中供自己的部門內部使用,這是一個現(xiàn)狀,但是帶來一個很大的問題,這個文檔首先浪費了存儲資源。如果文檔有更新的話,基本上達到每一個存儲的備份都是最新的,部門之間文檔的共享實際上非常難做到。文檔的共享往往是靠發(fā)郵件的方式或者是通過索要的方式存在像USB存儲介質上進行分享。其次是部門之間或者是團隊之間根本沒有辦法知道另外一個團隊手里到底有什么樣的資料和信息。所以對他來講構建這么一個統(tǒng)一存儲和訪問是非常有必要的。
我們搭建的系統(tǒng)是在DataCell和智存系統(tǒng)之上,對將近1億份文檔進行了存儲,同時提供了符合業(yè)界標準應用開發(fā)接口,這樣很方便把各種不同部門應用各種不同的系統(tǒng)對接到這個上面,這樣的話各個業(yè)務系統(tǒng)使用的是同一個存儲系統(tǒng)來支撐,非常方便整個數(shù)據(jù)的整合和分享。而且我們在統(tǒng)一的存儲基礎之上,利用我們的智存提供接口,這是兩年前上線現(xiàn)在已經在使用的系統(tǒng)。
另外一個案例是我們?yōu)殡娦殴緲嫿ㄈ罩痉治鱿到y(tǒng),這是很典型的時序數(shù)據(jù)的使用案例,大家知道電信公司對自己的客戶提供互聯(lián)網(wǎng)訪問的服務,大家上網(wǎng)去訪問各種不同的網(wǎng)站,其實你每訪問一次網(wǎng)站實際上都回升成一個DNS的記錄,就是說你去訪問了哪個網(wǎng)站,從哪個客戶端在什么時間訪問了什么樣的網(wǎng)站,這個信息實際上對電信公司是非常有價值的。首先它可以知道用戶對網(wǎng)站的訪問習慣,還可以對用戶的訪問內容做一定的監(jiān)管工作,大家看看首先是對什么樣的內容感興趣,對什么樣的網(wǎng)站感興趣,其次看看有沒有不應該訪問的內容。但是這個數(shù)據(jù)量由于電信公司的客戶非常龐大,數(shù)據(jù)量是很大的,像省公司在一個城市它的用戶DNS訪問量一天會生成80億條新的記錄。對于電信公司的需求來說,我對這些訪問記錄的數(shù)據(jù)需要保持六個月,大家可以做一個簡單的數(shù)據(jù)計算,這六個月存儲的數(shù)據(jù)大概是14000億條訪問的記錄數(shù)據(jù),如何能在這14000億條數(shù)據(jù)中很快的檢索到電信公司所關心的內容,實際上這個任務已經遠遠超出了傳統(tǒng)的數(shù)據(jù)庫怎么解決處理容量的范圍了。在我們的系統(tǒng)上線之前,對他來講只能保存一個月訪問的日志,遠遠達不到他需要的六個月的存儲時限,我想檢索某一個客戶端在某一個時間訪問某一個網(wǎng)站,我想查詢一個請求,從查詢請求遞交到結果返回大概需要20分鐘到30分鐘。我們系統(tǒng)上線首先達到6個月的存儲,我們做到的響應時間大概是5秒鐘左右,這是性能上的對比大概是三個數(shù)量級的提高。
下一個案例是我們?yōu)樯鐓^(qū)網(wǎng)絡游戲做的平臺支撐,不光光是海量存儲的問題,我們還有資源管理功能。成功的互聯(lián)網(wǎng)很多應用有一個很大的特征,就是用戶量通常非常的巨大,像這款游戲在上線一個月的時間大概日活躍用戶到了1000萬的水平,整個注冊用戶大概是五千萬到六千萬,大家都看社區(qū)網(wǎng)游是一個非常有特色的應用,再一個是用戶的狀態(tài)是隨著用戶游戲進行中不停的發(fā)生變化。也就是說用戶的狀態(tài)信息,隨著用戶來玩游戲的時候實時的需要進行非常準確的更新,在這個情況下我怎么能夠支撐一千萬個用戶同時在線,而且保證用戶狀態(tài)信息實時更新,這對大規(guī)模網(wǎng)絡游戲來講是非常大的挑戰(zhàn)。這是同樣使用DataCell產品,雖然存儲的內容還不一樣,從剛才第一個文件存儲到第二個時序數(shù)據(jù)的存儲,到這個是非常典型的對象存儲,也就是說我存儲用戶的基本信息,以及用戶在游戲中的狀態(tài),怎么支撐上千萬同時在線高性能的支撐,而且能夠保證用戶的體驗要非常的好,我對后臺數(shù)據(jù)訪問的時延要保證200毫秒左右,這樣用戶在玩游戲的時候才不會有等待的感覺,這是很典型的應用案例,現(xiàn)在游戲還屬于最成功的游戲。
最后一個案例是流媒體引擎的應用,我們叫做平安城市項目典型的應用。也就是說在一個城市之內,我們要在城市各處安裝高清攝象頭,在這個案例里城市需要安裝75萬個高清攝象頭,每一個攝象頭生成的數(shù)據(jù)流大概是6兆每秒,這些數(shù)據(jù)大概要保存一個月的時間供安防人員或者是城市管理人員進行訪問和分析。所以這個規(guī)模大概是什么樣的情況,75萬個攝象頭,每個攝象頭每秒產生6兆的數(shù)據(jù),這些數(shù)據(jù)要保存一個月,大概算起來總量是1000個PB的數(shù)據(jù)量,總量是一個方面,為了支撐這75萬個攝象頭,總體會聚存儲系統(tǒng)的帶寬,如果系統(tǒng)整個上線以后將會是全世界最大規(guī)模的存儲和視頻監(jiān)視系統(tǒng),全世界最大的視頻分享網(wǎng)站整個存儲量也就是在45個PB水平左右,而這個系統(tǒng)上線之后到1000個PB。這個系統(tǒng)還沒有上線,我們正在做驗證的工作,也是使用DataCell,這是非常典型海量數(shù)據(jù)的應用場所。
跟大家分享這四個案例,從文件存儲到時序數(shù)據(jù)存儲到對象存儲,再到最后的流媒體存儲不僅在產品開發(fā)中得以實現(xiàn),在實際的應用中或者是驗證系統(tǒng)都是存在的,今天跟大家分享的就是這些,謝謝大家。