Facebook公司在近日美國佛羅里達奧蘭多市舉行的國際綠色計算大會公布了Memcached性能測試文件,文件中對分別搭載TilePro64處理器、Intel Xeon處理器和AMD Opteron處理器的標準服務器進行了性能測試。
Tilera、SeaMicro和Calxeda一直將Hadoop海量數(shù)據(jù)計算和Memcached Web緩存作為賣點來宣傳自己的微服務器產(chǎn)品,可是當遇到分布式工作負載的情況時,性能強勁的大型處理器核心所承擔的超大規(guī)?;ヂ?lián)網(wǎng)工作負載并不總是像智能互聯(lián)網(wǎng)和核心設計那樣重要。
SeaMicro最近發(fā)布了基于Atom 雙核64-bit處理器的微服務器,此款產(chǎn)品在一個10U的機箱中搭載了768個核心。SeaMicro還展示了此款微服務器組成的集群在處理Hadoop非結構化數(shù)據(jù)的分析能力。并和搭載Intel Xeon的服務器進行了性能對比。
用于測試的SeaMicro SM1000服務器運行在真實的Hadoop工作負載環(huán)境中,成本上要比用Intel Xeon組建的服務器集群低25%,機架的空間占用以及在能耗方面都僅為用Intel Xeon組建的服務器集群的四分之一。
Memcached是Danga Interactive在2003年創(chuàng)建,用作分布式網(wǎng)絡高速緩存,同時用來存儲主內(nèi)存中的數(shù)據(jù),并使用網(wǎng)絡服務和應用程序。它曾被稱為key-value store,現(xiàn)在只有Facebook、Twitter、Zynga、YouTube、Reddit、Flickr和一些超大規(guī)模的互聯(lián)網(wǎng)企業(yè)使用它,并用來為數(shù)百萬的用戶提供數(shù)據(jù)而不需要等待硬盤來處理這些工作。
Memcached是一套分布式的高速緩存系統(tǒng),當初是Danga Interactive為了LiveJournal所發(fā)展的,但目前被許多軟件(如MediaWiki)所使用。這是一套開放源代碼軟件,以BSD license授權釋出。
Tilera云計算應用總監(jiān)Ihab Bishara表示,“Facebook在Memcached的應用上絕對具有發(fā)言權,就目前我們的數(shù)據(jù)統(tǒng)計顯示,F(xiàn)acebook運行著全世界最數(shù)量最多的Memcached服務器。Facebook是我們在過去一年半時間以來在市場最看重的客戶。”
Bishara沒有談論有關Facebook的服務器計劃或者Facebook是否已在基礎設施中部署Quanta Computer(博通公司旗下的Quanta是Tilera的戰(zhàn)略投資商)制造的Tilera服務器。
Quanta是1988年由林百里先生創(chuàng)建的一家主要從事PC和服務器的制造商,最近Facebook與Quanta合作以幫助其建造自己的開源、開放的服務器。這些服務器已于今年四月部署在Facebook位于俄勒岡州的數(shù)據(jù)中心中,同時預計今年夏天Intel和AMD將升級自家的產(chǎn)品,屆時兩家公司將會分別推出Xeon E5和Opteron 6200。
測試環(huán)境
Facebook在Quanta的QS2機架服務器(又被稱作QSSC-X5-2Q)上進行了Memcached測試,QS2是一個2U機架服務器,其配置了8處理器,核心數(shù)為512。
每個處理器作為一個單一的節(jié)點,所以Quanta服務器為8節(jié)點的微服務器。TilePro64為32位處理器,其中有四個核心被分配給Linux系統(tǒng),另外的60核心用來承擔Memcached的工作負載。其被廣泛認為是MIPS架構衍生出來的,核心頻率為866MHz,Tile處理器使用的是網(wǎng)孔配置,在這種配置下核心是以8X8柵格的形式排列的,這意味著核心之間的連接總線非常短并且可以以處理器的時鐘頻率進行轉(zhuǎn)換。TilePro64服務器節(jié)點的主內(nèi)存容量為32GB。
Facebook將基于Tilera處理器的Quanta服務器與使用主頻為2.27GHz的Intel 四核Xeon L5520和主頻為2GHz的8核Opteron 6128HE處理器組建的服務器進行了對比測試。以上兩款x64處理器都是低電壓、低能耗版本。Facebook公司在32GB主存的單路1U機架服務器和64GB主存的多路1U服務器進行了測試。
這三款測試機均運行基于Linux 2.6.33內(nèi)核和Memcached 1.2.3h的CentOS系統(tǒng).
Facebook在其公布的性能說明書中詳細闡述了Memcached的性能信息。介紹了TCP和UDP協(xié)議對不同機器性能表現(xiàn)的如何造成影響。下圖是不同機器測試圖示。
Opteron、Xeon、Tilepro64 Memcache性能對比
從圖中可以看出,當x64服務器在遇到Memcached擴展時,每秒的事物處理能力并不是很好。例如,在搭載Opteron的服務器上,超過四核心會影響性能,需添加第二個CPU來保證處理能力。
Intel Xeon處理器則表現(xiàn)稍好,但是同樣需要增加第二個處理器。最好擴展到多個單路Opteron或者Xeon的節(jié)點,就像Quanta搭載的Tilera處理器那樣。
顯而易見的是,擁有30核心的TilePro64處理器要比低電壓版的Opteron處理器和Xeon處理器性能更高,而專用于Memcached的60核TilePro64處理器性能則完全壓倒x64處理器。
顯然,Intel和AMD都有比測試中更快的處理器,但Tilera處理器剛剛發(fā)布了Tile-Gx 3000系列64-bit 36核心處理器,同時最高還可擴展到100個核心。
性能只是Facebook選擇它的一個因素。同時Facebook也看重能耗的散熱(兩者同樣重要)以及空間和成本。Facebook在性能說明書中還對電源的使用給出了解釋。根據(jù)參測機型的預估性能,下圖是各機型的能耗狀況。
Tilera和x64服務器性能和功耗對比
根據(jù)測試結構Facebook可以推算出構建256GBMemcached集群大概需要多少個節(jié)點。并且從性能和能效兩方面來看,Tilera處理器也比Intel和AMD更具優(yōu)勢。
搭載TilePro64處理器的Quanta服務器每秒的運算能力為268萬TPS,能耗為462瓦,平均每每瓦性能為5801 TPS。四節(jié)點的Opteron服務器集群運行Memcached負載每秒的運算能力為66萬TPS,能耗為484瓦,平均每瓦性能為1363 TPS。四節(jié)點Xeon服務器(主存儲容量為256GB)比AMD Opteron的性能要好一些,每秒運算能力為75.2萬TPS,能耗也比AMD Opteron更低,為400瓦。平均每瓦性能為1880 TPS。但是這還不到基于TilePro64處理器服務器每瓦性能的三分之一。
而這一切,TilePro64處理器只需占用2U的空間,x64服務器則需要4U。