企業(yè)數(shù)據(jù)中心當(dāng)前所采用的標(biāo)準(zhǔn)化服務(wù)器是浪費資源的,但未來的系統(tǒng)或?qū)⑹强膳渲玫模员隳軌蚋玫钠ヅ淦髽I(yè)工作負(fù)載的需求。
根據(jù)一些市場調(diào)研的估計,當(dāng)前在全球范圍內(nèi),云計算的高速增長已然引起了數(shù)據(jù)中心業(yè)界的高度關(guān)注。畢竟,這些數(shù)據(jù)中心目前已經(jīng)消耗了至少7%的全球電力供應(yīng),并且其耗電量還在進(jìn)一步的持續(xù)增長。這導(dǎo)致IT行業(yè)亟待尋求提高數(shù)據(jù)中心基礎(chǔ)設(shè)施效率的有效方法,其中甚至包括一些重新考慮計算機(jī)和數(shù)據(jù)中心構(gòu)建方式方面的嘗試努力。
2018年1月在英國曼徹斯特召開的計算機(jī)系統(tǒng)與高性能計算領(lǐng)域的頂級盛會HiPEAC 2018上,來自IBM公司的研究人員發(fā)表了一篇關(guān)于分解式計算機(jī)體系架構(gòu)的論文。這項工作是由歐盟所資助的dReDBox項目的一部分,而該項目又是Horizo??n 2020研究和創(chuàng)新計劃的一部分。
服務(wù)器解耦意味著將服務(wù)器分解為其組成的計算和內(nèi)存資源,以便根據(jù)每項工作負(fù)載的具體需要來分配服務(wù)器資源。目前,服務(wù)器是IT基礎(chǔ)架構(gòu)的基本組成部分,但一項工作負(fù)載無法使用比單臺服務(wù)器更多的內(nèi)存或CPU資源,也無法輕松地從服務(wù)器外部共享任何備用資源。
“部署到數(shù)據(jù)中心的工作負(fù)載往往在其使用資源的方式上存在很大的不成比例。有些工作負(fù)載會消耗大量的CPU資源,但并不需要太多的內(nèi)存;而另一方面,其他的某些工作負(fù)載則將消耗比CPU的使用多出高達(dá)4個數(shù)量級的內(nèi)存資源。”來自IBM公司的研究工程師Andrea Reale博士說。
在整個企業(yè)數(shù)據(jù)中心內(nèi),這意味著一些服務(wù)器將用到他們所有的CPU資源,但仍有大量的空閑內(nèi)存;而對于其他一些服務(wù)器則情況正好相反,即使這些資源其實并沒有被充分使用,但這些資源也會繼續(xù)消耗電力資源。在一處典型的數(shù)據(jù)中心中,大約可能有16%的CPU資源和30%的內(nèi)存資源會被白白浪費掉了。
但是,如果你企業(yè)的數(shù)據(jù)中心可以在軟件控制下調(diào)解服務(wù)器資源,以便讓您企業(yè)的每項特定工作負(fù)載擁有盡可能多的CPU和具體所需要的內(nèi)存資源的話,那豈不是更好嗎?
計算和內(nèi)存的分離dReDBox項目旨在通過使用稱為“塊(brick)”的分解計算和內(nèi)存模塊來解決這個問題。他們通過高速鏈接連接在一起,并且讓足夠的計算塊與足夠的內(nèi)存塊配對,以滿足在既定時刻運行的任何工作負(fù)載的要求。從理論上講,這使得企業(yè)數(shù)據(jù)中心的服務(wù)器可以針對特定應(yīng)用程序進(jìn)行資源的配置調(diào)解,以分配盡可能多的CPU核心和內(nèi)存資源給工作負(fù)載,滿足作業(yè)所需,然后可以將這些資源返回到資源池中,并在工作負(fù)載不再需要這些資源時將資源用于其他目的。
作為其研究項目的一部分,dRedBox團(tuán)隊已經(jīng)構(gòu)建了一款演示系統(tǒng),其中brick塊是圍繞基于ARM的片上系統(tǒng)(SoC)芯片Xilinx Zynq Ultrascale +構(gòu)建的。計算brick塊擁有少量的本地內(nèi)存,而內(nèi)存brick塊擁有更多數(shù)量的DDR4內(nèi)存,可用于計算brick塊。
在dRedBox體系架構(gòu)中還有另外兩種類型的brick塊;加速器塊可以提供GPU或FPGA硬件來加速應(yīng)用程序(如機(jī)器學(xué)習(xí)或分析);以及一個控制器塊,其是一種管理所有其他塊的特殊塊。
為了適應(yīng)匹配現(xiàn)有的數(shù)據(jù)中心基礎(chǔ)設(shè)施,dRedBox團(tuán)隊設(shè)想任何生產(chǎn)環(huán)境中部署的塊都應(yīng)安裝在類似標(biāo)準(zhǔn)機(jī)架式服務(wù)器系統(tǒng)的2U機(jī)柜中。這些機(jī)柜外殼可能包含任何塊類混合。
這種模塊化安排的優(yōu)點在于:其還可以輕松實現(xiàn)升級;企業(yè)數(shù)據(jù)中心的操作運營人員們可以簡單地采用具備更高性能的新的計算塊來替換,或者將內(nèi)存塊替換為具有更大內(nèi)存容量的塊,而不會讓垃圾填滿整個服務(wù)器。
然而,整個架構(gòu)的關(guān)鍵部分是將塊連接在一起的互連技術(shù)。這必須是高速和低延遲性的,否則當(dāng)計算塊讀取存儲在內(nèi)存塊中的數(shù)據(jù)時性能會受到影響。
低延遲架構(gòu)對于其演示系統(tǒng),dRedBox團(tuán)隊在機(jī)箱內(nèi)使用一款電氣交換機(jī)矩陣連接塊,而光學(xué)交換機(jī)矩陣連接到機(jī)架中另一個機(jī)箱內(nèi)的塊。對于IT環(huán)境而言,這些交換矩陣通常是電路交換的,這意味著它們在配置塊之后會創(chuàng)建專用通道,不像以太網(wǎng)那樣的分組交換網(wǎng)絡(luò),后者會根據(jù)數(shù)據(jù)分組中的地址將數(shù)據(jù)路由到其目的地。
根據(jù)Reale的介紹,選擇這種安排恰恰是因為需要低延遲性。
“通過電路交換與分組交換相比,當(dāng)從計算機(jī)塊到內(nèi)存塊時,可以讓內(nèi)存請求的延遲低得多。”他說。
實際上,Reale聲稱即使使用研究級硬件,dRedBox系統(tǒng)也能夠以遠(yuǎn)遠(yuǎn)低于1微秒的端到端延遲時間所需對遠(yuǎn)程存儲器的訪問,并且生產(chǎn)級處理器芯片以全時鐘速度運行,性能會更高。