如果打開(kāi)一個(gè)網(wǎng)頁(yè)用了3秒鐘,您可能覺(jué)得體驗(yàn)非常好,但是如果這一時(shí)間變?yōu)?分鐘呢?恐怕鮮有人會(huì)有心情去看一個(gè)3分鐘之前要打開(kāi)的頁(yè)面。對(duì)于一個(gè)企業(yè)來(lái)說(shuō)也是一樣,如果自己的系統(tǒng)能夠?qū)崟r(shí)的響應(yīng)自己所有請(qǐng)求,那么無(wú)疑這個(gè)企業(yè)能有更多的時(shí)間專注于業(yè)務(wù)上的創(chuàng)新,領(lǐng)先一步可能意味著占盡先機(jī)。再進(jìn)一步說(shuō)到數(shù)據(jù)中心,高性能應(yīng)該是服務(wù)器、網(wǎng)絡(luò)和存儲(chǔ)一直以來(lái)追求的重點(diǎn)。本篇文章所談的是閃存,因?yàn)殚W存的出現(xiàn)使得數(shù)據(jù)中心存儲(chǔ)的性能提高了數(shù)個(gè)數(shù)量級(jí),自此實(shí)時(shí)分析速度也得到了重新定義。
在傳統(tǒng)數(shù)據(jù)中心中很多組件速度的提升都是成倍增長(zhǎng)的,而且有明確的升級(jí)周期。據(jù)悉,在過(guò)去十年中,CPU性能增長(zhǎng)了8~10倍;內(nèi)存性能增長(zhǎng)了7~9倍;網(wǎng)絡(luò)速度增長(zhǎng)了100倍;總線性能增長(zhǎng)了20倍。但是磁盤陣列的主體磁盤呢?在過(guò)去十年中磁盤性能增長(zhǎng)了1.2倍,當(dāng)下最快的15k轉(zhuǎn)速的磁盤在實(shí)際應(yīng)用中IOPS性能也不會(huì)超過(guò)1000(而且這一轉(zhuǎn)速已經(jīng)很難再提升了),磁盤的性能提升的瓶頸在于其通過(guò)磁頭尋道來(lái)進(jìn)行讀寫操作的原理,要打破這個(gè)僵局,最好的辦法是開(kāi)發(fā)新的介質(zhì),這里新的介質(zhì)就是閃存。
閃存通過(guò)對(duì)NAND充放電來(lái)記錄0和1,沒(méi)有尋道意味著性能可以提升一個(gè)或者幾個(gè)數(shù)量級(jí),事實(shí)也是如此。當(dāng)下主流的SAS/SATA SSD的IOPS都可以做到接近1萬(wàn)(這一數(shù)值比很多入門級(jí)磁盤陣列還要高)的水平,而主流的PCIe閃存卡則更是超過(guò)了20萬(wàn)IOPS。這樣一來(lái),傳統(tǒng)存儲(chǔ)系統(tǒng)需要靠幾十甚至數(shù)百塊磁盤并發(fā)才能實(shí)現(xiàn)的性能如今可能靠一張插在服務(wù)器中的PCIe閃存卡就可以實(shí)現(xiàn)。
以上談到了單個(gè)SSD或者PCIe閃存卡的性能,如果談到存儲(chǔ)陣列層面,全閃存陣列無(wú)疑是當(dāng)下存儲(chǔ)設(shè)備中性能最高的產(chǎn)品,IBM FlashSystem的最新版本V840(基本配置)的4K隨機(jī)讀(不使用緩存)的IOPS可以達(dá)到30萬(wàn),同時(shí)響應(yīng)延遲在200微秒以內(nèi),而設(shè)備的帶寬可以達(dá)到4.8GB/s。
當(dāng)性能提升至少兩個(gè)數(shù)量級(jí)之后,對(duì)于企業(yè)來(lái)講意味著什么呢?碧桂園地產(chǎn)在Flash/SVC上部署了自己的ERP系統(tǒng)之后,銀行現(xiàn)金勾兌時(shí)間縮短為原來(lái)的十分之一,查詢性能提高了10倍。依照碧桂園的業(yè)務(wù)規(guī)模,傳統(tǒng)的存儲(chǔ)陣列要實(shí)現(xiàn)性能提高十倍,恐怕要組織數(shù)千塊盤進(jìn)行并發(fā)才可以。更多的行業(yè)實(shí)踐效果如下圖所示:
我們可以清晰的看到閃存給客戶帶來(lái)的價(jià)值,對(duì)于電信、證券、石油、中小企業(yè)和地產(chǎn)這些企業(yè),閃存可能帶來(lái)的是TCO降低為原來(lái)的一半或者更少,性能提高為原來(lái)的數(shù)十甚至更高的倍數(shù)。乍一看這些數(shù)據(jù)很驚人,但是考慮到閃存的優(yōu)勢(shì)就非常容易理解,SSD本身的性能就已經(jīng)是硬盤的數(shù)十到百倍,在CPU和內(nèi)存等組件沒(méi)有遇到瓶頸的情況下,性能提高到原來(lái)的幾十倍是非常正常的。
本篇文章所提到的是閃存對(duì)實(shí)時(shí)分析速度的再造,這是因?yàn)閷?shí)時(shí)分析的重點(diǎn)在于實(shí)時(shí)兩個(gè)字,其對(duì)系統(tǒng)中每個(gè)環(huán)節(jié)的性能要求都非常高,應(yīng)用特點(diǎn)是短時(shí)間內(nèi)大量的并發(fā)IO以及要求非常短的延遲(實(shí)時(shí)意味著0延遲,雖然這不可能達(dá)到)。閃存只有在這樣一種場(chǎng)景下才能盡顯其優(yōu)勢(shì),而且只有在這種情況下才能有再造速度的必要.
對(duì)于FlashSystem為代表的全閃存陣列再造實(shí)時(shí)分析速度的觀點(diǎn),筆者認(rèn)為應(yīng)該從三個(gè)方面來(lái)闡述.首先是閃存突破了硬盤留下的瓶頸,補(bǔ)齊了存儲(chǔ)這塊短板,才會(huì)造成應(yīng)用閃存后系統(tǒng)性能提升幾十倍。傳統(tǒng)數(shù)據(jù)中心硬件架構(gòu)中最大的瓶頸在于硬盤,閃存的出現(xiàn)補(bǔ)齊了硬盤給數(shù)據(jù)中心性能造成的短板,這才有可能使得閃存運(yùn)用到數(shù)據(jù)中心中會(huì)造成速度提高到原來(lái)的幾個(gè)數(shù)量級(jí),如果原來(lái)硬盤造成的瓶頸問(wèn)題不是很大,那么也不會(huì)有閃存再造實(shí)時(shí)分析速度這樣的觀念了。
第二, 全閃存陣列再造實(shí)時(shí)分析速度的前提是自身的再造。SATA/SAS接口的SSD可以很大程度上提升企業(yè)系統(tǒng)的性能,但是說(shuō)是再造未免牽強(qiáng),因?yàn)镾ATA/SAS接口的SSD在接口上存在瓶頸。所以包括IBM FlashSystem以及眾多的PCIe閃存卡廠商都沒(méi)有選擇SATA/SAS接口的SSD。
這僅是從硬盤來(lái)講,不僅是介質(zhì)層面,從更高的陣列層面來(lái)講,源自TMS的FlashSystem并沒(méi)有磁盤陣列的基因,所以自一開(kāi)始FlashSystem所做的就是打造新的存儲(chǔ)解決方案,這點(diǎn)很重要,因?yàn)槿W存陣列的使命是將企業(yè)系統(tǒng)處理速度提升至傳統(tǒng)系統(tǒng)的幾十至上百倍,那么如果拿磁盤陣列做優(yōu)化,那么難免受磁盤陣列設(shè)計(jì)思路的禁錮。