這些DSP中的八個(gè)可以提供約1萬億次單精度浮點(diǎn)運(yùn)算性能和約384億次雙精度浮點(diǎn)運(yùn)算性能,而德州儀器的第二代DSP有望實(shí)現(xiàn)更高的性能。
有一點(diǎn)需要指出的是,性能是以單位功耗(瓦)計(jì)算的。使用幾個(gè)ARM芯片和你會(huì)相當(dāng)感興趣的模塊在200瓦的功耗下完成兩萬億次運(yùn)算的ceepie-deepie 超級(jí)計(jì)算機(jī)。
DSP運(yùn)行頻率高達(dá)1.2GHz并配有一個(gè)1MB自有SRAM Level 2緩存,以及兩個(gè)或四個(gè)Cortex-A15 ARM核共享的一個(gè)4MB L2緩存,而每個(gè)核都有32KB 的L1指令型緩存和32KB L1數(shù)據(jù)型緩存。ARM核的運(yùn)行頻率高到1.4GHz,所有緩存均配有ECC擦除,這對(duì)于服務(wù)器工作負(fù)載來說是很重要的,只有DSP具有軟錯(cuò)誤保護(hù)。
▲ARM Cortex-A15處理器的KeyStone II系列產(chǎn)品
同樣重要的是,KeyStone II處理器在其芯片上有一個(gè)集成的以太網(wǎng)交換機(jī)。這個(gè)交換機(jī)就可能能夠像Calxeda用其處理器那樣把SoC連接至一個(gè)交換網(wǎng)絡(luò)。
但是其容量可能并不會(huì)太高,因?yàn)楦鶕?jù)規(guī)格設(shè)計(jì),它只是一個(gè)五端口千兆以太網(wǎng)交換機(jī),一個(gè)端口用于計(jì)算單元而四個(gè)端口用于外部世界的Soc.
我們希望,有可能在軟件中創(chuàng)建一個(gè)有別于多個(gè)Soc及其內(nèi)部千兆以太網(wǎng)交換機(jī)的Layer 2 網(wǎng)絡(luò),以形成簡(jiǎn)潔的高密度集群。KeyStone II芯片的網(wǎng)絡(luò)加速器運(yùn)行線速度為1Gb/秒,它可以每秒150萬個(gè)數(shù)據(jù)包的吞吐量進(jìn)行處理,而這對(duì)于大量的云計(jì)算和超大規(guī)模負(fù)載應(yīng)用也是非常有用的。