迅速成長的物聯(lián)網(wǎng)、智能硬件、可穿戴式設備以及工業(yè)和汽車電子領域對微控制器(MCU)性能和功耗的要求日趨苛刻,如同智能手機處理器的性能大戰(zhàn)一樣,嵌入式處理器產品也正在經(jīng)歷屬于自己的性能提升大戰(zhàn)。意法半導體(ST)近日就宣布推出業(yè)界首款基于ARM最新Cortex-M7內核的STM32 F7系列微控制器,其性能遠超ST之前的32位STM32F4微控制器,用戶通過無縫升級路徑可將處理性能和DSP性能提高一倍。
為高性能而生的Cortex-M7
一直以來,ARM Cortex-M架構處理器都是嵌入式領域的核心產品。數(shù)據(jù)顯示,截止目前,該系列的芯片出貨量已經(jīng)達到了80億顆、涉及器件種類3000種以上。 2013年,基于Cortex-M架構的嵌入式處理器的出貨總量達到了29億,2014年上半年的總出貨量更是達到了17億,超過175家來自全球的合作伙伴獲得了Cortex-M授權。
作為Cortex-M系列最高性能的CPU內核,Cortex-M7目標定位于諸如智能控制系統(tǒng)的高端嵌入式應用,包括馬達控制、工業(yè)自動化、先進語音功能、圖像處理、各類聯(lián)網(wǎng)交通工具應用以及物聯(lián)網(wǎng)相關應用。除ST外,首批獲得Cortex-M7處理器授權的廠商還包括Atmel與飛思卡爾(Freescale)。
之所以推出Cortex-M7內核,ARM嵌入式市場營銷副總裁Richard York解釋說,智能硬件的發(fā)展勢不可擋,很多連網(wǎng)的智能嵌入式設備要求處理器提供更多的本地化處理功能,這對CPU的性能提出了更高要求。與此同時,更多顯示、人機交互的語言識別需求也要求更高的CPU處理性能,這成為ARM設計M7內核的源動力所在。
“十年前,當ARM推出第一個Cortex-M系列內核時,我們承諾將把Cortex-M系列32位MCU做到一美元,甚至更低價位的市場,當時幾乎所有人都覺得這是一個玩笑。但現(xiàn)在實際的市場需求告訴我們,這不是一個玩笑,而是一個事實。”York認為這得益于ARM與包括ST在內的合作伙伴始終保持著密切的合作關系,并且共同搭建了良好的嵌入式生態(tài)系統(tǒng),從而能夠為各類型的嵌入式應用設計出功能強大、更智能且更為可靠的微控制器。
ARM給出的數(shù)據(jù)顯示,相較于目前性能最高的ARM架構微控制器,Cortex-M7可提升兩倍的運算及數(shù)字信號處理性能,其性能測試結果最高達5CoreMark/MHz,能夠更快速地處理音頻、影像數(shù)據(jù)及語音識別。而以下三點,則被Richard York視作確保M7內核實現(xiàn)高性能的關鍵所在:首先,M7內核采用分支預測的6級超標量流水線,可同時支持單精度和雙精度浮點單元;其次,支持64位 AXI AMBA4互聯(lián),可為高效內存操作提供I-cache與D-cache;最后,則是兼顧實時性、快速的相應能力,支持12個周期的中斷延遲。
對DSP性能方面進行大幅優(yōu)化,使之比熱門的DSP產品更具競爭力,是此番ARM賦予Cortex-M7內核的重要賣點之一。 York說:“在最初規(guī)劃Cortex-M7時,ARM就希望能在某些應用領域采用高端MCU取代DSP。為此,我們不但提供DSP的硬件部分,還包括配套的DSP軟件服務。同時,ARM Keil工具鏈可幫助實現(xiàn)支持Cortex-M7的編制和調試,ARM軟件界面也支持底層標準算法和接口,包括DSP優(yōu)化算法。”
智能系統(tǒng)架構提升STM32 F7處理性能
ST微控制器市場總監(jiān)Daniel Colonna將STM32 F7稱之為“ST有史以來最聰明、最智能的微控制器”,不僅因為它有Cortex-M7內核,關鍵之處在于同時為該內核配置了更多智能化的外設和總線。 “對一顆MCU芯片來說,內核相當重要,但這不是全部。要想把內核性能發(fā)揮到極致,需要從系統(tǒng)架構層面做創(chuàng)新的設計。”
具體而言,STM32 F7采用兩個獨立機制取得零等待執(zhí)行性能,包括內部閃存采用ST ART Accelerator訪存加速技術,為外部存儲器(或內部存儲器)提供一級高速緩存;矩陣方面則使用了64位AXI和先進高性能總線矩陣(Multi- AHB, Advanced High-performance Bus),加上特別設計的雙通用直接訪存(DMA)控制器,可以使數(shù)據(jù)存儲和指令輸送實現(xiàn)零等待;此外,ST在存儲方面做了更多的改進和提升,專門設計了靈活的大容量分布式架構SRAM以滿足不同的應用需求。
盡管STM32 F7的DSP性能是STM32 F4系列的2倍多,但其能耗并未犧牲。新系列運行模式和低功耗模式(停止、待機和VBAT)的功耗與STM32 F4保在同一水平線上:工作模式能效為7 CoreMarks/mW;在低功耗模式下,當上下文和SRAM內容全都保存時,典型功耗最低120μA,典型待機功耗為1.7μA,VBAT模式典型功耗為0.1μA。