嵌入式微處理器將走向何方
2011/3/14 9:46:20
從上世紀(jì)70年代微處理器誕生以來(lái),性能、功能和功耗表現(xiàn)一直按照摩爾定律在提高。但是從大型機(jī)時(shí)代一直到現(xiàn)在的移動(dòng)互聯(lián)網(wǎng)時(shí)代,不同的應(yīng)用對(duì)各類處理器提出了非常不同的需求,由此產(chǎn)生了種類繁多的微處理器。由于技術(shù)的進(jìn)步和具體應(yīng)用的需求變化,處理器的發(fā)展有點(diǎn)紛繁復(fù)雜的味道,本刊通過采訪多位業(yè)內(nèi)專家,給工程師讀者整理出一個(gè)嵌入式微處理器技術(shù)發(fā)展的整體脈絡(luò)。
Tensilica亞太區(qū)銷售總監(jiān)SamWang聲稱,多核技術(shù)將是未來(lái)處理器發(fā)展的主要趨勢(shì),包括同構(gòu)和異構(gòu)多核技術(shù),而不是一味追求更高的處理器主頻。
多核處理器把多個(gè)處理器核集成到同一個(gè)芯片之上。得益于片上更高的通信帶寬和更短的通信時(shí)延,多核處理器在并行性方面具有天然的優(yōu)勢(shì)。通過動(dòng)態(tài)調(diào)節(jié)電壓/頻率、負(fù)載優(yōu)化分布等,可有效降低功耗。研究表明利用大量簡(jiǎn)單的處理器核提高并行性可以取得更好的性能功耗比。
SamWang認(rèn)為這種趨勢(shì)是多種因素綜合決定的。首先隨著半導(dǎo)體制造工藝進(jìn)入深亞微米時(shí)代,增加芯片中門電路的邊際成本變得越來(lái)越小,因此我們可以在單個(gè)芯片中集成更多的功能??紤]到漏電功耗對(duì)整個(gè)芯片功耗的影響,靠提升主頻來(lái)提高單核性能不如將任務(wù)分配到運(yùn)行在較低主頻的多顆處理器上運(yùn)行,這樣設(shè)計(jì)團(tuán)隊(duì)可以更好的控制整個(gè)芯片的功耗。而后PC時(shí)代到來(lái),越來(lái)越多的芯片將用于電池供電的設(shè)備,3C設(shè)備將在單個(gè)手持或口袋設(shè)備中融合在一起,使得低功耗成為芯片設(shè)計(jì)的重要需求,而不再是摩爾定律帶來(lái)的“免費(fèi)贈(zèng)品”。
正是這些方面的巨大優(yōu)勢(shì),所有的處理器廠商都推出了多核處理器產(chǎn)品,從高端的服務(wù)器處理器到對(duì)功耗非常敏感的嵌入式處理器,都走上了多核處理器的道路。在移動(dòng)處理器市場(chǎng)占據(jù)絕對(duì)份額的ARM發(fā)布的CortexA9是它首個(gè)多核心處理內(nèi)核,由此所有的主流處理器架構(gòu)都走上了多核化的道路。
即使在DSP領(lǐng)域,這一趨勢(shì)也有體現(xiàn)。德州儀器半導(dǎo)體事業(yè)部業(yè)務(wù)拓展經(jīng)理丁剛就表示,在某些苛求高性能的應(yīng)用中,DSP多核方案會(huì)越來(lái)越多。
回顧整個(gè)計(jì)算機(jī)架構(gòu)發(fā)展史,從大型機(jī)到x86架構(gòu)的PC,發(fā)展趨勢(shì)從來(lái)都是以分布式的多核運(yùn)算替代高主頻的單核架構(gòu),因此相信嵌入式微處理器設(shè)計(jì)也將按照這樣的趨勢(shì)發(fā)展下去。
在嵌入式處理器領(lǐng)域,MIPS的MIPS34K內(nèi)核是目前業(yè)界唯一可公開授權(quán)得到的多線程CPU內(nèi)核。MIPS中國(guó)區(qū)市場(chǎng)總監(jiān)費(fèi)浙平認(rèn)為多核處理器和多線程技術(shù)是未來(lái)嵌入式處理器的一個(gè)方向,因?yàn)槎嗑€程處理器在一個(gè)CPU核上對(duì)軟件模擬出兩個(gè)邏輯處理器,以極小的硬件代價(jià)獲得相當(dāng)比例的總體性能和吞吐量提高。這可以算是MIPS的一個(gè)構(gòu)架方面的優(yōu)勢(shì),因?yàn)樗闹饕獙?duì)手ARM還沒有支持同時(shí)多線程技術(shù)的內(nèi)核產(chǎn)品。
原來(lái)的ARM處理器內(nèi)核確實(shí)沒有支持同時(shí)多線程技術(shù),但ARM市場(chǎng)部經(jīng)理KumaranSiva在Linley技術(shù)處理器大會(huì)上表示,ARM會(huì)根據(jù)不同領(lǐng)域的應(yīng)用需求來(lái)支持多線程技術(shù),首先可能會(huì)用于網(wǎng)絡(luò)和通信領(lǐng)域。網(wǎng)絡(luò)和通信市場(chǎng)是對(duì)處理器要求高的領(lǐng)域之一,多核多線程屬于基本的要求。在思科、華為等通訊設(shè)備商的網(wǎng)絡(luò)設(shè)備里,大量存在幾十核的微處理器。當(dāng)然在高性能領(lǐng)域,ARM還是一個(gè)追趕者,它的優(yōu)勢(shì)還是在低功耗方面。
多核和多線程技術(shù)的聯(lián)合使用是目前處理器理論和實(shí)踐中能實(shí)現(xiàn)的強(qiáng)并行處理技術(shù),多核和多線程技術(shù)的軟件基礎(chǔ)是多線程編程,如何分配和管理任務(wù)的線程,以及由此帶來(lái)的性能開銷都是整個(gè)計(jì)算機(jī)科學(xué)核心的研究課題。
超標(biāo)量和超流水線技術(shù)現(xiàn)在廣泛用于高性能通用處理器上。在嵌入式市場(chǎng),功耗從來(lái)是重中之重,這些技術(shù)應(yīng)用的相對(duì)較少。但是隨著半導(dǎo)體生產(chǎn)工藝的提高和對(duì)高性能的個(gè)人/家庭娛樂/信息終端的巨大需求,嵌入式處理器的主頻和性能都在大幅增長(zhǎng),其中大的代表就是ARM的CortexA系列,原來(lái)的ARM11處理器一般主頻只能達(dá)到500MHz左右,而現(xiàn)在高端手機(jī)使用的CortexA8已經(jīng)達(dá)到了1GHz主頻,A9更上層樓,高可達(dá)1.5GHz,新發(fā)布的A15內(nèi)核可以達(dá)到2.5GHz。提高主頻的方式主要靠?jī)蓚€(gè)方式:制造工藝的改進(jìn)和拉長(zhǎng)的流水線。這種主頻倍增的情況顯然是兩種方式共同作用的結(jié)果,肯定也加入了大量的分支預(yù)測(cè)電路做到亂序執(zhí)行,否則新的內(nèi)核也不可能達(dá)到原來(lái)內(nèi)核的3~5倍性能。而MIPS的費(fèi)浙平也自豪地宣稱,僅使用普通設(shè)計(jì)流程和物理IP,MIPS74K主頻在TSMC40nm工藝下能達(dá)到2.4GHz以上的主頻。MIPS74K正是雙發(fā)射不對(duì)稱亂序執(zhí)行超標(biāo)量處理器,擁有業(yè)界高單核全速性能。
顯然,在服務(wù)器和桌面市場(chǎng)曾經(jīng)發(fā)生過的主頻和性能大戰(zhàn)在嵌入式領(lǐng)域又要上演了,手機(jī)和平板電腦市場(chǎng)是其主戰(zhàn)場(chǎng),高主頻多核心的處理器是所有消費(fèi)類電子產(chǎn)品的主要賣點(diǎn)。當(dāng)然由于嵌入式產(chǎn)品的特性,功耗永遠(yuǎn)不會(huì)被各大廠商忘記。英特爾甚至為了降低產(chǎn)品功耗進(jìn)入嵌入式市場(chǎng),把Atom處理器的分支預(yù)測(cè)電路都閹割了,真可謂是殊途同歸,目的當(dāng)然是為了達(dá)到特定應(yīng)用的要求。
指令集構(gòu)架屬于計(jì)算機(jī)體系結(jié)構(gòu)的核心,它的發(fā)展歷程也就是整個(gè)處理器的發(fā)展史。歷史上的計(jì)算機(jī)分為CISC和RISC兩種指令集構(gòu)架。這兩種指令體系在80和90年代曾經(jīng)有大量的爭(zhēng)論,現(xiàn)在RISC處理器占據(jù)了絕對(duì)主流的地位,就是以CISC面目出現(xiàn)的x86處理器也早開始使用RISC內(nèi)核。
指令體系的進(jìn)步可能是計(jì)算機(jī)體系結(jié)構(gòu)核心的改進(jìn),也是難度大的部分,近年來(lái)也難以有實(shí)質(zhì)的突破。但在RISC微處理器發(fā)展過程中,產(chǎn)生了超長(zhǎng)指令字(VLIW)微處理器,它使用非常長(zhǎng)的指令組合,把許多條指令連在一起,就可以并行執(zhí)行。VLIW技術(shù)在DSP領(lǐng)域得到了實(shí)際廣泛的應(yīng)用,TI、ADI和CEVA的DSP內(nèi)核都采用了這種指令構(gòu)架。
德州儀器的丁剛和ADI的張鐵虎都認(rèn)為:SIMD(多通道結(jié)構(gòu)和單指令多重?cái)?shù)據(jù))和VLIW(超長(zhǎng)指令字)將會(huì)在新一代高性能DSP處理器中占據(jù)主導(dǎo)地位。
Tencilica的SamWang指出,傳統(tǒng)的固定架構(gòu)處理器靠提升主頻來(lái)提高性能,而Tensilica的可配置處理器通過添加專用指令提高數(shù)據(jù)處理的效率,從而在較低主頻下達(dá)到相同或更高的性能。
飛思卡爾微控制器事業(yè)部高級(jí)系統(tǒng)工程師CharlieWu則認(rèn)為,32位MCU也會(huì)增加DSP所具有的乘累加指令,但是只是整數(shù)指令。這樣MCU也具有一些DSP的功能,可以進(jìn)行一些對(duì)實(shí)時(shí)性要求不高的濾波器計(jì)算。
愛特梅爾公司亞太區(qū)戰(zhàn)略營(yíng)銷總監(jiān)曹介龍則強(qiáng)調(diào),隨著新一代具DSP功能的MCU的面世,入門級(jí)DSP和普通MCU的差別變得越來(lái)越小,界限也變得越來(lái)越模糊。愛特梅爾具有整數(shù)、定點(diǎn)DSP算法、單周期乘法和累加指令的32位AVRMCU就是一個(gè)很好的示例。
【生意上的事-用搜脈。了解更多搜了網(wǎng)資訊,請(qǐng)立即關(guān)注搜了網(wǎng)官方微信(微信號(hào):sole518)】

上一篇: 國(guó)內(nèi)工程機(jī)械企業(yè)巧妙加速國(guó)際化戰(zhàn)略
下一篇: 西部是五金企業(yè)發(fā)展的“后花園”