行業(yè)資訊
多核技術將是未來處理器發(fā)展的主要趨勢
從上世紀70年代微處理器誕生以來,性能、功能和功耗表現(xiàn)一直按照摩爾定律在提高。但是從大型機時代一直到現(xiàn)在的移動互聯(lián)網(wǎng)時代,不同的應用對各類處理器提出了非常不同的需求,由此產生了種類繁多的微處理器。由于技術的進步和具體應用的需求變化,處理器的發(fā)展有點紛繁復雜的味道。
以多核提升性能功耗比
Tensilica亞太區(qū)銷售總監(jiān)Sam Wang聲稱,多核技術將是未來處理器發(fā)展的主要趨勢,包括同構和異構多核技術,而不是一味追求更高的處理器主頻。
多核處理器把多個處理器核集成到同一個芯片之上。得益于片上更高的通信帶寬和更短的通信時延,多核處理器在并行性方面具有天然的優(yōu)勢。通過動態(tài)調節(jié)電壓/頻率、負載優(yōu)化分布等,可有效降低功耗。研究表明利用大量簡單的處理器核提高并行性可以取得更好的性能功耗比。
Sam Wang認為這種趨勢是多種因素綜合決定的。首先隨著半導體制造工藝進入深亞微米時代,增加芯片中門電路的邊際成本變得越來越小,因此我們可以在單個芯片中集成更多的功能??紤]到漏電功耗對整個芯片功耗的影響,靠提升主頻來提高單核性能不如將任務分配到運行在較低主頻的多顆處理器上運行,這樣設計團隊可以更好的控制整個芯片的功耗。而后PC時代到來,越來越多的芯片將用于電池供電的設備,3C設備將在單個手持或口袋設備中融合在一起,使得低功耗成為芯片設計的重要需求,而不再是摩爾定律帶來的“免費贈品”。
正是這些方面的巨大優(yōu)勢,所有的處理器廠商都推出了多核處理器產品,從最高端的服務器處理器到對功耗非常敏感的嵌入式處理器,都走上了多核處理器的道路。在移動處理器市場占據(jù)絕對份額的ARM發(fā)布的Cortex A9是它首個多核心處理內核,由此所有的主流處理器架構都走上了多核化的道路。
即使在DSP領域,這一趨勢也有體現(xiàn)。德州儀器半導體事業(yè)部業(yè)務拓展經理丁剛就表示,在某些苛求高性能的應用中,DSP多核方案會越來越多。
回顧整個計算機架構發(fā)展史,從大型機到x86架構的PC,發(fā)展趨勢從來都是以分布式的多核運算替代高主頻的單核架構,因此相信嵌入式微處理器設計也將按照這樣的趨勢發(fā)展下去。
多線程也是一個方向
在嵌入式處理器領域,MIPS的MIPS34K內核是目前業(yè)界唯一可公開授權得到的多線程CPU內核。MIPS中國區(qū)市場總監(jiān)費浙平認為多核處理器和多線程技術是未來嵌入式處理器的一個方向,因為多線程處理器在一個CPU核上對軟件模擬出兩個邏輯處理器,以極小的硬件代價獲得相當比例的總體性能和吞吐量提高。這可以算是MIPS的一個構架方面的優(yōu)勢,因為它的主要對手ARM還沒有支持同時多線程技術的內核產品。
原來的ARM處理器內核確實沒有支持同時多線程技術,但ARM市場部經理Kumaran Siva在Linley技術處理器大會上表示,ARM會根據(jù)不同領域的應用需求來支持多線程技術,首先可能會用于網(wǎng)絡和通信領域。網(wǎng)絡和通信市場是對處理器要求最高的領域之一,多核多線程屬于基本的要求。在思科、華為等通訊設備商的網(wǎng)絡設備里,大量存在幾十核的微處理器。當然在高性能領域,ARM還是一個追趕者,它的優(yōu)勢還是在低功耗方面。
多核和多線程技術的聯(lián)合使用是目前處理器理論和實踐中能實現(xiàn)的最強并行處理技術,多核和多線程技術的軟件基礎是多線程編程,如何分配和管理任務的線程,以及由此帶來的性能開銷都是整個計算機科學最核心的研究課題。
超標量超流水線技術闖進嵌入式領域
超標量和超流水線技術現(xiàn)在廣泛用于高性能通用處理器上。在嵌入式市場,功耗從來是重中之重,這些技術應用的相對較少。但是隨著半導體生產工藝的提高和對高性能的個人/家庭娛樂/信息終端的巨大需求,嵌入式處理器的主頻和性能都在大幅增長,其中最大的代表就是ARM的Cortex A系列,原來的ARM11處理器一般主頻只能達到500MHz左右,而現(xiàn)在高端手機使用的Cortex A8已經達到了1GHz主頻,A9更上層樓,最高可達1.5GHz,最新發(fā)布的A15內核可以達到2.5GHz。提高主頻的方式主要靠兩個方式:制造工藝的改進和拉長的流水線。這種主頻倍增的情況顯然是兩種方式共同作用的結果,肯定也加入了大量的分支預測電路做到亂序執(zhí)行,否則新的內核也不可能達到原來內核的3~5倍性能。而MIPS的費浙平也自豪地宣稱,僅使用普通設計流程和物理IP,MIPS74K 主頻在TSMC 40nm 工藝下能達到2.4GHz以上的主頻。MIPS74K正是雙發(fā)射不對稱亂序執(zhí)行超標量處理器,擁有業(yè)界最高單核全速性能。
顯然,在服務器和桌面市場曾經發(fā)生過的主頻和性能大戰(zhàn)在嵌入式領域又要上演了,手機和平板電腦市場是其主戰(zhàn)場,高主頻多核心的處理器是所有消費類電子產品的主要賣點。當然由于嵌入式產品的特性,功耗永遠不會被各大廠商忘記。英特爾甚至為了降低產品功耗進入嵌入式市場,把Atom處理器的分支預測電路都閹割了,真可謂是殊途同歸,目的當然是為了達到特定應用的要求。
DSP和MCU的指令擴展
指令集構架屬于計算機體系結構的核心,它的發(fā)展歷程也就是整個處理器的發(fā)展史。歷史上的計算機分為CISC和RISC兩種指令集構架。這兩種指令體系在80和90年代曾經有大量的爭論,現(xiàn)在RISC處理器占據(jù)了絕對主流的地位,就是以CISC面目出現(xiàn)的x86處理器也早開始使用RISC內核。
指令體系的進步可能是計算機體系結構最核心的改進,也是難度最大的部分,近年來也難以有實質的突破。但在RISC微處理器發(fā)展過程中,產生了超長指令字(VLIW)微處理器,它使用非常長的指令組合,把許多條指令連在一起,就可以并行執(zhí)行。VLIW技術在DSP領域得到了實際廣泛的應用,TI、ADI和CEVA的DSP內核都采用了這種指令構架。
德州儀器的丁剛和ADI的張鐵虎都認為:SIMD (多通道結構和單指令多重數(shù)據(jù))和VLIW (超長指令字)將會在新一代高性能DSP處理器中占據(jù)主導地位。
Tencilica的Sam Wang指出,傳統(tǒng)的固定架構處理器靠提升主頻來提高性能,而Tensilica的可配置處理器通過添加專用指令提高數(shù)據(jù)處理的效率,從而在較低主頻下達到相同或更高的性能。
飛思卡爾微控制器事業(yè)部高級系統(tǒng)工程師 Charlie Wu則認為,32位MCU也會增加DSP所具有的乘累加指令,但是只是整數(shù)指令。這樣MCU也具有一些DSP的功能,可以進行一些對實時性要求不高的濾波器計算。
愛特梅爾公司亞太區(qū)戰(zhàn)略營銷總監(jiān)曹介龍則強調,隨著新一代具DSP功能的MCU的面世,入門級DSP和普通MCU的差別變得越來越小,界限也變得越來越模糊。愛特梅爾具有整數(shù)、定點DSP算法、單周期乘法和累加指令的32位AVR MCU就是一個很好的示例。
異構微處理器日趨流行
多核處理器可以分成對稱多處理SMP和非對稱多處理AMP,而非AMP又可分為異構和同構。異構多處理使用不同類型的處理核心運行不同的應用,最典型的搭配方式有MCU+DSP、DSP+FPGA、MCU+FPGA等。異構多處理的好處是可以同時發(fā)揮不同類型處理器各自的長處來滿足不同種類應用的性能和功耗需求。應用在索尼PS3游戲機上的CELL處理器就是這樣一種典型的異構多處理結構,這種處理器內含一個PowerPC處理器核心和8個SPE單元,當時給整個業(yè)界帶來空前的性能和不凡的功耗表現(xiàn)。而且為了讓異構處理有統(tǒng)一的標準,Kronos組織發(fā)布了OPENCL標準,可以協(xié)調不同的處理單元共同計算。
前面提到的處理器里面增加DSP指令擴展,也可以看作是一種異構多處理,等于把MCU和DSP融合在了一起。而NXP即將推出集成Cortex M0和M4的所謂非對稱多處理器,也是這一趨勢的最佳注腳。
ADI技術市場經理張鐵虎認為:“微控制器是低成本的,主要執(zhí)行智能定向控制任務的通用處理器能很好執(zhí)行智能控制任務,但是它的缺點就是數(shù)字信號處理功能比較差,而DSP則能彌補這一功能缺陷。許多應用都需要兼具智能控制和數(shù)字信號處理兩種功能,因而,把DSP和微處理器進行結合,用單一芯片實現(xiàn)這兩種功能,將會大大加速個人通信機、智能電話、無線網(wǎng)絡產品的開發(fā),簡化設計,減小PCB體積,減小功耗,降低整個系統(tǒng)成本。”
FPGA與MCU兩個產品的融合也并不新鮮。熟悉Altera產品線的工程師們都清楚,除了Altera自己的Nios核之外,還有ARM的Cortex M1、飛思卡爾的Coldfire。而Xilinx本身,也是在自產自銷的MicroBlaze核之外,還有PowerPC核。即使是ARM公司與FPGA的合作,就能數(shù)出一堆來,從Altera到Actel,再到Xilinx。甚至英特爾也將自己的Atom處理器和Altera的Arria II GX FPGA集成在一起推出代號Stellarton的所謂可配置處理器。
Altera的軟件及工具營銷部的高級總監(jiān)Chris Balough表示,關于FPGA和CPU的關系,整合這些器件的趨勢十多年前就出現(xiàn)了,而且這個趨勢將日趨加速。
而Xilinx亞太區(qū)及大中華區(qū)市場及應用總監(jiān)張宇清則斷言:融合MCU和DSP以及FPGA的SoC可稱為理想的SoC。
但是,隨著融合技術的廣泛應用,融合平臺存在的許多問題也漸漸浮出水面,張鐵虎認為有以下問題有待解決:(1)功耗有待降低。DSP和MCU的融合平臺擁有更高性能的同時,也會比單一的DSP或MCU產生更高的功耗。便攜式設備對于功耗是非常敏感的,也就意味著首當其沖的是如何進一步降低功耗。(2)應用環(huán)境的完善與更新,即為用戶提供更加簡易、高效的開發(fā)和調試環(huán)境。(3)復雜程度的降低。嵌入式系統(tǒng)日益復雜化,因此,盡可能簡化系統(tǒng)設計,提高開發(fā)效率,縮短開發(fā)周期,變得越來越重要。(4)成本控制。任何一個系統(tǒng)的發(fā)展都有著對成本控制的嚴格要求,如何在提高性能的同時又能有效控制成本,提高性價比,是所有開發(fā)廠商的根本利益之所在。
不可逆轉的SoC集成
由于集成電路集成度不斷提高,將完整計算機所有不同的功能塊一次直接集成于一顆芯片上的SoC片上系統(tǒng)就成為整個半導體行業(yè)發(fā)展的一個趨勢,也是嵌入式微處理器本身的一個發(fā)展方向。處理器集成各類功能模塊和外圍接口直接組成完整的計算系統(tǒng)可以顯著降低系統(tǒng)成本和功耗,提高系統(tǒng)可靠性。這在嵌入式市場已經成為絕對的主流,因為嵌入式系統(tǒng)功能相對固定,對可靠性、成本、功耗要求更高。
飛思卡爾Charlie Wu認為DSC(數(shù)字信號控制器)會大量應用在新能源領域,如數(shù)字電源,太陽能發(fā)電;混合動力汽車的電池充電管理等。
NXP的金宇杰則認為:今后MCU的發(fā)展方向就是不斷集成各種模擬接口以降低系統(tǒng)整體成本,甚至連CAN這樣原來非常昂貴的接口,以后會因為集成到芯片內而可以進入工業(yè)界。
但是今年在桌面處理器市場也出現(xiàn)了這種趨勢。比如最近AMD發(fā)布的APU就是把CPU、GPU、內存控制器等融合在一塊芯片上,由于集成度增高,系統(tǒng)的整體功耗大幅度減少,從而得以進入上網(wǎng)本、一體機、HTPC甚至嵌入式市場。
專有 vs 開放
由于ARM在移動處理器市場的極端成功,它開放的IP授權模式和封閉的專有處理器模式成為整個業(yè)界討論的一個話題。由于這幾年Cortex M系列內核的成功推廣,各主要MCU廠商都推出了ARM核心的MCU產品,幾乎業(yè)內所有的人都認為ARM通用內核MCU將會占據(jù)市場的主導地位。的確M0核在成本、功耗方面已經非常接近8位MCU,而在代碼量方面可以比原來的8051處理器降低30%~40%,可以大幅降低片上Flash的需求。再加上ARM內核的通用性,對于軟件開發(fā)人員來說實在方便。
ARM授權模式比英特爾的x86處理器市場更加開放更加有活力。而且處理器IP授權廠商不止ARM一家,還有MIPS科技,這家授權廠商的開放性更高,愿意給客戶提供指令集架構的授權。在DSP領域,也有類似角色,CEVA是最大的DSP內核授權商,2009年占據(jù)了78%的市場份額。
當然專有的處理器也有通用處理器無法企及的優(yōu)勢,愛特梅爾公司亞太區(qū)戰(zhàn)略營銷總監(jiān)曹介龍解釋說,通用MCU架構在不同的應用領域擁有很好的“橫向”市場覆蓋度,而專有MCU架構則在某些應用中擁有更好的“垂直”滲透力,例如電容式觸摸屏、智能電池管理、無線傳感器網(wǎng)絡等應用。因而,對于優(yōu)秀的MCU供應商來說,最重要的是能夠同時支持和提供采用通用MCU架構和專有MCU架構的優(yōu)良的MCU解決方案。
Microchip微控制器技術和開發(fā)部門產品市場總監(jiān)Fanie Duvenhage認為專有系統(tǒng)的存在不單單是技術的原因,更多還是各個廠商戰(zhàn)略的考慮,不想完全被ARM牽著鼻子走,除非市場的壓力實在太大,否則各個廠商不會輕易放棄自己的專有構架。另外4位和8位MCU市場也很難被32位的ARM處理器完全取代。
因此,我們有相信與服務器市場類似的情況將再次上演,專有的處理器依靠系統(tǒng)廠商的支持仍舊保持一定份額,但是市場主流將是開放的架構。
X86 vs ARM
本來英特爾和ARM在各自的領域呼風喚雨,攻城略地??墒钱斠苿踊ヂ?lián)網(wǎng)和云計算時代的到來,井水不犯河水的日子到頭了,他們的產品策略正不斷地向對方主宰的市場滲透。
根據(jù)InStat Research 的調查結果,網(wǎng)絡連接設備的處理器市場的年均復合增長率將于2013 年達到 22.3%,2013年7億5000萬個處理器中的一半將被搭載在智能手機上。智能手機銷量預期將由2008年的2億部上升到2013年的5億部。不僅僅是預期銷量令人咂舌,盡管整個手機市場正在萎縮,但智能手機的實際銷量卻在大幅增長。
據(jù) ARM 最近的描述,其收益的64%都來自于移動市場。英特爾也希望能分上一杯羹,它可不想缺席這個急速增長中的市場。巨人英特爾和ARM這個小巧靈活的大不列顛公司之間的戰(zhàn)線正在悄然拉開。當然ARM自己不是處理器生產商,它只是整個處理器生態(tài)系統(tǒng)的一部分,直接跟英特爾交鋒的是高通、nVIDIA等處理器廠商。
英特爾針對嵌入式市場推出的Atom處理器是一款簡化了結構,去掉分支預測電路,只支持順序執(zhí)行的低功耗處理器。相比桌面處理器它的功耗已經相當小,可是相比ARM處理器,仍舊是電老虎,因為x86處理器相比純RISC處理器總是會多出一些解碼譯碼電路,這是維持自己代碼兼容性的必然代價,也許是無法跨越的構架鴻溝。英特爾想通過自己獨步天下的制造工藝來獲得功耗優(yōu)勢,理論上可行,但實際的產品Medfield仍舊沒有正式公布,所以業(yè)內人士普遍不看好它在移動市場的前景。
ARM去年9月已經公布了Cortex A15MP內核,雖然不是先前預測的64位處理器,但是支持擴展尋址能力,可以突破4GB的內存限制,還支持硬件虛擬化,顯然已經可以進入桌面甚至服務器市場。再加上微軟已經宣布會開發(fā)ARM版本的Windows8,它的前景反而更加被業(yè)內看好。畢竟能耗效率是整個行業(yè)越來越關心的指標,ARM處理器在這方面有著天生的優(yōu)勢。
由于這兩家的實際產品都還沒有發(fā)布,實際的性能和功耗都還是未知數(shù)。雖然業(yè)內普遍更加看好ARM所代表的整個陣營,但是英特爾畢竟是處理器的巨人,在這方面的技術積累無人可敵,說不定會有出乎大家意料的產品誕生,進而改變整個行業(yè)的力量對比。
(好展會網(wǎng) )