Live回顧|Imagination高級(jí)總監(jiān)時(shí)昕《中國(guó)處理器之路》

本文作者：吳京鴻

2019-07-01 17:27

導(dǎo)語(yǔ)：處理器的未來(lái)發(fā)展，肯定還是為應(yīng)用服務(wù)的，現(xiàn)在的應(yīng)用要獲得發(fā)展，最重要的就是用戶(hù)體驗(yàn)，市場(chǎng)規(guī)模，以及安全性。

【大咖Live】人工智能與芯片專(zhuān)場(chǎng)第二期，我們邀請(qǐng)到了Imagination高級(jí)總監(jiān)時(shí)昕，帶來(lái)了關(guān)于《中國(guó)處理器之路-過(guò)去、現(xiàn)在、未來(lái)》的主題直播分享。目前，本期分享音頻及全文實(shí)錄已上線(xiàn)，「AI投研邦」會(huì)員可進(jìn)雷鋒網(wǎng)「AI投研邦」頁(yè)面免費(fèi)查看。

本文對(duì)這期分享進(jìn)行部分要點(diǎn)總結(jié)及PPT整理，以幫助大家提前清晰地了解本場(chǎng)分享重點(diǎn)。

分享提綱

1. 處理器：信息產(chǎn)業(yè)鏈皇冠上的寶石；

2. 處理器架構(gòu)的變遷：分久必合、合久必分；

百花齊放到X86&Arm兩分天下；
聲卡與顯卡等專(zhuān)用處理器；

3 . 處理器的技術(shù)趨勢(shì)；

4. 中國(guó)處理器未來(lái)發(fā)展之路的思考。

以下為Imagination高級(jí)總監(jiān)時(shí)昕的部分直播分享實(shí)錄，【AI投研邦】在不改變?cè)獾幕A(chǔ)上做了整理和精編。完整分享內(nèi)容請(qǐng)關(guān)注【AI投研邦】會(huì)員內(nèi)容。

感謝雷鋒網(wǎng)平臺(tái)和大家的時(shí)間，在現(xiàn)在這個(gè)時(shí)刻，有機(jī)會(huì)跟大家探討一下中國(guó)發(fā)展處理器的一些想法。

首先，我們先聊聊為什么處理器如此的重要；接下來(lái)，我們簡(jiǎn)單回顧一下處理器誕生以來(lái)，這幾十年架構(gòu)變遷的歷史，希望對(duì)我們展望未來(lái)有所幫助；然后，我們?cè)趶募夹g(shù)方面觀察一下處理器可能的發(fā)展趨勢(shì)；最后，我們談?wù)勎磥?lái)發(fā)展中國(guó)處理器時(shí)有哪些需要考慮的問(wèn)題和思路。

一、處理器：信息產(chǎn)業(yè)鏈皇冠上的寶石

我記得我經(jīng)常跟各行業(yè)的朋友說(shuō)，芯片是整個(gè)信息產(chǎn)業(yè)的基礎(chǔ)。從服務(wù)器、云、到桌面到移動(dòng)設(shè)備以及物聯(lián)網(wǎng)設(shè)備，所有的這些信息產(chǎn)品，都是要以芯片為基礎(chǔ)的。我們常說(shuō)現(xiàn)在的世界是信息化社會(huì)，也有說(shuō)法是我們正在進(jìn)入5G時(shí)代，AI時(shí)代等等，相對(duì)于工業(yè)化和信息化這些巨大的社會(huì)進(jìn)步，AI, 5G這些都是在信息化基礎(chǔ)上實(shí)現(xiàn)的新的階段性突破。大的方面來(lái)講，我們還是在信息化社會(huì)的發(fā)展階段。可能有人會(huì)問(wèn)，信息和數(shù)據(jù)這兩者之間有什么區(qū)別和聯(lián)系呢？數(shù)據(jù)是數(shù)據(jù)采集時(shí)提供的，信息是從采集的數(shù)據(jù)中獲取的有用信息。換句話(huà)說(shuō)，數(shù)據(jù)是記錄，也是信息的表現(xiàn)形式。所以我們社會(huì)信息化的根本是對(duì)數(shù)據(jù)的采集、存儲(chǔ)和處理。對(duì)應(yīng)的技術(shù)產(chǎn)品就是各種傳感器、存儲(chǔ)和處理器等各種芯片。

因此我們可以說(shuō)整個(gè)信息產(chǎn)業(yè)的基礎(chǔ)是芯片，而處理器芯片，因?yàn)樗谒行酒械奶厥庑?，包括處理器在系統(tǒng)中的技術(shù)地位以及它的技術(shù)挑戰(zhàn)等等，處理器被稱(chēng)為芯片皇冠上的寶石，也是整個(gè)信息產(chǎn)業(yè)皇冠上的寶石。這里的處理器不僅是指我們筆記本電腦或服務(wù)器上用到的CPU和GPU，其實(shí)在手機(jī)和各種智能物聯(lián)網(wǎng)產(chǎn)品，數(shù)碼娛樂(lè)產(chǎn)品等等很多的地方都有無(wú)數(shù)的處理器在幫我們進(jìn)行信息的處理。雖然沒(méi)有準(zhǔn)確的統(tǒng)計(jì)數(shù)字，但是我們每個(gè)人身邊都有至少兩位數(shù)的處理器。比方說(shuō)您所使用的的筆記本，里面不但有用于跑Windows的CPU和GPU，其實(shí)像筆記本里的硬盤(pán)，wifi等接口也都有小的嵌入式處理器。您的手機(jī)上在AP和基帶這兩個(gè)之外，也有好幾個(gè)小一些的處理器。再加上各種手環(huán)，智能家電等等，我們一般人身邊至少有十幾個(gè)處理器。整個(gè)世界上的處理器更是數(shù)以百億記。

二、處理器架構(gòu)的變遷：分久必合、合久必分

Live回顧|Imagination高級(jí)總監(jiān)時(shí)昕《中國(guó)處理器之路》

經(jīng)過(guò)前面的簡(jiǎn)單介紹，我想大家可能對(duì)處理器的重要程度有些感覺(jué)了。那么我們現(xiàn)在簡(jiǎn)單回顧一下處理器的發(fā)展歷史。

討論處理器，肯定離不開(kāi)討論計(jì)算機(jī)。世界上第一臺(tái)通用計(jì)算機(jī)“ENIAC”是1946年2月14日在美國(guó)賓夕法尼亞大學(xué)誕生的，當(dāng)時(shí)是美國(guó)國(guó)防部用它來(lái)進(jìn)行彈道計(jì)算。當(dāng)時(shí)雖然德國(guó)已經(jīng)投降了，但是這個(gè)項(xiàng)目的開(kāi)始時(shí)，還是為了戰(zhàn)爭(zhēng)服務(wù)的。這臺(tái)計(jì)算機(jī)，用了18000個(gè)電子管，占地150平方米，重量30噸，耗電功率約150千瓦，每秒鐘可進(jìn)行5000次運(yùn)算，這在現(xiàn)在看來(lái)微不足道，但在當(dāng)時(shí)卻是破天荒的。因?yàn)榫w管的發(fā)明還要在一年以后，ENIAC以電子管作為元器件，所以又被稱(chēng)為電子管計(jì)算機(jī)，是計(jì)算機(jī)的第一代。電子管計(jì)算機(jī)由于使用的電子管體積很大，耗電量大，而且使用幾十個(gè)小時(shí)就要對(duì)損壞的電子管進(jìn)行更換，因此工作的時(shí)間不能太長(zhǎng)。

之后，在1947年，貝爾實(shí)驗(yàn)室的肖克利等人發(fā)明了晶體管，再之后，TI的基爾比發(fā)明了集成電路，并且在1959年2月提交了專(zhuān)利。仙童的諾伊斯等人在幾個(gè)月之后申請(qǐng)了另一個(gè)平面集成電路專(zhuān)利。之后的數(shù)十年，集成電路技術(shù)推動(dòng)著處理器的各項(xiàng)指標(biāo)不斷提高。再加上人機(jī)交互技術(shù)如顯示屏、鼠標(biāo)、觸摸屏等技術(shù)的不斷出現(xiàn)于發(fā)展，我們所使用的計(jì)算設(shè)備也越來(lái)越豐富強(qiáng)大。

開(kāi)始的時(shí)候，電腦上只有一個(gè)中央處理器，也就是我們大家都知道的CPU，隨著電腦上要執(zhí)行的任務(wù)越來(lái)越多，更多的處理器設(shè)備也逐漸被加入進(jìn)來(lái)。

最典型的包括聲卡和顯卡。當(dāng)然我們現(xiàn)在的年輕一點(diǎn)的人可能只知道顯卡，也就是GPU，而不太聽(tīng)說(shuō)過(guò)聲卡了。

開(kāi)始的計(jì)算機(jī)上面只有喇叭，只能發(fā)出滴滴滴的警報(bào)聲，世界上第一塊聲卡叫做魔奇音效卡，于1984年誕生于英國(guó)的ADLIB AUDIO公司?？梢哉f(shuō)ADLIB公司是名副其實(shí)的“聲卡之父”。那時(shí)的技術(shù)還很落后，在性能上存在著許多不足之處，就拿這塊聲卡來(lái)說(shuō)，它是單聲道的，而且音質(zhì)現(xiàn)在看來(lái)簡(jiǎn)直是爛到極點(diǎn)，但無(wú)疑它的誕生，開(kāi)創(chuàng)了電腦音頻技術(shù)的先河。

就在人們對(duì)PC音頻滿(mǎn)懷疑慮的時(shí)候，真正的聲卡出現(xiàn)了，Sound Blaster（聲霸卡）曾經(jīng)是IBM個(gè)人電腦聲效的非正式標(biāo)準(zhǔn)，由新加坡創(chuàng)新科技有限公司開(kāi)發(fā)。首張Sound Blaster聲卡在1989年11月面世，其后推出過(guò)多代版本，如Sound Blaster 16，被稱(chēng)為第一張真正的聲卡，這塊卡之所以名為16，是因?yàn)樗鼡碛?6位的復(fù)音數(shù)（是指在回放MIDI時(shí)由聲卡模擬出所能同時(shí)模擬發(fā)聲的樂(lè)器數(shù)目），該聲卡能較為完美地合成音頻效果，具有劃時(shí)代的意義，我們終于能能在電腦上聽(tīng)到類(lèi)似于十幾年前的手機(jī)上的音效，從而可以把煩人的PC喇叭給拆掉了。之后很多年，聲卡都是電腦中的一個(gè)重要配件。然而到了現(xiàn)在，過(guò)去曾經(jīng)非常重要的一個(gè)特定加速卡，已經(jīng)完全被集成在了主板上成為了一個(gè)不起眼的小部件。

與聲卡有些類(lèi)似的還有顯卡，現(xiàn)在的PC和服務(wù)器上的顯卡都是基于我們大家都知道的NVIDIA和AMD的GPU來(lái)做的，通常我們也對(duì)顯卡和GPU不太加以區(qū)分雖然他們不完全是一回事。

獨(dú)立顯卡是插在主板上的擴(kuò)展槽里的（現(xiàn)在一般是PCI-E插槽，此前還有AGP、PCI、ISA等插槽）。此外，Intel和AMD也提供集成顯卡。它主要負(fù)責(zé)把主機(jī)的顯示輸出以顯示器能明白的方式發(fā)送出去。早期的顯卡只是單純意義的顯卡，只起到信號(hào)轉(zhuǎn)換的作用；目前我們一般使用的顯卡都帶有3D畫(huà)面運(yùn)算和圖形加速功能，所以也叫做“圖形加速卡”或“3D加速卡”。

和聲卡不一樣的地方在于，因?yàn)槲覀儗?duì)顯示的需求永無(wú)止境，特別是在游戲和醫(yī)療等行業(yè)，對(duì)顯示的要求很高，因此，目前在PC和服務(wù)器等產(chǎn)品中，高端的GPU還都是獨(dú)立顯卡形式存在，而且經(jīng)常是整個(gè)電腦中單價(jià)最高的模塊。在手機(jī)和Pad等設(shè)備上，因?yàn)殡姵毓╇姾蜕岬脑?，GPU都無(wú)法使用NVIDIA和AMD的GPU，而是使用了特別的移動(dòng)GPU，主要的廠商和產(chǎn)品包括高通的Adreno，這是當(dāng)初高通從AMD收購(gòu)的移動(dòng)GPU，還有Imagination的PowerVR GPU，在所有的蘋(píng)果手機(jī)pad以及一些android設(shè)備上采用的是PowerVR，此外，ARM公司也有移動(dòng)的GPU產(chǎn)品。

這里我們看到，特定應(yīng)用的加速用的處理器最終可能會(huì)走向兩個(gè)結(jié)局，一個(gè)是停滯發(fā)展之后在整個(gè)系統(tǒng)中的重要性逐漸下降如聲卡，另一個(gè)則是因?yàn)樾枨蟛粩嗟奶岣?，而拉?dòng)加速處理器不斷更新提高，一直作為系統(tǒng)的一個(gè)重要核心部件而存在。

我們前面提到處理器架構(gòu)的不斷變遷，但其實(shí)我們還沒(méi)有討論處理器的架構(gòu)究竟是什么東西。在左邊的圖中，我們可以看到，整個(gè)處理系統(tǒng)從底層的物理材料到頂層的應(yīng)用軟件通常由很多層構(gòu)成。其中，我們通常把處理器的指令集架構(gòu)就是Instruction Set Architecture （ISA）稱(chēng)為處理器的架構(gòu)。

在歷史上，處理器架構(gòu)有很多種，包括大家常聽(tīng)說(shuō)的RISC、CISC和VLIW等架構(gòu)。這是按照類(lèi)別的一個(gè)非常粗的分類(lèi)。具體到產(chǎn)品層面，歷史上也出現(xiàn)過(guò)非常多的處理器架構(gòu)，包括Inte和AMD的X86架構(gòu)，ARM公司的CPU架構(gòu)，IBM的Power架構(gòu)，Sun公司的Sparc架構(gòu)，大多數(shù)高校里還在以MIPS架構(gòu)講授處理器架構(gòu)的課程，等等。但是處理器有一個(gè)特點(diǎn)，如果沒(méi)有在這些處理器上跑的足夠豐富易用的軟件生態(tài)，這個(gè)處理器架構(gòu)就沒(méi)有意義。因此我們目前看到很多架構(gòu)都逐漸消亡或者接近消亡了，目前大家關(guān)注的也就是3個(gè)架構(gòu)了，其中的RISC-V架構(gòu)是當(dāng)初MIPS架構(gòu)的設(shè)計(jì)者，Patterson教授在放棄MIPS之后重新提出的一個(gè)新的架構(gòu)，因?yàn)镻atterson教授在處理器領(lǐng)域的巨大聲望，因此這個(gè)新架構(gòu)提出后收到了很多的關(guān)注，但是他是否能夠獲得成功，還需要時(shí)間的檢驗(yàn)。

我在這里在稍微多講一句，大家經(jīng)常聽(tīng)到很多市場(chǎng)宣傳材料里的洗腦，說(shuō)RISC架構(gòu)如何具有功耗優(yōu)勢(shì)等等，其實(shí)這些都是洗腦文，不可全信。在RISC架構(gòu)剛出現(xiàn)的時(shí)候，確實(shí)如此，但隨著其支持的應(yīng)用原來(lái)越多，原來(lái)的RISC處理器不斷的在增加新的指令，因此，現(xiàn)在其實(shí)沒(méi)有一個(gè)清晰的界限，哪個(gè)處理器是CISC，哪個(gè)處理器是RISC。

三、處理器的技術(shù)趨勢(shì)

Live回顧|Imagination高級(jí)總監(jiān)時(shí)昕《中國(guó)處理器之路》

前面我們簡(jiǎn)單回顧了一下歷史上的處理器，現(xiàn)在我們嘗試從技術(shù)層面看一下未來(lái)。

處理器性能在40年間的增長(zhǎng)。這個(gè)圖表顯示了程序性能相對(duì)于SPEC整數(shù)基準(zhǔn)測(cè)試的性能結(jié)果。在上世紀(jì)80年代中期之前，處理器性能的增長(zhǎng)平均每年約22%，即每3.5年性能翻一番。從1986年開(kāi)始，這一數(shù)字增長(zhǎng)到了50%左右，或者說(shuō)處理器性能每2年增加一倍，這就是大家熟知的摩爾定律。到了2003年以后，由于Dennard Scaling不再有效，我們看到，摩爾定律帶來(lái)的性能提升能有大幅下降了。也就是Intel開(kāi)始被大家戲稱(chēng)為牙膏廠，因?yàn)槊磕甑男阅芴嵘駭D牙膏一樣。

Dennard Scaling，Dennard在1974發(fā)了篇論文,預(yù)測(cè)說(shuō)晶體管尺寸變小,功耗會(huì)同比變小,換句話(huà)說(shuō)相同面積下功耗不變。由于Dennard scaling開(kāi)始失效，同時(shí)我們對(duì)于計(jì)算的需求越來(lái)越多，處理器的功耗在十幾年前的時(shí)候就開(kāi)始成為大家關(guān)注的一個(gè)焦點(diǎn)。圖片上是一個(gè)數(shù)據(jù)中心，不但有著復(fù)雜的供電系統(tǒng)，也需要復(fù)雜的散熱系統(tǒng)，我們可以看到那些管道都是用于散熱的水管。很多的數(shù)據(jù)中心開(kāi)始建設(shè)在水電或風(fēng)電充沛的地方，一方面電力便宜，另一方面這些地方的散熱通常也較好處理。在這方面，不管是大型互聯(lián)網(wǎng)公司的數(shù)據(jù)中心也好，甚至很多的數(shù)字加密貨幣的挖礦礦場(chǎng)也是類(lèi)似。

另外，還有兩個(gè)重要的趨勢(shì)，一個(gè)是處理器的時(shí)鐘頻率，另一個(gè)是芯片加工工藝。

我們看到，隨著摩爾定律逐漸接近物理極限，這兩方面的增長(zhǎng)都在放緩。左邊這張圖顯示，處理器時(shí)鐘速率的增長(zhǎng)從1978年到1986年，時(shí)鐘率每年的提高15%。在1986年至2003年，每年50%的性能改進(jìn)，時(shí)鐘率每年飆升近40%。從那以后，時(shí)鐘速度幾乎保持不變，每年的增年增長(zhǎng)率僅為個(gè)位數(shù)。右邊這張圖是ITRS的工藝節(jié)點(diǎn)的預(yù)測(cè)，International Technology Roadmap for Semiconductors，ITRS是由歐洲、日本、韓國(guó)、臺(tái)灣、美國(guó)五個(gè)主要的芯片制造地區(qū)發(fā)起的。在2016年以后，ITRS不再進(jìn)行工藝節(jié)點(diǎn)的預(yù)測(cè)了。雖然我們現(xiàn)在在2019年看，這個(gè)2015年的預(yù)測(cè)不完全準(zhǔn)確，TSMC已經(jīng)7nm量產(chǎn)，5nm也開(kāi)始進(jìn)入試產(chǎn)。但其揭示的趨勢(shì)是沒(méi)有問(wèn)題的，在不遠(yuǎn)的將來(lái)，摩爾定律將無(wú)法繼續(xù)。

在整個(gè)系統(tǒng)中，對(duì)性能的限制其實(shí)在很多時(shí)候不是來(lái)自處理器的性能，而是來(lái)自存儲(chǔ)器，也就是我們常聽(tīng)說(shuō)的memory wall，內(nèi)存墻。因?yàn)槲覀儸F(xiàn)在的處理器都是馮諾依曼結(jié)構(gòu)的，也就是說(shuō)，程序和數(shù)據(jù)都存在存儲(chǔ)器里，處理器從存儲(chǔ)器里取得程序指令和數(shù)據(jù)，處理完的輸出也有送回存儲(chǔ)器。因此，處理器與內(nèi)存之間的傳輸常常會(huì)是整個(gè)系統(tǒng)的瓶頸。為了盡量減小內(nèi)存速度不夠的影響，現(xiàn)代處理器經(jīng)常會(huì)將70%的硅片面積用于緩存。

這里再簡(jiǎn)單介紹一下處理器提高性能的常用技術(shù)手段。將一個(gè)執(zhí)行通過(guò)流水線(xiàn)分成多個(gè)步驟，這樣每個(gè)步驟執(zhí)行的操作就少了，從而可以進(jìn)一步提高時(shí)鐘頻率。在每一個(gè)時(shí)刻，流水線(xiàn)硬件上可以執(zhí)行不同指令的特定步驟。流水線(xiàn)是處理器設(shè)計(jì)的基本內(nèi)容之一，現(xiàn)代的先進(jìn)處理器的流水線(xiàn)可達(dá)十幾級(jí)。但是流水線(xiàn)不能無(wú)限細(xì)分，因?yàn)樵诔绦驁?zhí)行過(guò)程中會(huì)經(jīng)常有跳轉(zhuǎn)等，這時(shí)就要清空流水，重新取正確程序分支的指令和數(shù)據(jù)進(jìn)來(lái)。

Live回顧|Imagination高級(jí)總監(jiān)時(shí)昕《中國(guó)處理器之路》

流水線(xiàn)可以看作從時(shí)間層面進(jìn)行并行處理，另一個(gè)常見(jiàn)的提高處理器性能的技術(shù)則是空間并行。

就是將任務(wù)或數(shù)據(jù)不想關(guān)的處理，放到多個(gè)處理器核上同時(shí)處理。這就是我們常聽(tīng)到的多核技術(shù)multi core。特別是GPU，可以看作是眾核技術(shù)Many Core，一個(gè)GPU芯片上經(jīng)常會(huì)有數(shù)百乃至數(shù)千個(gè)小核，同時(shí)對(duì)很多獨(dú)立的任務(wù)或數(shù)據(jù)進(jìn)行處理。

我們可以看到，在最近的這十幾年中，處理器的核數(shù)明顯提高了。然而，CPU的核數(shù)在達(dá)到最高16核之后幾乎就停止了提高。GPU的核數(shù)在達(dá)到了2千多個(gè)核之后也基本不再增長(zhǎng)了。

這是因?yàn)椋窳魉€(xiàn)技術(shù)一樣，多核與眾核技術(shù)也有很多的限制，在適用的場(chǎng)景下可以極大的提升效率，例如對(duì)圖像中的每個(gè)像素點(diǎn)，都可以獨(dú)立的進(jìn)行處理，然后很多的任務(wù)，是沒(méi)有任務(wù)并行性或數(shù)據(jù)并行性的，因此無(wú)法獲益于并行處理。

而且，在那些適合進(jìn)行并行處理的任務(wù)中，也有很大的技術(shù)挑戰(zhàn)。處理的不好，處理器上并行執(zhí)行的任務(wù)將會(huì)像早晚高峰時(shí)被堵在路上的車(chē)輛一樣動(dòng)彈不得。

最為通用的處理器當(dāng)然是CPU（比如intel的桌面CPU，ARM的嵌入式CPU），可以運(yùn)行任何程序，處理各種數(shù)據(jù)。但問(wèn)題是CPU對(duì)某些應(yīng)用效率太低（處理能力不夠，無(wú)法實(shí)時(shí)處理，或者是能耗太大）。比如，處理graphic不行，于是出現(xiàn)了GPU；信號(hào)處理不行，于是出現(xiàn)了DSP。GPU可以做圖像處理，也可以做DNN的training和inference，但是在處理某些DNN應(yīng)用的時(shí)候效率不高，于是有了專(zhuān)用針對(duì)這些應(yīng)用處理器，也就是大家最近討論的專(zhuān)用AI加速處理器，或者說(shuō)神經(jīng)網(wǎng)絡(luò)處理器NN Processor。所以說(shuō)，專(zhuān)用處理器也是個(gè)相對(duì)概念，相對(duì)CPU而言，別的處理器都是專(zhuān)用處理器。而我想討論的專(zhuān)用處理器是相對(duì)GPU/DSP而言更為“專(zhuān)業(yè)”的處理器。

做專(zhuān)用處理器的原因或者動(dòng)力基本就是兩個(gè)字，“效率”。拿FFT處理器來(lái)看，如果用通用處理器（只有通用的乘加運(yùn)算），做一個(gè)256點(diǎn)的FFT可能需要運(yùn)行幾千條指令，需要很長(zhǎng)時(shí)間。這對(duì)于很多對(duì)時(shí)延要求很苛刻的場(chǎng)景是很難忍受的。如果，用一個(gè)每周期就能做做一次蝶形運(yùn)算的專(zhuān)用處理器，那么這個(gè)時(shí)間會(huì)縮短到幾百個(gè)周期。當(dāng)然，一個(gè)周期執(zhí)行一次蝶形運(yùn)算，相當(dāng)于一次做了好幾個(gè)乘法和加法，需要更多的硬件電路。

當(dāng)然，這個(gè)說(shuō)法只是一個(gè)簡(jiǎn)單化的說(shuō)法。實(shí)際上衡量處理器效率的標(biāo)準(zhǔn)很多，比如能耗效率。而影響處理器效率的因素和設(shè)計(jì)優(yōu)化方法也很多，這就是計(jì)算機(jī)體系結(jié)構(gòu)這個(gè)領(lǐng)域研究的內(nèi)容。不過(guò)，一般來(lái)說(shuō)，如果我們明確的知道我們的處理器的目標(biāo)應(yīng)用場(chǎng)景（有限的應(yīng)用），比如只用來(lái)做FFT的運(yùn)算或者CNN（卷積神經(jīng)網(wǎng)絡(luò)）加速，我們?cè)谠O(shè)計(jì)中就可以不考慮其它的需求，充分發(fā)掘目標(biāo)需求的特點(diǎn)，實(shí)現(xiàn)最有效的設(shè)計(jì)。

那么為什么過(guò)去專(zhuān)用處理器用的不多呢？因?yàn)?，?zhuān)用處理器違背了“不要重新發(fā)明輪子”原則。從某種程度上說(shuō)，專(zhuān)用處理器就是重新發(fā)明輪子，既不經(jīng)濟(jì)和又有很大風(fēng)險(xiǎn)。另一方面，專(zhuān)用處理器的應(yīng)用范圍比較窄，其目標(biāo)市場(chǎng)規(guī)模很有可能無(wú)法讓你獲利?？偟膩?lái)說(shuō)，如果做專(zhuān)用處理器獲得的收益不能超過(guò)開(kāi)發(fā)它花的成本和面臨的風(fēng)險(xiǎn)的話(huà)，還是盡早放棄為好。

而現(xiàn)在隨著AI獲得越來(lái)越多的應(yīng)用，因此有很多的AI專(zhuān)用加速處理器出現(xiàn)。例如，Imagination的神經(jīng)網(wǎng)絡(luò)加速處理器，就可以在AI計(jì)算方面提供數(shù)百近千倍的速度提升，將過(guò)去需要幾分鐘才能完成的計(jì)算縮短到毫秒級(jí)從而滿(mǎn)足實(shí)時(shí)性的要求。

本文為部分內(nèi)容和PPT，完整內(nèi)容和PPT查看可進(jìn)入雷鋒網(wǎng)「AI投研邦」查看

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

2人收藏

相關(guān)文章

吳京鴻

編輯

發(fā)私信

當(dāng)月熱門(mén)文章