丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
芯片 正文
發(fā)私信給吳京鴻
發(fā)送

0

Live回顧|Imagination高級總監(jiān)時昕《中國處理器之路》

本文作者: 吳京鴻 2019-07-01 17:27
導(dǎo)語:處理器的未來發(fā)展,肯定還是為應(yīng)用服務(wù)的,現(xiàn)在的應(yīng)用要獲得發(fā)展,最重要的就是用戶體驗(yàn),市場規(guī)模,以及安全性。

Live回顧|Imagination高級總監(jiān)時昕《中國處理器之路》

【大咖Live】 人工智能與芯片專場第二期,我們邀請到了Imagination高級總監(jiān)時昕,帶來了關(guān)于《中國處理器之路-過去、現(xiàn)在、未來》的主題直播分享。目前,本期分享音頻及全文實(shí)錄已上線,「AI投研邦」會員可進(jìn)雷鋒網(wǎng)「AI投研邦」頁面免費(fèi)查看。


本文對這期分享進(jìn)行部分要點(diǎn)總結(jié)及PPT整理,以幫助大家提前清晰地了解本場分享重點(diǎn)。


分享提綱

1. 處理器:信息產(chǎn)業(yè)鏈皇冠上的寶石;

2. 處理器架構(gòu)的變遷:分久必合、合久必分;

  •    百花齊放到X86&Arm兩分天下;

  •    聲卡與顯卡等專用處理器;

3 . 處理器的技術(shù)趨勢;

4. 中國處理器未來發(fā)展之路的思考。


以下為Imagination高級總監(jiān)時昕的部分直播分享實(shí)錄,【AI投研邦】在不改變原意的基礎(chǔ)上做了整理和精編。完整分享內(nèi)容請關(guān)注【AI投研邦】會員內(nèi)容。


感謝雷鋒網(wǎng)平臺和大家的時間,在現(xiàn)在這個時刻,有機(jī)會跟大家探討一下中國發(fā)展處理器的一些想法。


首先,我們先聊聊為什么處理器如此的重要;接下來,我們簡單回顧一下處理器誕生以來,這幾十年架構(gòu)變遷的歷史,希望對我們展望未來有所幫助;然后,我們在從技術(shù)方面觀察一下處理器可能的發(fā)展趨勢;最后,我們談?wù)勎磥戆l(fā)展中國處理器時有哪些需要考慮的問題和思路。


一、處理器:信息產(chǎn)業(yè)鏈皇冠上的寶石


Live回顧|Imagination高級總監(jiān)時昕《中國處理器之路》

我記得我經(jīng)常跟各行業(yè)的朋友說,芯片是整個信息產(chǎn)業(yè)的基礎(chǔ)。從服務(wù)器、云、到桌面到移動設(shè)備以及物聯(lián)網(wǎng)設(shè)備,所有的這些信息產(chǎn)品,都是要以芯片為基礎(chǔ)的。我們常說現(xiàn)在的世界是信息化社會,也有說法是我們正在進(jìn)入5G時代,AI時代等等,相對于工業(yè)化和信息化這些巨大的社會進(jìn)步,AI, 5G這些都是在信息化基礎(chǔ)上實(shí)現(xiàn)的新的階段性突破。大的方面來講,我們還是在信息化社會的發(fā)展階段??赡苡腥藭?,信息和數(shù)據(jù)這兩者之間有什么區(qū)別和聯(lián)系呢?數(shù)據(jù)是數(shù)據(jù)采集時提供的,信息是從采集的數(shù)據(jù)中獲取的有用信息。換句話說,數(shù)據(jù)是記錄,也是信息的表現(xiàn)形式。所以我們社會信息化的根本是對數(shù)據(jù)的采集、存儲和處理。對應(yīng)的技術(shù)產(chǎn)品就是各種傳感器、存儲和處理器等各種芯片。


因此我們可以說整個信息產(chǎn)業(yè)的基礎(chǔ)是芯片,而處理器芯片,因?yàn)樗谒行酒械奶厥庑?,包括處理器在系統(tǒng)中的技術(shù)地位以及它的技術(shù)挑戰(zhàn)等等,處理器被稱為芯片皇冠上的寶石,也是整個信息產(chǎn)業(yè)皇冠上的寶石。這里的處理器不僅是指我們筆記本電腦或服務(wù)器上用到的CPU和GPU,其實(shí)在手機(jī)和各種智能物聯(lián)網(wǎng)產(chǎn)品,數(shù)碼娛樂產(chǎn)品等等很多的地方都有無數(shù)的處理器在幫我們進(jìn)行信息的處理。雖然沒有準(zhǔn)確的統(tǒng)計數(shù)字,但是我們每個人身邊都有至少兩位數(shù)的處理器。比方說您所使用的的筆記本,里面不但有用于跑Windows的CPU和GPU,其實(shí)像筆記本里的硬盤,wifi等接口也都有小的嵌入式處理器。您的手機(jī)上在AP和基帶這兩個之外,也有好幾個小一些的處理器。再加上各種手環(huán),智能家電等等,我們一般人身邊至少有十幾個處理器。整個世界上的處理器更是數(shù)以百億記。


二、處理器架構(gòu)的變遷:分久必合、合久必分  

  Live回顧|Imagination高級總監(jiān)時昕《中國處理器之路》

經(jīng)過前面的簡單介紹,我想大家可能對處理器的重要程度有些感覺了。那么我們現(xiàn)在簡單回顧一下處理器的發(fā)展歷史。


討論處理器,肯定離不開討論計算機(jī)。世界上第一臺通用計算機(jī)“ENIAC”是1946年2月14日在美國賓夕法尼亞大學(xué)誕生的,當(dāng)時是美國國防部用它來進(jìn)行彈道計算。當(dāng)時雖然德國已經(jīng)投降了,但是這個項(xiàng)目的開始時,還是為了戰(zhàn)爭服務(wù)的。這臺計算機(jī),用了18000個電子管,占地150平方米,重量30噸,耗電功率約150千瓦,每秒鐘可進(jìn)行5000次運(yùn)算,這在現(xiàn)在看來微不足道,但在當(dāng)時卻是破天荒的。 因?yàn)榫w管的發(fā)明還要在一年以后,ENIAC以電子管作為元器件,所以又被稱為電子管計算機(jī),是計算機(jī)的第一代。電子管計算機(jī)由于使用的電子管體積很大,耗電量大,而且使用幾十個小時就要對損壞的電子管進(jìn)行更換,因此工作的時間不能太長。


之后,在1947年,貝爾實(shí)驗(yàn)室的肖克利等人發(fā)明了晶體管,再之后,TI的基爾比發(fā)明了集成電路,并且在1959年2月提交了專利。仙童的諾伊斯等人在幾個月之后申請了另一個平面集成電路專利。之后的數(shù)十年,集成電路技術(shù)推動著處理器的各項(xiàng)指標(biāo)不斷提高。再加上人機(jī)交互技術(shù)如顯示屏、鼠標(biāo)、觸摸屏等技術(shù)的不斷出現(xiàn)于發(fā)展,我們所使用的計算設(shè)備也越來越豐富強(qiáng)大。


開始的時候,電腦上只有一個中央處理器,也就是我們大家都知道的CPU,隨著電腦上要執(zhí)行的任務(wù)越來越多,更多的處理器設(shè)備也逐漸被加入進(jìn)來。 


最典型的包括聲卡和顯卡。當(dāng)然我們現(xiàn)在的年輕一點(diǎn)的人可能只知道顯卡,也就是GPU,而不太聽說過聲卡了。


開始的計算機(jī)上面只有喇叭,只能發(fā)出滴滴滴的警報聲,世界上第一塊聲卡叫做魔奇音效卡,于1984年誕生于英國的ADLIB AUDIO公司。可以說ADLIB公司是名副其實(shí)的“聲卡之父”。那時的技術(shù)還很落后,在性能上存在著許多不足之處,就拿這塊聲卡來說,它是單聲道的,而且音質(zhì)現(xiàn)在看來簡直是爛到極點(diǎn),但無疑它的誕生,開創(chuàng)了電腦音頻技術(shù)的先河。


就在人們對PC音頻滿懷疑慮的時候,真正的聲卡出現(xiàn)了,Sound Blaster(聲霸卡)曾經(jīng)是IBM個人電腦聲效的非正式標(biāo)準(zhǔn),由新加坡創(chuàng)新科技有限公司開發(fā)。首張Sound Blaster聲卡在1989年11月面世,其后推出過多代版本,如Sound Blaster 16,被稱為第一張真正的聲卡,這塊卡之所以名為16,是因?yàn)樗鼡碛?6位的復(fù)音數(shù)(是指在回放MIDI時由聲卡模擬出所能同時模擬發(fā)聲的樂器數(shù)目),該聲卡能較為完美地合成音頻效果,具有劃時代的意義,我們終于能能在電腦上聽到類似于十幾年前的手機(jī)上的音效,從而可以把煩人的PC喇叭給拆掉了。之后很多年,聲卡都是電腦中的一個重要配件。然而到了現(xiàn)在,過去曾經(jīng)非常重要的一個特定加速卡,已經(jīng)完全被集成在了主板上成為了一個不起眼的小部件。


與聲卡有些類似的還有顯卡,現(xiàn)在的PC和服務(wù)器上的顯卡都是基于我們大家都知道的NVIDIA和AMD的GPU來做的,通常我們也對顯卡和GPU不太加以區(qū)分雖然他們不完全是一回事。


獨(dú)立顯卡是插在主板上的擴(kuò)展槽里的(現(xiàn)在一般是PCI-E插槽,此前還有AGP、PCI、ISA等插槽)。此外,Intel和AMD也提供集成顯卡。它主要負(fù)責(zé)把主機(jī)的顯示輸出以顯示器能明白的方式發(fā)送出去。早期的顯卡只是單純意義的顯卡,只起到信號轉(zhuǎn)換的作用;目前我們一般使用的顯卡都帶有3D畫面運(yùn)算和圖形加速功能,所以也叫做“圖形加速卡”或“3D加速卡”。


和聲卡不一樣的地方在于,因?yàn)槲覀儗︼@示的需求永無止境,特別是在游戲和醫(yī)療等行業(yè),對顯示的要求很高,因此,目前在PC和服務(wù)器等產(chǎn)品中,高端的GPU還都是獨(dú)立顯卡形式存在,而且經(jīng)常是整個電腦中單價最高的模塊。在手機(jī)和Pad等設(shè)備上,因?yàn)殡姵毓╇姾蜕岬脑?,GPU都無法使用NVIDIA和AMD的GPU,而是使用了特別的移動GPU,主要的廠商和產(chǎn)品包括高通的Adreno,這是當(dāng)初高通從AMD收購的移動GPU,還有Imagination的PowerVR GPU,在所有的蘋果手機(jī)pad以及一些android設(shè)備上采用的是PowerVR,此外,ARM公司也有移動的GPU產(chǎn)品。


這里我們看到,特定應(yīng)用的加速用的處理器最終可能會走向兩個結(jié)局,一個是停滯發(fā)展之后在整個系統(tǒng)中的重要性逐漸下降如聲卡,另一個則是因?yàn)樾枨蟛粩嗟奶岣撸瓌蛹铀偬幚砥鞑粩喔绿岣?,一直作為系統(tǒng)的一個重要核心部件而存在。 


我們前面提到處理器架構(gòu)的不斷變遷,但其實(shí)我們還沒有討論處理器的架構(gòu)究竟是什么東西。在左邊的圖中,我們可以看到,整個處理系統(tǒng)從底層的物理材料到頂層的應(yīng)用軟件通常由很多層構(gòu)成。其中,我們通常把處理器的指令集架構(gòu)就是Instruction Set Architecture (ISA)稱為處理器的架構(gòu)。


在歷史上,處理器架構(gòu)有很多種,包括大家常聽說的RISC、CISC和VLIW等架構(gòu)。這是按照類別的一個非常粗的分類。具體到產(chǎn)品層面,歷史上也出現(xiàn)過非常多的處理器架構(gòu),包括Inte和AMD的X86架構(gòu),ARM公司的CPU架構(gòu),IBM的Power架構(gòu),Sun公司的Sparc架構(gòu),大多數(shù)高校里還在以MIPS架構(gòu)講授處理器架構(gòu)的課程,等等。但是處理器有一個特點(diǎn),如果沒有在這些處理器上跑的足夠豐富易用的軟件生態(tài),這個處理器架構(gòu)就沒有意義。因此我們目前看到很多架構(gòu)都逐漸消亡或者接近消亡了,目前大家關(guān)注的也就是3個架構(gòu)了,其中的RISC-V架構(gòu)是當(dāng)初MIPS架構(gòu)的設(shè)計者,Patterson教授在放棄MIPS之后重新提出的一個新的架構(gòu),因?yàn)镻atterson教授在處理器領(lǐng)域的巨大聲望,因此這個新架構(gòu)提出后收到了很多的關(guān)注,但是他是否能夠獲得成功,還需要時間的檢驗(yàn)。


我在這里在稍微多講一句,大家經(jīng)常聽到很多市場宣傳材料里的洗腦,說RISC架構(gòu)如何具有功耗優(yōu)勢等等,其實(shí)這些都是洗腦文,不可全信。在RISC架構(gòu)剛出現(xiàn)的時候,確實(shí)如此,但隨著其支持的應(yīng)用原來越多,原來的RISC處理器不斷的在增加新的指令,因此,現(xiàn)在其實(shí)沒有一個清晰的界限,哪個處理器是CISC,哪個處理器是RISC。


三、處理器的技術(shù)趨勢

 Live回顧|Imagination高級總監(jiān)時昕《中國處理器之路》Live回顧|Imagination高級總監(jiān)時昕《中國處理器之路》Live回顧|Imagination高級總監(jiān)時昕《中國處理器之路》

前面我們簡單回顧了一下歷史上的處理器,現(xiàn)在我們嘗試從技術(shù)層面看一下未來。


處理器性能在40年間的增長。這個圖表顯示了程序性能相對于SPEC整數(shù)基準(zhǔn)測試的性能結(jié)果。在上世紀(jì)80年代中期之前,處理器性能的增長平均每年約22%,即每3.5年性能翻一番。從1986年開始,這一數(shù)字增長到了50%左右,或者說處理器性能每2年增加一倍,這就是大家熟知的摩爾定律。到了2003年以后,由于Dennard Scaling不再有效,我們看到,摩爾定律帶來的性能提升能有大幅下降了。也就是Intel開始被大家戲稱為牙膏廠,因?yàn)槊磕甑男阅芴嵘駭D牙膏一樣。


Dennard Scaling,Dennard在1974發(fā)了篇論文,預(yù)測說晶體管尺寸變小,功耗會同比變小,換句話說相同面積下功耗不變。由于Dennard scaling開始失效,同時我們對于計算的需求越來越多,處理器的功耗在十幾年前的時候就開始成為大家關(guān)注的一個焦點(diǎn)。圖片上是一個數(shù)據(jù)中心,不但有著復(fù)雜的供電系統(tǒng),也需要復(fù)雜的散熱系統(tǒng),我們可以看到那些管道都是用于散熱的水管。很多的數(shù)據(jù)中心開始建設(shè)在水電或風(fēng)電充沛的地方,一方面電力便宜,另一方面這些地方的散熱通常也較好處理。在這方面,不管是大型互聯(lián)網(wǎng)公司的數(shù)據(jù)中心也好,甚至很多的數(shù)字加密貨幣的挖礦礦場也是類似。


另外,還有兩個重要的趨勢,一個是處理器的時鐘頻率,另一個是芯片加工工藝。


我們看到,隨著摩爾定律逐漸接近物理極限,這兩方面的增長都在放緩。左邊這張圖顯示,處理器時鐘速率的增長從1978年到1986年,時鐘率每年的提高15%。在1986年至2003年,每年50%的性能改進(jìn),時鐘率每年飆升近40%。從那以后,時鐘速度幾乎保持不變,每年的增年增長率僅為個位數(shù)。右邊這張圖是ITRS的工藝節(jié)點(diǎn)的預(yù)測,International Technology Roadmap for Semiconductors,ITRS是由歐洲、日本、韓國、臺灣、美國五個主要的芯片制造地區(qū)發(fā)起的。在2016年以后,ITRS不再進(jìn)行工藝節(jié)點(diǎn)的預(yù)測了。雖然我們現(xiàn)在在2019年看,這個2015年的預(yù)測不完全準(zhǔn)確,TSMC已經(jīng)7nm量產(chǎn),5nm也開始進(jìn)入試產(chǎn)。但其揭示的趨勢是沒有問題的,在不遠(yuǎn)的將來,摩爾定律將無法繼續(xù)。


在整個系統(tǒng)中,對性能的限制其實(shí)在很多時候不是來自處理器的性能,而是來自存儲器,也就是我們常聽說的memory wall,內(nèi)存墻。因?yàn)槲覀儸F(xiàn)在的處理器都是馮諾依曼結(jié)構(gòu)的,也就是說,程序和數(shù)據(jù)都存在存儲器里,處理器從存儲器里取得程序指令和數(shù)據(jù),處理完的輸出也有送回存儲器。因此,處理器與內(nèi)存之間的傳輸常常會是整個系統(tǒng)的瓶頸。為了盡量減小內(nèi)存速度不夠的影響,現(xiàn)代處理器經(jīng)常會將70%的硅片面積用于緩存。


這里再簡單介紹一下處理器提高性能的常用技術(shù)手段。將一個執(zhí)行通過流水線分成多個步驟,這樣每個步驟執(zhí)行的操作就少了,從而可以進(jìn)一步提高時鐘頻率。在每一個時刻,流水線硬件上可以執(zhí)行不同指令的特定步驟。流水線是處理器設(shè)計的基本內(nèi)容之一,現(xiàn)代的先進(jìn)處理器的流水線可達(dá)十幾級。但是流水線不能無限細(xì)分,因?yàn)樵诔绦驁?zhí)行過程中會經(jīng)常有跳轉(zhuǎn)等,這時就要清空流水,重新取正確程序分支的指令和數(shù)據(jù)進(jìn)來。 

Live回顧|Imagination高級總監(jiān)時昕《中國處理器之路》Live回顧|Imagination高級總監(jiān)時昕《中國處理器之路》Live回顧|Imagination高級總監(jiān)時昕《中國處理器之路》

流水線可以看作從時間層面進(jìn)行并行處理,另一個常見的提高處理器性能的技術(shù)則是空間并行。


就是將任務(wù)或數(shù)據(jù)不想關(guān)的處理,放到多個處理器核上同時處理。這就是我們常聽到的多核技術(shù)multi core。特別是GPU,可以看作是眾核技術(shù)Many Core,一個GPU芯片上經(jīng)常會有數(shù)百乃至數(shù)千個小核,同時對很多獨(dú)立的任務(wù)或數(shù)據(jù)進(jìn)行處理。


我們可以看到,在最近的這十幾年中,處理器的核數(shù)明顯提高了。然而,CPU的核數(shù)在達(dá)到最高16核之后幾乎就停止了提高。GPU的核數(shù)在達(dá)到了2千多個核之后也基本不再增長了。


這是因?yàn)?,像流水線技術(shù)一樣,多核與眾核技術(shù)也有很多的限制,在適用的場景下可以極大的提升效率,例如對圖像中的每個像素點(diǎn),都可以獨(dú)立的進(jìn)行處理,然后很多的任務(wù),是沒有任務(wù)并行性或數(shù)據(jù)并行性的,因此無法獲益于并行處理。


而且,在那些適合進(jìn)行并行處理的任務(wù)中,也有很大的技術(shù)挑戰(zhàn)。處理的不好,處理器上并行執(zhí)行的任務(wù)將會像早晚高峰時被堵在路上的車輛一樣動彈不得。


最為通用的處理器當(dāng)然是CPU(比如intel的桌面CPU,ARM的嵌入式CPU),可以運(yùn)行任何程序,處理各種數(shù)據(jù)。但問題是CPU對某些應(yīng)用效率太低(處理能力不夠,無法實(shí)時處理,或者是能耗太大)。比如,處理graphic不行,于是出現(xiàn)了GPU;信號處理不行,于是出現(xiàn)了DSP。GPU可以做圖像處理,也可以做DNN的training和inference,但是在處理某些DNN應(yīng)用的時候效率不高,于是有了專用針對這些應(yīng)用處理器,也就是大家最近討論的專用AI加速處理器,或者說神經(jīng)網(wǎng)絡(luò)處理器NN Processor。所以說,專用處理器也是個相對概念,相對CPU而言,別的處理器都是專用處理器。而我想討論的專用處理器是相對GPU/DSP而言更為“專業(yè)”的處理器。


做專用處理器的原因或者動力基本就是兩個字,“效率”。拿FFT處理器來看,如果用通用處理器(只有通用的乘加運(yùn)算),做一個256點(diǎn)的FFT可能需要運(yùn)行幾千條指令,需要很長時間。這對于很多對時延要求很苛刻的場景是很難忍受的。如果,用一個每周期就能做做一次蝶形運(yùn)算的專用處理器,那么這個時間會縮短到幾百個周期。當(dāng)然,一個周期執(zhí)行一次蝶形運(yùn)算,相當(dāng)于一次做了好幾個乘法和加法,需要更多的硬件電路。


當(dāng)然,這個說法只是一個簡單化的說法。實(shí)際上衡量處理器效率的標(biāo)準(zhǔn)很多,比如能耗效率。而影響處理器效率的因素和設(shè)計優(yōu)化方法也很多,這就是計算機(jī)體系結(jié)構(gòu)這個領(lǐng)域研究的內(nèi)容。不過,一般來說,如果我們明確的知道我們的處理器的目標(biāo)應(yīng)用場景(有限的應(yīng)用),比如只用來做FFT的運(yùn)算或者CNN(卷積神經(jīng)網(wǎng)絡(luò))加速,我們在設(shè)計中就可以不考慮其它的需求,充分發(fā)掘目標(biāo)需求的特點(diǎn),實(shí)現(xiàn)最有效的設(shè)計。


那么為什么過去專用處理器用的不多呢?因?yàn)?,專用處理器違背了“不要重新發(fā)明輪子”原則。從某種程度上說,專用處理器就是重新發(fā)明輪子,既不經(jīng)濟(jì)和又有很大風(fēng)險。另一方面,專用處理器的應(yīng)用范圍比較窄,其目標(biāo)市場規(guī)模很有可能無法讓你獲利??偟膩碚f,如果做專用處理器獲得的收益不能超過開發(fā)它花的成本和面臨的風(fēng)險的話,還是盡早放棄為好。


而現(xiàn)在隨著AI獲得越來越多的應(yīng)用,因此有很多的AI專用加速處理器出現(xiàn)。例如,Imagination的神經(jīng)網(wǎng)絡(luò)加速處理器,就可以在AI計算方面提供數(shù)百近千倍的速度提升,將過去需要幾分鐘才能完成的計算縮短到毫秒級從而滿足實(shí)時性的要求。 


本文為部分內(nèi)容和PPT,完整內(nèi)容和PPT查看可進(jìn)入雷鋒網(wǎng)「AI投研邦」查看

Live回顧|Imagination高級總監(jiān)時昕《中國處理器之路》

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說