0
本文作者: 包永剛 | 2019-11-19 10:00 |
上周在舊金山舉行的2019英特爾人工智能峰會(huì)上(Intel AI SUMMIT 2019),英特爾公司副總裁兼人工智能產(chǎn)品事業(yè)部總經(jīng)理Naveen Rao表示今年英特爾的AI收入預(yù)計(jì)將達(dá)到35億美元(約為245億元)。這個(gè)數(shù)據(jù)有兩方面的意義,一方面是英特爾2017年的AI收入為10億美元,2019年的AI收入如果符合預(yù)期意味著英特爾的AI營收兩年增長了250%。另一方面,在業(yè)界都在探索AI落地的當(dāng)下,英特爾AI營收的快速增長將給業(yè)界一些參考意義。
市場需要什么樣的AI芯片?
這一次AI的熱潮,英特爾的CPU和英偉達(dá)的GPU最先受益,有意思的是,如果用以GPU為主要營收的英偉達(dá)的股價(jià)來看AI的發(fā)展,可以看到從2016年左右AI芯片火熱開始,英偉達(dá)的股價(jià)一路上升,這也是AI持續(xù)火熱的幾年。2018年底,英偉達(dá)股價(jià)開始大跌,經(jīng)歷了幾次漲跌至今仍未回到2018年的高點(diǎn),這一時(shí)期伴隨的是AI大規(guī)模落地的探索,我們可以將這視為AI的現(xiàn)實(shí)。
AI專用芯片
與英偉達(dá)一樣,英特爾在這幾年也享受到了AI帶來的收入,股價(jià)幾經(jīng)漲跌,也在探索AI的落地好的途徑。Naveen Rao在2019英特爾人工智能峰會(huì)上演講時(shí)表示,在AI的領(lǐng)域里,很難靠一個(gè)單一的技術(shù)和一種方式或者一個(gè)系統(tǒng)支撐,而是需要ABCS (Approach, Budget,Chip, System),即途徑、預(yù)算、芯片和系統(tǒng)。并且,企業(yè)在AI發(fā)展的過程中,所處的位置是不一樣的。
Naveen Rao意思很明確,企業(yè)對(duì)于AI的需求不同,需要不同的產(chǎn)品以及產(chǎn)品組合去滿足。英特爾的AI收入也反應(yīng)出了多種AI芯片的價(jià)值,2017年英特爾超過10億美元的AI收入來自于在數(shù)據(jù)中心使用英特爾至強(qiáng)處理器運(yùn)行AI應(yīng)用,而2019年35億美元的AI收入則來自多個(gè)AI產(chǎn)品,其中就包括上周宣布商用的NNP。
今年8月,英特爾公布了兩款新一代 AI 芯片,Nervana NNP-T 和 Nervana NNP-I。Nervana NNP-T主要用于深度學(xué)習(xí)訓(xùn)練,采用了臺(tái)積電16nm FF+ 制程工藝,集成270 億個(gè)晶體管,硅片面積 680 平方毫米,支持 TensorFlow、PaddlePaddle、PYTORCH 訓(xùn)練框架,也支持 C++ 深度學(xué)習(xí)軟件庫和編譯器 nGraph。
Nervana NNP-I用于大型數(shù)據(jù)中心的推理芯片,基于10nm工藝和 Ice Lake 內(nèi)核打造, 英特爾表示它在 ResNet50 的效率可達(dá) 4.8TOPs/W,功率范圍在 10W 到 50W 之間。
上周的峰會(huì)上,Naveen Rao公布了NNP的性能,NNP-I1000對(duì)比英偉達(dá)T4有3.7倍的性能優(yōu)勢(shì)。
除了應(yīng)用于云端NNP,上周英特爾還發(fā)布了新一代Movidius VPU,代號(hào)是Keem Bay,面向邊緣端AI市場。新一代VPU采用全新的高效能架構(gòu),并且通過英特爾的 OpenVINO 來加速。與上一代VPU相比,其推理性能有10倍提升。英特爾公司物聯(lián)網(wǎng)事業(yè)部副總裁、視覺市場和渠道部門總經(jīng)理Jonathan Ballon表示,在早期的試驗(yàn)中,新一代VPU性能是英偉達(dá) TX2 的 4 倍,是華為海思 Ascend 310 的 1.25 倍。能效方面,對(duì)英偉達(dá)TX2有6.2倍優(yōu)勢(shì),比英偉達(dá)Xavier和華為昇騰310也優(yōu)勢(shì)明顯。
據(jù)悉,Nervana神經(jīng)網(wǎng)絡(luò)處理器現(xiàn)已投入生產(chǎn)并完成客戶交付,新一代的VPU計(jì)劃在2020年上半年上市。百度人工智能研究員Kenneth Church表示,NNP-T用在了X-Man 4.0(百度的超級(jí)計(jì)算機(jī))上,用了32個(gè)NNP-T每機(jī)架的產(chǎn)品。下一代的AI,我們會(huì)使用更多英特爾的產(chǎn)品,配合百度在AI方面的想法,包括OAI(Open Accelerator Infrastructure)開放加速器架構(gòu)。
NNP-I則獲得了Facebook的采用,F(xiàn)acebook人工智能系統(tǒng)協(xié)同設(shè)計(jì)總監(jiān)Misha Smelyanskiy表示,“在我看來,NNP-I和GLOW之間的配合,可以確??梢宰層?jì)算機(jī)視覺等等的工作負(fù)載,能夠更加的更加節(jié)約能源,更加高性能和更加優(yōu)化的方式來加以處理?!?/p>
顯然,走在AI前沿的科技公司們需要專為AI設(shè)計(jì)的云端和邊緣端芯片。但英特爾和英偉達(dá)在新一輪AI浪潮中率先獲得的收入證明成熟的CPU和GPU同樣能夠在AI時(shí)代繼續(xù)發(fā)揮作用。
傳統(tǒng)芯片的AI價(jià)值
英特爾的AI收入從CPU開始,并在不斷提升至強(qiáng)可擴(kuò)展處理器的AI性能,比如通過VNNI(英特爾矢量神經(jīng)網(wǎng)絡(luò)指令)可以將推理性能提升三倍。Naveen Rao透露,下一代至強(qiáng)可擴(kuò)展處理器Cooper Lake,增加了對(duì)bfloat16的支持,可以用來做一些非常復(fù)雜的深度學(xué)習(xí)的這種模型的訓(xùn)練和推理,而且在這樣的模式之下可以跨CPU、加速器等接觸到使用到更多的工具包,訓(xùn)練的性能有很大的提高。
CPU在AI推理中能夠體現(xiàn)優(yōu)勢(shì),但并不擅長AI訓(xùn)練,擅長并行計(jì)算的GPU則優(yōu)勢(shì)明顯。英特爾明年要發(fā)布獨(dú)立GPU已經(jīng)不是什么秘密,在2019年超級(jí)計(jì)算大會(huì)上,英特爾宣布專為高性能計(jì)算和人工智能融合優(yōu)化的全新獨(dú)立通用GPU。
雷鋒網(wǎng)了解到,此次展示的是基于英特爾Xe架構(gòu)的新類別通用GPU,代號(hào)Ponte Vecchio,將采用英特爾7納米工藝進(jìn)行制造,使用Foveros 3D和嵌入式多芯片互連橋接(EMIB)創(chuàng)新封裝技術(shù),以及多種其它技術(shù),如高帶寬存儲(chǔ)器、CXL互連技術(shù)以及其它專利技術(shù)。
英特爾高級(jí)副總裁、首席架構(gòu)師,兼架構(gòu)、圖形與軟件部門總經(jīng)理Raja M. Koduri在展前發(fā)布會(huì)上表示,Xe圖形架構(gòu)非常靈活,可以做到從低功耗領(lǐng)域到高性能計(jì)算領(lǐng)域的全覆蓋,一種架構(gòu),多種微架構(gòu),通用編程模型。
當(dāng)然,類型齊全的AI處理器還少不了FPGA。本月,英特爾發(fā)布了目前全球密度最高的FPGA,全新Stratix 10 GX 10M,擁有1020萬個(gè)邏輯單元,433億顆晶體管,現(xiàn)已量產(chǎn),即日出貨。全新FPGA針對(duì)ASIC原型設(shè)計(jì)與仿真市場,可加快下一代5G、AI、網(wǎng)絡(luò)ASIC驗(yàn)證與創(chuàng)新。
如何實(shí)現(xiàn)AI收入的快速增長?
顯然,英特爾AI收入的增加很重要的一個(gè)原因就是齊全的AI芯片類型,這能夠讓其更大程度的滿足市場對(duì)AI芯片的需求。不過,更為關(guān)鍵的還是在于軟件。這不僅是因?yàn)檐浖x用戶最近,能夠決定用戶的使用門檻。還因?yàn)樵贏I時(shí)代,業(yè)界都意識(shí)到異構(gòu)多核架構(gòu)對(duì)于AI落地的意義,如何降低異構(gòu)系統(tǒng)的編程復(fù)雜度并提升異構(gòu)硬件系統(tǒng)的效率非常關(guān)鍵。
英特爾所做的是提供統(tǒng)一的軟件平臺(tái),其稱為oneAPI。同樣是在2019年超級(jí)計(jì)算大會(huì)上,英特爾發(fā)布了全新軟件行業(yè)計(jì)劃oneAPI,這個(gè)行業(yè)計(jì)劃是為跨多種包括CPU、GPU、FPGA和其他加速器在內(nèi)的異構(gòu)計(jì)算,提供了一個(gè)統(tǒng)一和簡化的應(yīng)用程序開發(fā)編程模型。oneAPI包括了一項(xiàng)基于開放規(guī)范的行業(yè)計(jì)劃和一款beta產(chǎn)品,oneAPI beta產(chǎn)品為開發(fā)者提供了全套的開發(fā)工具,包括編譯器、編程庫、分析器等,并把這些工具封裝為特定領(lǐng)域的工具包。
Raja M. Koduri表示,高性能計(jì)算和人工智能工作負(fù)載需要包括CPU、通用GPU、FPGA,到本月初英特爾展示的更加專用的深度學(xué)習(xí)芯片NNP在內(nèi)的多種架構(gòu)。幫助客戶更簡便地釋放不同計(jì)算環(huán)境的潛力至關(guān)重要,英特爾致力于采取軟件先行的策略,為多架構(gòu)提供統(tǒng)一可擴(kuò)展的功能加速異構(gòu)創(chuàng)新。
隨著oneAPI計(jì)劃的發(fā)布以及擁有了完整的AI芯片組合,雷鋒網(wǎng)認(rèn)為英特爾的AI收入將會(huì)快速增長。在透露更多關(guān)于GPU消息的同時(shí),英特爾就表示其以數(shù)據(jù)為中心的芯片產(chǎn)品組合和oneAPI計(jì)劃,為阿貢國家實(shí)驗(yàn)室“極光”(Aurora)系統(tǒng)中百億億次級(jí)計(jì)算的高性能計(jì)算和人工智能工作負(fù)載奠定了基礎(chǔ)。
具體而言,“極光”的計(jì)算節(jié)點(diǎn)架構(gòu)將由兩個(gè)10納米英特爾至強(qiáng)可擴(kuò)展處理器(代號(hào)“Sapphire Rapids”)和六個(gè)Ponte Vecchio GPU共同組成。該系統(tǒng)同時(shí)還將支持超過10PB的內(nèi)存和超過230PB的存儲(chǔ)容量,并能通過Cray Slingshot技術(shù)連接超過200個(gè)機(jī)架的節(jié)點(diǎn)。
這也就意味著,英特爾參與AI競爭的時(shí)候的優(yōu)勢(shì)在于其擁有類型全面的AI芯片,并且,通過統(tǒng)一的軟件平臺(tái)oneAPI,盡可能降低AI應(yīng)用的門檻,來加速AI的發(fā)展。更進(jìn)一步,通過制程、封裝、架構(gòu)、存儲(chǔ)、互連、安全、軟件的六大技術(shù)戰(zhàn)略,英特爾將不僅會(huì)局限于AI,而是構(gòu)建在更大范圍內(nèi)的以數(shù)據(jù)為中心時(shí)代的競爭力。
相關(guān)文章:
解讀英特爾邊緣大計(jì)及物聯(lián)網(wǎng)生態(tài)第四階段部署重點(diǎn)
英特爾首席架構(gòu)師Raja:未來10年計(jì)算架構(gòu)的優(yōu)化和提升將比過去50年還多
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。