0
本文作者: 包永剛 | 2021-10-19 12:42 |
全球高性能CPU市場(chǎng)又增加了一個(gè)重磅玩家。
2021年10月19日云棲大會(huì),阿里巴巴旗下半導(dǎo)體公司平頭哥發(fā)布自研為云而生的高性能CPU倚天710,同時(shí)還推出搭載倚天710的“磐久”云原生服務(wù)器。這是繼2018年云棲大會(huì)發(fā)布的含光800云端AI推理芯片之后,平頭哥最新的自研芯片,也表明其自研高性能芯片的設(shè)計(jì)能力從專(zhuān)用AI芯片走向了通用CPU芯片。
阿里云智能總裁、達(dá)摩院院長(zhǎng)張建鋒
雷鋒網(wǎng)了解到,倚天710采用最新的Armv9架構(gòu),基于最先進(jìn)的5nm工藝,單芯片集成600億晶體管,CPU核心數(shù)高達(dá)128個(gè),最高主頻為3.2GHZ。倚天710不僅是全球首款采用5nm工藝的服務(wù)器芯片,也集成了最新的內(nèi)存DDR5和PCIE5.0。
也就是說(shuō),從架構(gòu)到制造工藝,從CPU核心到內(nèi)存和接口,倚天710都擁有當(dāng)下CPU最先進(jìn)的技術(shù)。
標(biāo)準(zhǔn)測(cè)試集SPECint2017的數(shù)據(jù)顯示,倚天710的分?jǐn)?shù)達(dá)到440,超出業(yè)界標(biāo)桿20%,能效比提升50%以上。
阿里花費(fèi)數(shù)億美元打造一款高性能CPU的價(jià)值和目的何在?
倚天710集最先進(jìn)技術(shù)于一身
概括倚天710的特性,那就是集先進(jìn)技術(shù)于一身。
先看最底層指令集架構(gòu),倚天710采用的是Arm今年三月才發(fā)布的面向新十年的Armv9架構(gòu)。根據(jù)Arm發(fā)布的產(chǎn)品,雷鋒網(wǎng)預(yù)計(jì)倚天710采用的是Arm Neoverse N2核心,兼具性能和能效。
一般而言,Arm只會(huì)為其最新的架構(gòu)選擇少數(shù)幾家合作伙伴,阿里平頭哥作為首個(gè)宣布采用Armv9架構(gòu)的公司,不僅顯示了雙方在合作上的深入,也能體現(xiàn)出平頭哥在芯片設(shè)計(jì)領(lǐng)域的能力。
基于最新的指令集,倚天710包含了高達(dá)128個(gè)核心。之所以說(shuō)是高達(dá),是因?yàn)榻衲?月AMD發(fā)布的最新一代服務(wù)器CPU EPYC,最高為64核128線程,4月英特爾發(fā)布的第三代至強(qiáng)可擴(kuò)展處理器,核心數(shù)是40核。
與倚天710核數(shù)更為接近的,是同樣采用Arm架構(gòu)的Ampere(安晟培)在2020年投產(chǎn)的80核云原生服務(wù)器CPU Ampere Altra。Ampere的128核CPU計(jì)劃在今年第三季度投產(chǎn),同樣采用5nm工藝。
倚天710即將在阿里云數(shù)據(jù)中心部署,然后逐步服務(wù)云上企業(yè)。
再?gòu)牡讓蛹軜?gòu)轉(zhuǎn)向制造工藝,倚天710采用的是5nm工藝,這一節(jié)點(diǎn)已經(jīng)被應(yīng)用于蘋(píng)果A15芯片,但倚天710是首個(gè)采用5nm工藝的服務(wù)器CPU。最新的架構(gòu)加上最新的工藝,自然會(huì)對(duì)芯片設(shè)計(jì)的能力有較高要求。
但相比之下,解決上百個(gè)核心帶來(lái)的帶寬瓶頸更考驗(yàn)平頭哥。過(guò)去數(shù)年間,處理器核心性能的提升速度遠(yuǎn)超帶寬的性能提升速度,這限制了CPU計(jì)算性能的提升,就像是“茶壺里面倒餃子”。
據(jù)悉,為了解決帶寬瓶頸,平頭哥對(duì)片上互聯(lián)作了特殊優(yōu)化,采用新的流控算法,降低系統(tǒng)反壓,有效提升了系統(tǒng)效率和擴(kuò)展性,使單核高性能有效地轉(zhuǎn)化為整個(gè)系統(tǒng)的高性能。
另外,倚天710通過(guò)新的系統(tǒng)地址到DRAM地址的轉(zhuǎn)換機(jī)制,支持安全、非安全隔離、多NUMA、異常通道隔離多種特性,同時(shí)DRAM讀寫(xiě)效率大幅度提升。
除了從芯片設(shè)計(jì)的前端進(jìn)行優(yōu)化,倚天710在后端物理實(shí)現(xiàn)方面也克服了諸多挑戰(zhàn),包括靈活調(diào)度多達(dá)30種不同EDA軟件、深度定制時(shí)鐘網(wǎng)絡(luò)和定制IP技術(shù)。
倚天710還采用了先進(jìn)封裝技術(shù),集成業(yè)界最領(lǐng)先的內(nèi)存DDR5和接口PCIE5.0技術(shù),有效提升芯片的傳輸速率,并且可適配云的不同應(yīng)用場(chǎng)景,最終實(shí)現(xiàn)了性能和能效的優(yōu)勢(shì)。
花費(fèi)數(shù)億美元打造云CPU的價(jià)值
倚天710集成如此多先進(jìn)技術(shù),也意味著這款芯片的成本非常高昂。
市場(chǎng)研究機(jī)構(gòu)International Business Strategies (IBS)的研究數(shù)據(jù)顯示,28nm之后芯片的成本迅速上升。28nm工藝的成本為0.629億美元,到了7nm和5nm,芯片的成本迅速暴增,5nm將增至4.76億美元。
來(lái)源BIS
芯片是一個(gè)典型需要以量取勝的行業(yè),一款芯片從設(shè)計(jì)到制造,采用先進(jìn)制程成本高達(dá)數(shù)億美元,只有芯片有足夠大的量,才能擁有成本優(yōu)勢(shì),這也是為什么只有手機(jī)這樣的產(chǎn)品才能持續(xù)采用最先進(jìn)的制程。
倚天710作為一款阿里為云而定制的芯片,阿里明確表示不對(duì)外出售,這意味著其出貨量難以達(dá)到手機(jī)的數(shù)億量級(jí)。那么,從單顆芯片成本的角度看,平頭哥自研一款5nm的CPU芯片很難實(shí)現(xiàn)芯片的以量取勝。但如果從總體擁有成本和公司整體的競(jìng)爭(zhēng)力來(lái)分析,自研高性能CPU有非常重要的價(jià)值。
IDC最新今年7月發(fā)布的2021年第一季度中國(guó)公有云市場(chǎng)數(shù)據(jù)顯示,季度內(nèi)IaaS+PaaS市場(chǎng)規(guī)模達(dá)46.32億美元(301億人民幣),其中阿里云排名第一,市場(chǎng)份額為40%。另?yè)?jù)Gartner 2021年報(bào)告,云基礎(chǔ)設(shè)施和平臺(tái)市場(chǎng)呈現(xiàn)穩(wěn)固、集中格局,在全球范圍,超過(guò)90%的云市場(chǎng)向亞馬遜、微軟、阿里云、谷歌等前四家云廠商集中。
阿里云作為芯片的最大使用者之一,在全球建設(shè)了數(shù)百個(gè)云數(shù)據(jù)中心,能夠支撐阿里自研芯片。
但更重要的是,阿里云的競(jìng)爭(zhēng)對(duì)手們也正在通過(guò)自研芯片來(lái)增強(qiáng)自身優(yōu)勢(shì)。亞馬遜自研的Arm CPU已經(jīng)展現(xiàn)出優(yōu)勢(shì),谷歌的TPU也已經(jīng)在云中被廣泛使用。
這樣看來(lái),阿里為云研發(fā)CPU和AI芯片成為其提供差異化服務(wù),保持領(lǐng)導(dǎo)力的關(guān)鍵。
同樣,阿里自研芯片的優(yōu)勢(shì)也已經(jīng)展現(xiàn),2020年10月30日開(kāi)始,淘寶用戶的搜索請(qǐng)求均由含光800處理,其支持的淘寶主搜全鏈路吞吐率性能達(dá)到GPU性能的3倍左右。在杭州城市大腦的業(yè)務(wù)測(cè)試中,1顆含光800的算力相當(dāng)于10顆GPU。
同時(shí),基于對(duì)自身業(yè)務(wù)理解定制的AI芯片也能讓阿里云提供更多更好的AI云服務(wù),比如圖像搜索、場(chǎng)景識(shí)別、視頻內(nèi)容識(shí)別、自然語(yǔ)言處理等場(chǎng)景。
因此,無(wú)論從總體擁有成本,還是公司戰(zhàn)略的角度,自研芯片是阿里云的必然選擇。并且自研的芯片越早應(yīng)用,自研芯片的決心越堅(jiān)定,越有利于阿里云提供高性能,差異化的云服務(wù),保持和提升領(lǐng)導(dǎo)力。
可以看到,倚天710從前端架構(gòu)設(shè)計(jì)到后端物理實(shí)現(xiàn)都是自研,并且集成了最先進(jìn)的技術(shù)。
阿里成芯片公司?
從2018年阿里平頭哥成立到現(xiàn)在,短短三年間阿里已經(jīng)擁有了自研AI芯片含光800,自研云端CPU倚天710,還開(kāi)發(fā)了十多款玄鐵系列嵌入式RISC-V指令集CPU IP核,累計(jì)出貨量超過(guò)25億顆。
這不禁讓人疑問(wèn),阿里是要取代現(xiàn)有的芯片公司了嗎?
答案是否定的,以阿里為代表的科技巨頭自研芯片的核心原因是市場(chǎng)上的芯片性能越來(lái)越難以滿足其包括AI在內(nèi)的新興業(yè)務(wù),以及提供差異化功能的需求。另外,最先進(jìn)的CPU和GPU售價(jià)高昂,且功耗高,此時(shí)基于對(duì)自身業(yè)務(wù)的理解有針對(duì)性開(kāi)發(fā)芯片成為了一個(gè)更好的選擇。
阿里云智能總裁、達(dá)摩院院長(zhǎng)張建鋒表示:“基于阿里云‘一云多芯’和‘做深基礎(chǔ)’的商業(yè)策略,我們發(fā)布倚天710,希望滿足客戶多樣性的計(jì)算需求。我們將繼續(xù)與英特爾、英偉達(dá)、AMD等合作伙伴保持密切合作?!?/strong>
對(duì)于第三方芯片公司來(lái)說(shuō),其業(yè)務(wù)的核心是盡可能多銷(xiāo)售芯片。
但對(duì)于阿里這樣的系統(tǒng)公司,直接為用戶提供系統(tǒng)級(jí)服務(wù),芯片只是其提供更好、更具差異化服務(wù)的關(guān)鍵,銷(xiāo)售芯片并非其目標(biāo),既然如此,芯片的開(kāi)發(fā)和應(yīng)用策略和路徑和傳統(tǒng)芯片公司并不會(huì)相同。
比如,倚天710與飛天操作系統(tǒng)協(xié)同,能為云上客戶提供高性價(jià)比的云服務(wù)。還有,基于從云到端的芯片,阿里能夠更好的發(fā)展其AIoT生態(tài),構(gòu)建一個(gè)更強(qiáng)大的生態(tài)。
從處理器到服務(wù)器,再到操作系統(tǒng),阿里正在從系統(tǒng)層級(jí)實(shí)現(xiàn)全面的自主,增強(qiáng)競(jìng)爭(zhēng)力。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。