丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
芯片 正文
發(fā)私信給包永剛
發(fā)送

0

英偉達(dá)「三芯」策略初步奏效 | ISC 2022

本文作者: 包永剛 2022-05-31 08:05
導(dǎo)語(yǔ):量子系統(tǒng)的下一個(gè)重大飛躍朝著混合系統(tǒng)邁進(jìn)。

相比幾年前談?wù)摰闹攸c(diǎn)只有GPU,在擁有CPU和DPU之后,英偉達(dá)作為系統(tǒng)公司能夠談?wù)摰脑掝}更加豐富。

在剛剛過(guò)去的Computex和時(shí)隔兩年重新回歸線下的ISC 2022(國(guó)際超級(jí)計(jì)算機(jī)大會(huì)),英偉達(dá)都展示了諸多其GPU、CPU、DPU的最新合作成果,這在很大程度上表明了英偉達(dá)的“三芯”策略已經(jīng)初見成效。

英偉達(dá)「三芯」策略初步奏效 | ISC 2022

另外,英偉達(dá)在混合量子計(jì)算中的成果,也體現(xiàn)了其在高性能計(jì)算領(lǐng)域的前瞻性布局。

當(dāng)然,英偉達(dá)CEO黃仁勛也在與媒體的交流中再次強(qiáng)調(diào),“英偉達(dá)是一家系統(tǒng)公司,提供從硬件到系統(tǒng)軟件的全棧方案,客戶可以按照其需求選擇我們的產(chǎn)品。加速計(jì)算的世界與CPU截然不同,我們的產(chǎn)品和方案非常獨(dú)特。”

英偉達(dá)的“三芯”到底如何加速那些世界上最快的加速系統(tǒng)?

獨(dú)特的CPU+GPU組合

GPU作為英偉達(dá)發(fā)明的產(chǎn)品,也是英偉達(dá)的標(biāo)簽,在今年GTC 22上,雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))介紹了英偉達(dá)最新一代Hopper架構(gòu)GPU H100發(fā)布,相比兩年前的Ampere架構(gòu)A100 GPU,實(shí)現(xiàn)了數(shù)量級(jí)的性能提升。

黃仁勛表示,20個(gè) H100 GPU 便可承托相當(dāng)于全球互聯(lián)網(wǎng)的流量,使其能夠幫助客戶推出先進(jìn)的推薦系統(tǒng)以及實(shí)時(shí)運(yùn)行數(shù)據(jù)推理的大型語(yǔ)言模型。

不過(guò),相比GPU,英偉達(dá)的Grace CPU更能吸引外界的關(guān)注。市場(chǎng)上已經(jīng)有很多優(yōu)秀的CPU產(chǎn)品,英偉達(dá)在這樣的背景下推出CPU讓人感到意外,也讓人好奇Grace CPU的不同之處。

當(dāng)被問(wèn)及Grace CPU有何獨(dú)特之處時(shí),黃仁勛說(shuō),“Grace旨在比其它CPU更好地解決與數(shù)據(jù)處理有關(guān)的問(wèn)題,能夠更高效處理大量數(shù)據(jù),并且與我們的GPU緊密結(jié)合,更好地完成解決AI任務(wù)?!?/strong>

英偉達(dá)的Grace CPU超級(jí)芯片集成了兩個(gè)基于Arm的CPU,有多達(dá)144個(gè)高性能Arm Neoverse核心,并且?guī)в锌缮炜s矢量擴(kuò)展和1 TB/s的內(nèi)存子系統(tǒng),支持最新的PCIe Gen5協(xié)議,可實(shí)現(xiàn)與GPU之間最高性能連接,同時(shí)還能連接NVIDIA ConnectX-7智能網(wǎng)卡以及NVIDIA BlueField-3 DPU。

由此看來(lái),英偉達(dá)在設(shè)計(jì)Grace CPU之處就已經(jīng)非常明確要將其所有硬件產(chǎn)品之間很好地互聯(lián)。這也容易理解,隨著摩爾定律的放緩,異構(gòu)計(jì)算成為了未來(lái)趨勢(shì),作為提供高性能計(jì)算產(chǎn)品的公司,英偉達(dá)有這樣的布局也十分合理。

ISC 2022上,英偉達(dá)CPU+GPU的產(chǎn)品組合獲得了認(rèn)可,美國(guó)和歐洲的領(lǐng)先超級(jí)計(jì)算中心都將率先采用這兩款超級(jí)芯片。

美國(guó)阿拉莫斯國(guó)家實(shí)驗(yàn)室(LANL)今日宣布,其新一代系統(tǒng)Venado將成為美國(guó)首個(gè)采用NVIDIA Grace CPU技術(shù)的系統(tǒng)。Venado是使用HPE Cray EX超級(jí)計(jì)算機(jī)構(gòu)建而成的異構(gòu)系統(tǒng),將同時(shí)配備Grace CPU和Grace Hopper,這一系統(tǒng)建成后的AI性能預(yù)計(jì)將超過(guò)10 exaflops(10的18次方,百億億次)。

另一個(gè)率先采用英偉達(dá)Grace CPU和GPU的系統(tǒng)是瑞士國(guó)家計(jì)算中心的新系統(tǒng)Alps,基于HPE Cray EX超級(jí)計(jì)算機(jī)構(gòu)建,這是一個(gè)通用系統(tǒng),向瑞士及其他國(guó)家的研究者開放。

英偉達(dá)還宣布,源訊、戴爾科技,技嘉科技、慧與、浪潮、聯(lián)想和超微宣布計(jì)劃部署基于Grace CPU和Grace Hopper超級(jí)芯片的服務(wù)器。

DPU帶來(lái)的大幅性能提升

DPU是一個(gè)新概念,在英偉達(dá)帶動(dòng)下成為備受關(guān)注的產(chǎn)品,涌現(xiàn)了大量初創(chuàng)公司以及資本的投入

DPU的核心價(jià)值是將通信和計(jì)算負(fù)載從CPU卸載,進(jìn)而獲得巨大的性能提升。不過(guò)DPU能夠帶來(lái)的具體的性能提升,仍然需要實(shí)踐證明,英偉達(dá)借著ISC 2022給出了一些案例。

英偉達(dá)「三芯」策略初步奏效 | ISC 2022

洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室(LANL)的杰出高級(jí)科學(xué)Poole 正與英偉達(dá)進(jìn)行一項(xiàng)為期多年的廣泛合作,旨在將計(jì)算多物理應(yīng)用的性能提高30倍。這其中包括使用 BlueField 及其NVIDIA DOCA軟件框架在計(jì)算存儲(chǔ)、模式匹配等。

LANL 已經(jīng)感受到網(wǎng)絡(luò)計(jì)算的強(qiáng)大功能,加速閃存盒(ABoF)將固態(tài)存儲(chǔ)與DPU和InfiniBand加速器相結(jié)合,可為 Linux 文件系統(tǒng)的關(guān)鍵性能部分提供加速。它的性能高達(dá)同類存儲(chǔ)系統(tǒng)的30倍,并將成為 LANL 基礎(chǔ)架構(gòu)中的關(guān)鍵組件。

俄亥俄州立大學(xué)的研究人員展示了 DPU 如何將一個(gè)HPC熱門編程模型的運(yùn)行速度提高 21%。他們通過(guò)卸載消息傳遞接口(MPI)的關(guān)鍵部分,加速了P3DFFT,這是一個(gè)用于眾多大規(guī)模HPC仿真的數(shù)學(xué)庫(kù)。

對(duì)于運(yùn)行藥物研發(fā)或飛機(jī)設(shè)計(jì)等HPC仿真應(yīng)用的超級(jí)計(jì)算機(jī),DPU也能夠帶來(lái)高達(dá)兩位數(shù)的性能加速。

歐洲的多個(gè)研究團(tuán)隊(duì)正利用BlueField DPU 加速 MPI 和其他 HPC 工作負(fù)載。英格蘭北部的達(dá)勒姆大學(xué)正在開發(fā)一款軟件,用于在 16 個(gè)節(jié)點(diǎn)的 Dell PowerEdge 集群上使用 BlueField DPU 以實(shí)現(xiàn) MPI 作業(yè)的負(fù)載均衡。劍橋大學(xué)、倫敦和慕尼黑等的研究人員也在使用 DPU。

DPU也在用于加速分子動(dòng)力學(xué)研究,還能用于氣候?qū)W、天體物理學(xué)、大數(shù)據(jù)、AI 和更多方面的研究。這些研究人員也在考慮如何使用新一代的BlueField-3 DPU 的核心功能。

三芯策略初步奏效,布局量子計(jì)算

高性能計(jì)算系統(tǒng)對(duì)于算力有著更高要求,也有獨(dú)特需求,在英偉達(dá)擁有了GPU、CPU和DPU之后,它能夠?qū)崿F(xiàn)更多的硬件組合,再配合上層的軟件系統(tǒng),能夠更好滿足前沿應(yīng)用和更高計(jì)算的需求。

通過(guò)ISC 2022的眾多成果展示,也能看到英偉達(dá)的三芯策略已經(jīng)初見成效,不同的產(chǎn)品和產(chǎn)品組合已經(jīng)在HPC、AI等應(yīng)用中實(shí)現(xiàn)性能的顯著提升。

不止于此,英偉達(dá)還在布局前沿的量子計(jì)算。

英偉達(dá)「三芯」策略初步奏效 | ISC 2022

量子計(jì)算有兩大優(yōu)勢(shì),一個(gè)是可以為海量數(shù)據(jù)的并行計(jì)算(性能)帶來(lái)指數(shù)級(jí)別的提升,這種強(qiáng)大的功能,可以運(yùn)用在包括金融、數(shù)據(jù)的搜索處理等領(lǐng)域。另一個(gè)是量子計(jì)算編譯在電子原子上,在模擬方面會(huì)表現(xiàn)的非常自然,例如新材料的發(fā)現(xiàn),生物醫(yī)藥的藥物合成。

不過(guò),量子計(jì)算的實(shí)現(xiàn)還有很多挑戰(zhàn)。隨著量子系統(tǒng)的發(fā)展,下一個(gè)重大飛躍是朝混合系統(tǒng)邁進(jìn):量子計(jì)算機(jī)和經(jīng)典計(jì)算機(jī)協(xié)同工作。

因此,擺在面前的一個(gè)重要任務(wù)就是將傳統(tǒng)系統(tǒng)和量子系統(tǒng)橋接到混合量子計(jì)算機(jī)中。GPU適合與量子計(jì)算協(xié)同工作,能大幅降低經(jīng)典計(jì)算機(jī)和量子計(jì)算機(jī)之間的通信延遲,解決當(dāng)今混合量子作業(yè)面臨的主要瓶頸。

英偉達(dá)「三芯」策略初步奏效 | ISC 2022

據(jù)悉,已經(jīng)有數(shù)十家量子組織已經(jīng)在使用 NVIDIA cuQuantum 軟件開發(fā)套件,在GPU上加速其量子電路模擬,能夠在主要的量子軟件框架上實(shí)現(xiàn)加速計(jì)算。比如,AWS展示了cuQuantum如何在量子機(jī)器學(xué)習(xí)工作負(fù)載上實(shí)現(xiàn)高達(dá)900倍的加速。

在經(jīng)典計(jì)算的層面,英偉達(dá)不斷通過(guò)豐富硬件產(chǎn)品和軟件生態(tài)保持爭(zhēng)力,面向未來(lái)的量子計(jì)算,英偉達(dá)也做好了準(zhǔn)備。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄