丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
芯片 正文
發(fā)私信給包永剛
發(fā)送

0

英偉達(dá)A100 GPU推理性能最高達(dá)CPU的237倍!臨界點到來?

本文作者: 包永剛 2020-10-22 11:33
導(dǎo)語:最新的AI推理測試結(jié)果意味著英偉達(dá)未來可能在推理市場也占據(jù)領(lǐng)導(dǎo)地位。

雷鋒網(wǎng)消息,MLPerf組織今天發(fā)布最新的推理基準(zhǔn)測試(Benchmark)MLPerf Inference v0.7結(jié)果,總共有23個組織提交了結(jié)果,相比上一個版本(MLPerf Inference v0.5)的12個提交者增加了近一倍。

英偉達(dá)A100 GPU推理性能最高達(dá)CPU的237倍!臨界點到來?

結(jié)果顯示,今年5月英偉達(dá)(Nvidia)發(fā)布的安培(Ampere)架構(gòu)A100 Tensor Core GPU在云端推理的基準(zhǔn)測試性能是最先進(jìn)英特爾CPU的237倍。

英偉達(dá)A100 GPU推理性能最高達(dá)CPU的237倍!臨界點到來?

MLPerf Inference V0.7部分結(jié)果截圖 

最新的AI推理測試結(jié)果意味著英偉達(dá)未來可能在AI推理和訓(xùn)練市場都占據(jù)領(lǐng)導(dǎo)地位,給云端AI推理市場擁有優(yōu)勢的英特爾帶來更大壓力的同時,也將讓其他追趕者面臨更大挑戰(zhàn)。

MLPerf推理基準(zhǔn)測試進(jìn)一步完善的價值

與2019年的MLPerf Inference v0.5版本相比,最新的0.7版本將測試從AI研究的核心視覺和語言的5項測試,擴(kuò)展了到了包括推薦系統(tǒng)、自然語言理解、語音識別和醫(yī)療影像應(yīng)用的6項測試,并且有分別針對云端和終端推理的測試,還加入了手機(jī)和筆記本電腦的結(jié)果。擴(kuò)展的測試項從MLPerf和業(yè)界兩個角度都有積極意義。

英偉達(dá)A100 GPU推理性能最高達(dá)CPU的237倍!臨界點到來?

MLPerf Inference v0.5測試項

英偉達(dá)A100 GPU推理性能最高達(dá)CPU的237倍!臨界點到來?

MLPerf Inference v0.7數(shù)據(jù)中心測試項

英偉達(dá)A100 GPU推理性能最高達(dá)CPU的237倍!臨界點到來?

MLPerf Inference v0.7邊緣端測試項

任何一個基準(zhǔn)測試都需要給業(yè)界具有參考價值的指標(biāo)。MLPerf基準(zhǔn)測試是在業(yè)界缺乏對AI芯片公認(rèn)的評價標(biāo)準(zhǔn)的2018年誕生,因此,MLPerf組織既需要給出各方都認(rèn)可的成績,還需要根據(jù)AI行業(yè)的發(fā)展完善評價標(biāo)準(zhǔn)。

不過,AI行業(yè)發(fā)展迅速,AI模型的參數(shù)越來越多,應(yīng)用的場景也越來越廣泛。評價AI芯片和系統(tǒng)的推理性能需要涵蓋可編程性、延遲、準(zhǔn)確性、模型大小、吞吐量、能效等指標(biāo),也需要選擇更具指導(dǎo)價值的模型和應(yīng)用。

此次增加的推薦系統(tǒng)測試對于互聯(lián)網(wǎng)公司意義重大。在王喆的《深度學(xué)習(xí)推薦系統(tǒng)》一書中提到,2019年天貓“雙11”的成交額是2684億元,假設(shè)推薦系統(tǒng)進(jìn)行了優(yōu)化,整體的轉(zhuǎn)化率提高1%,那么增加的成交額大約為26.84億元。

另外,MLPerf Inference v0.7中增加醫(yī)療影像3D U-Net模型測試與新冠大流行以及AI在醫(yī)療行業(yè)的重要性與日俱增密切相關(guān),比如一家初創(chuàng)公司使用AI簡化了超聲心電圖的采集工作,在新冠大流行初期發(fā)揮了作用。

基準(zhǔn)測試從v0.5到v0.7,能夠為要選用AI芯片和系統(tǒng)的公司提供更直觀和有價值的參考是MLPerf基準(zhǔn)測試的價值所在,比如,幫助金融結(jié)構(gòu)的會話式AI更快速回答客戶問題,幫助零售商使用AI保證貨架庫存充足。

與此同時,這也將促進(jìn)MLPerf組織在業(yè)界的受認(rèn)可程度,從接近翻倍的提交成績的組織就能看出來。

GPU云端推理性能最高是CPU的237倍

過去幾年,云端AI訓(xùn)練市場英偉達(dá)擁有絕對優(yōu)勢,云端AI推理市場被英特爾賺取了大部分利潤是事實。這讓不少人都產(chǎn)生了GPU更適合訓(xùn)練而CPU更適合推理的認(rèn)知,但MLPerf最新的推理測試結(jié)果可能會改變這一觀點。

MLPerf Inference V0.7的測試結(jié)果顯示,在數(shù)據(jù)中心OFFLINE(離線)測試模式下,賽靈思U250和英特爾Cooper Lake在各個測試模型下與英偉達(dá)T4的差距不大,但A100對比CPU、FPGA和自家的T4就有明顯的性能差距。

英偉達(dá)A100 GPU推理性能最高達(dá)CPU的237倍!臨界點到來?

在SERVER模式下的推薦系統(tǒng)DLRM模型下,A100 GPU對比英特爾Cooper Lake有最高237倍的性能差距,在其他模型下也有比較顯著的差距。值得注意的是,英特爾的Cooper Lake系統(tǒng)的狀態(tài)還是預(yù)覽,其余三款芯片的系統(tǒng)都已經(jīng)可用。

英偉達(dá)A100 GPU推理性能最高達(dá)CPU的237倍!臨界點到來?

A100 GPU的優(yōu)勢也在邊緣推理中也十分明顯。在單數(shù)據(jù)流(Singel-Stream)測試中,A100對比英偉達(dá)T4和面向邊緣終端的英偉達(dá)Jetson AGX Xavier有幾倍到十幾倍的性能優(yōu)勢。在多數(shù)據(jù)流(Multi-Stream)測試中,A100對比另外兩款自家產(chǎn)品在不同AI模型中有幾倍到二十多倍的性能優(yōu)勢。

英偉達(dá)A100 GPU推理性能最高達(dá)CPU的237倍!臨界點到來?

在邊緣OFFLINE模式下,A100對比T4和Jetson AGX Xavier也有幾倍到二十多倍的性能優(yōu)勢。

這很好地說明A100的安培架構(gòu)以及其第三代Tensor Core優(yōu)勢的同時,也表明了英偉達(dá)能夠覆蓋整個AI推理市場。在此次提交結(jié)果的23家公司中,除了英偉達(dá)外還有11家其合作伙伴提交了基于英偉達(dá)GPU的1029個測試結(jié)果,占數(shù)據(jù)中心和邊緣類別中參評測試結(jié)果總數(shù)的85%以上。

從提交結(jié)果的合作伙伴的系統(tǒng)中可以看到,英偉達(dá)T4仍然是企業(yè)的邊緣服務(wù)器推理平臺的主要選擇。A100提升到新高度的性能意味著未來企業(yè)邊緣服務(wù)器在選擇AI推理平臺的時候,可以從T4升級到A100,對于功耗受限的設(shè)備,可以選擇Jeston系列產(chǎn)品。

特別值得注意的是,英偉達(dá)GPU首次在公有云中實現(xiàn)了超越CPU的AI推理能力。

臨界點到來?AI推理芯片市場競爭門檻更高

五年前,只有少數(shù)領(lǐng)先的高科技公司使用GPU進(jìn)行推理。如今,英偉達(dá)GPU首次在公有云市場實現(xiàn)超越CPU的AI推理能力,或許意味著AI推理市場臨界點的到來。英偉達(dá)還預(yù)測,基于其GPU的總體云端AI推理計算能力每兩年增長約10倍,增長速度高于CPU。

英偉達(dá)A100 GPU推理性能最高達(dá)CPU的237倍!臨界點到來?

另外,英偉達(dá)還強(qiáng)調(diào)基于A100高性能系統(tǒng)的成本效益。英偉達(dá)表示,一套DGX A100系統(tǒng)可以提供相當(dāng)于近1000臺雙插槽CPU服務(wù)器的性能,能為客戶AI推薦系統(tǒng)模型從研發(fā)走向生產(chǎn)的過程,具有極高的成本效益。

英偉達(dá)A100 GPU推理性能最高達(dá)CPU的237倍!臨界點到來?

同時,英偉達(dá)也在不斷優(yōu)化推理軟件堆棧,進(jìn)一步提升在推理市場的競爭力。

最先感受到影響的會是英特爾,但在云端AI推理市場體現(xiàn)出顯著變化至少需要幾年時間,因為企業(yè)在更換平臺的時候會更加謹(jǐn)慎,生態(tài)的護(hù)城河此時也更能體現(xiàn)出價值。

但無論如何,我們都看到英偉達(dá)在AI市場的強(qiáng)勢地位。雷鋒網(wǎng)七月底報道,在MLPerf發(fā)布的MLPerf Training v0.7基準(zhǔn)測試中,A100 Tensor Core GPU,和HDR InfiniBand實現(xiàn)多個DGX A100 系統(tǒng)互聯(lián)的龐大集群DGX SuperPOD系統(tǒng)在性能上開創(chuàng)了八個全新里程碑,共打破16項紀(jì)錄。

安培架構(gòu)A100在MLPerf最新的訓(xùn)練和推理成績表明英偉達(dá)不僅給云端AI訓(xùn)練的競爭者更大的壓力,也可能改變AI推理市場的格局。

英偉達(dá)將其在云端訓(xùn)練市場的優(yōu)勢進(jìn)一步拓展到云端和邊緣推理市場符合AI未來的發(fā)展趨勢。有預(yù)測指出,隨著AI模型的成熟,市場對云端AI訓(xùn)練需求的增速將會降低,云端AI推理的市場規(guī)模將會迅速增加,并有望在2022年超過訓(xùn)練市場。

另據(jù)市場咨詢公司ABI Research的數(shù)據(jù),預(yù)計到2025年,邊緣AI芯片市場收入將達(dá)到122億美元,云端AI芯片市場收入將達(dá)到119億美元,邊緣AI芯片市場將超過云端AI芯片市場。

憑借強(qiáng)大的軟硬件生態(tài)系統(tǒng),英偉達(dá)和英特爾依舊會是AI市場的重要玩家,只是隨著他們競爭力的不斷提升,其他參與AI市場競爭的AI芯片公司們面臨的壓力也隨之增加。

查看MLPerf Inference V0.7完整結(jié)果:https://mlperf.org/inference-results-0-7/雷鋒網(wǎng)

相關(guān)文章:

打破16項AI性能記錄!英偉達(dá)A100 GPU要無人能敵?

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說