丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
芯片 正文
發(fā)私信給包永剛
發(fā)送

1

性能最高比英偉達(dá)T4強(qiáng)三倍!百度昆侖AI芯片進(jìn)一步展示“殺手锏”應(yīng)用

本文作者: 包永剛 2020-04-02 18:40
導(dǎo)語(yǔ):昆侖與英特爾T4 GPU的多項(xiàng)對(duì)比數(shù)據(jù),最有優(yōu)勢(shì)的一項(xiàng)數(shù)據(jù)是Gemm-Int8 的Benchmark是T4性能的3倍。

雷鋒網(wǎng)消息,4月2日下午,百度智能芯片總經(jīng)理歐陽(yáng)劍在一場(chǎng)公開(kāi)課中首次對(duì)昆侖芯片進(jìn)行了詳細(xì)分享,并公開(kāi)了昆侖K200與英特爾T4 GPU的多項(xiàng)對(duì)比數(shù)據(jù),其中最有優(yōu)勢(shì)的一項(xiàng)數(shù)據(jù)是Gemm-Int8 的Benchmark是T4性能的3倍。歐陽(yáng)劍還通過(guò)視頻展示了昆侖芯片的殺手锏,與國(guó)產(chǎn)處理器飛騰的良好適配。

性能最高比英偉達(dá)T4強(qiáng)三倍!百度昆侖AI芯片進(jìn)一步展示“殺手锏”應(yīng)用

2018年的百度AI開(kāi)發(fā)者大會(huì)上,百度創(chuàng)始人、董事長(zhǎng)兼CEO李彥宏宣布推出自研AI芯片昆侖。百度研發(fā)AI芯片的積累得益于其用FPGA做AI加速的積累,也得益于其在軟件定義加速器和XPU架構(gòu)的多年積累。

性能最高比英偉達(dá)T4強(qiáng)三倍!百度昆侖AI芯片進(jìn)一步展示“殺手锏”應(yīng)用

百度最早在2010年開(kāi)始用FPGA做AI架構(gòu)的研發(fā),2011年開(kāi)展小規(guī)模部署上線,2017年部署超過(guò)了10000片F(xiàn)PGA,2018年發(fā)布自主研發(fā)AI芯片,2019年下半年流片成功,2020年開(kāi)始量產(chǎn)。

性能最高比英偉達(dá)T4強(qiáng)三倍!百度昆侖AI芯片進(jìn)一步展示“殺手锏”應(yīng)用

昆侖芯片的定位是通用AI芯片,目標(biāo)是提供高性能、低成本、高靈活性的AI芯片。歐陽(yáng)劍在分享中說(shuō):“相比GPU,昆侖芯片的通用性和可編程性都做的不錯(cuò),并且我們還在努力把編程性做的更好。”

性能最高比英偉達(dá)T4強(qiáng)三倍!百度昆侖AI芯片進(jìn)一步展示“殺手锏”應(yīng)用

昆侖發(fā)布之后,其相關(guān)消息陸續(xù)公布。架構(gòu)方面,昆侖有2個(gè)計(jì)算單元,512GB/S的內(nèi)存帶寬,16MB SRAM/unit。歐陽(yáng)劍介紹,16MB的SRAM對(duì)AI推理很有幫助,XPU架構(gòu)上的XPU-SDNN是為Tensor等而設(shè)計(jì),XPU-Cluster則能夠滿足通用處理的需求。

昆侖第一代芯片并沒(méi)有采用NVLink,而是通過(guò)PCIE 4.0接口進(jìn)行互聯(lián)。在三星14nm的制造工藝和2.5D封裝的支持下,昆侖芯片峰值性能可以達(dá)到260TOPS,功耗為150W。

在靈活性和易用性方面,昆侖面向開(kāi)發(fā)者提供類似英偉達(dá)CUDA的軟件棧,可以通過(guò)C/C++語(yǔ)言進(jìn)行編程,降低開(kāi)發(fā)者的開(kāi)發(fā)難度。

性能最高比英偉達(dá)T4強(qiáng)三倍!百度昆侖AI芯片進(jìn)一步展示“殺手锏”應(yīng)用

目前,基于第一代昆侖芯片,百度推出了兩款A(yù)I加速卡,K100和K200,前者算力和功耗都是后者的兩倍。

性能最高比英偉達(dá)T4強(qiáng)三倍!百度昆侖AI芯片進(jìn)一步展示“殺手锏”應(yīng)用

在今天的分享中,歐陽(yáng)劍給出了一系列K200對(duì)比英偉達(dá)T4的數(shù)據(jù),其中在Gemm-Int8數(shù)據(jù)類型,4K X 4K的矩陣下,昆侖K200的Benchmark分出超過(guò)2000,是英偉達(dá)T4的3倍多。

性能最高比英偉達(dá)T4強(qiáng)三倍!百度昆侖AI芯片進(jìn)一步展示“殺手锏”應(yīng)用

在語(yǔ)音常用的Bert/Ernie測(cè)試模型下,昆侖也有明顯性能優(yōu)勢(shì)。

性能最高比英偉達(dá)T4強(qiáng)三倍!百度昆侖AI芯片進(jìn)一步展示“殺手锏”應(yīng)用

在線上性能數(shù)據(jù)的表現(xiàn)上,昆侖的表現(xiàn)相比英偉達(dá)T4更加穩(wěn)定,且延遲也有優(yōu)勢(shì)。

性能最高比英偉達(dá)T4強(qiáng)三倍!百度昆侖AI芯片進(jìn)一步展示“殺手锏”應(yīng)用

在圖像分割YOLOV3算法中,昆侖雖然有優(yōu)勢(shì),但優(yōu)勢(shì)已經(jīng)不那么明顯。不過(guò)歐陽(yáng)劍表示百度仍然在通過(guò)持續(xù)的優(yōu)化提高昆侖的性能。

性能最高比英偉達(dá)T4強(qiáng)三倍!百度昆侖AI芯片進(jìn)一步展示“殺手锏”應(yīng)用

他同時(shí)表示,昆侖已經(jīng)在百度內(nèi)部規(guī)模應(yīng)用。至于對(duì)外提供AI算力,去年12月13日百度通過(guò)定向邀請(qǐng)的方式通過(guò)百度云提供昆侖的算力。在與歐陽(yáng)劍的直播互動(dòng)中,雷鋒網(wǎng)了解到通過(guò)百度云提供昆侖AI算力目前仍然是定向邀請(qǐng)的方式,且主要是私有部署的方式。百度會(huì)通過(guò)定向邀請(qǐng)的客戶的反饋消息,再通過(guò)百度云大規(guī)模向外提供昆侖的算力,但他沒(méi)有給出具體的時(shí)間線。

除了通過(guò)百度云提供昆侖的算力,歐陽(yáng)劍也展示了昆侖加速卡在工業(yè)智能設(shè)備中的應(yīng)用。歐陽(yáng)劍演示的是用CPU和昆侖加速卡去進(jìn)行產(chǎn)品缺陷檢測(cè),昆侖可以大幅提升速度,但并沒(méi)有給出具體的對(duì)比數(shù)據(jù)。

性能最高比英偉達(dá)T4強(qiáng)三倍!百度昆侖AI芯片進(jìn)一步展示“殺手锏”應(yīng)用

另外一個(gè)展示則是昆侖的殺手锏,那就是和國(guó)產(chǎn)處理器平臺(tái)飛騰的適配。在2019飛騰生態(tài)伙伴大會(huì)上,歐陽(yáng)劍就透露昆侖AI芯片正在適配國(guó)產(chǎn)飛騰服務(wù)器,做性能調(diào)優(yōu)工作。在今天的線上分享中,歐陽(yáng)劍展示了采用昆侖加速卡帶來(lái)的圖像分割速度的顯著加速。

性能最高比英偉達(dá)T4強(qiáng)三倍!百度昆侖AI芯片進(jìn)一步展示“殺手锏”應(yīng)用

飛騰CPU處理器采用的是Armv8指令級(jí),主要用在數(shù)據(jù)中心和云計(jì)算中心,作為國(guó)產(chǎn)芯的代表,昆侖選擇與飛騰進(jìn)行很好地適配顯然是看中了國(guó)產(chǎn)自研芯片的大市場(chǎng)。

通過(guò)飛騰CPU+昆侖AI加速器的方式,雙方可以更好的實(shí)現(xiàn)國(guó)產(chǎn)芯片在服務(wù)器市場(chǎng)的國(guó)產(chǎn)化,也可以視為昆侖AI芯片和加速卡未來(lái)增長(zhǎng)的一個(gè)重要?jiǎng)恿蜌⑹诛怠?span style="color: #FFFFFF;">雷鋒網(wǎng)

相關(guān)文章:

百度三星合力研發(fā),昆侖芯片最早明年初量產(chǎn)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)