丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
芯片 正文
發(fā)私信給包永剛
發(fā)送

0

三星新型存算一體HBM2存儲器AI性能達(dá)1.2TFLOPS

本文作者: 包永剛 2021-02-18 11:59
導(dǎo)語:三星稱為HBM-PIM芯片能夠?qū)⑿阅芴嵘?倍的同時功耗降低70%。

雷鋒網(wǎng)按,存算一體或者叫存內(nèi)計算技術(shù)隨著AI的火熱再一次成為業(yè)內(nèi)關(guān)注的焦點,存儲和計算的融合有望解決AI芯片內(nèi)存墻的限制,當(dāng)然,實現(xiàn)的方法也各不相同。雷鋒網(wǎng)此前介紹過知存科技基于NOR FLASH存內(nèi)計算,還有清華大學(xué)錢鶴、吳華強教授團(tuán)隊基于憶阻器的存算一體單芯片算力可能高達(dá)1POPs。三星基于HMB的存內(nèi)計算芯片又有何亮點?

三星新型存算一體HBM2存儲器AI性能達(dá)1.2TFLOPS

三星最新發(fā)布的基于HBM2的新型內(nèi)存具有集成的AI處理器,該處理器可以實現(xiàn)高達(dá)1.2 TFLOPS的計算能力,從而使內(nèi)存芯片能夠處理通常需要CPU、GPU、ASIC或FPGA的任務(wù)。 

新型HBM-PIM(Processing-in-memory,存內(nèi)計算)芯片將AI引擎引入每個存儲庫,從而將處理操作轉(zhuǎn)移到HBM。新型的內(nèi)存旨在減輕在內(nèi)存和處理器之間搬運數(shù)據(jù)的負(fù)擔(dān),數(shù)據(jù)的搬運耗費的功耗遠(yuǎn)大于計算。

三星新型存算一體HBM2存儲器AI性能達(dá)1.2TFLOPS

三星表示,將其應(yīng)用于現(xiàn)有的HBM2 Aquabolt內(nèi)存后,該技術(shù)可以提供2倍的系統(tǒng)性能,同時將能耗降低70%以上。該公司還聲稱,新存儲器不需要對軟件或硬件進(jìn)行任何更改(包括對內(nèi)存控制器),可以讓早期采用者更快實現(xiàn)產(chǎn)品的上市。 

三星表示,這種存儲器已經(jīng)在領(lǐng)先的AI解決方案提供商的AI加速器中進(jìn)行了試驗。三星預(yù)計所有驗證工作都將在今年上半年完成,這標(biāo)志著產(chǎn)品上市進(jìn)入快車道。 

三星在本周的國際固態(tài)電路會議(ISSCC)上展示了其新存儲器架構(gòu)的詳細(xì)信息。


三星新型存算一體HBM2存儲器AI性能達(dá)1.2TFLOPS

三星新型存算一體HBM2存儲器AI性能達(dá)1.2TFLOPS

三星新型存算一體HBM2存儲器AI性能達(dá)1.2TFLOPS

如您在上面的幻燈片中看到的,每個存儲庫都有一個嵌入式可編程計算單元(PCU),其運行頻率為300 MHz,每個裸片上總共32個PCU。這些單元通過來自主機的常規(guī)存儲命令進(jìn)行控制,以啟用DRAM中的處理功能,不同的是,它們可以執(zhí)行FP16的計算。

三星新型存算一體HBM2存儲器AI性能達(dá)1.2TFLOPS

該存儲器還可以在標(biāo)準(zhǔn)模式下運行,這意味著新型的存儲器既可以像普通HBM2一樣運行,也可以在FIM模式下運行以進(jìn)行存內(nèi)數(shù)據(jù)處理。 

自然地,在存儲器中增加PCU單元會減少內(nèi)存容量,每個配備PCU的內(nèi)存芯片的容量(每個4Gb)是標(biāo)準(zhǔn)8Gb HBM2存儲芯片容量的一半。為了解決該問題,三星將4個有PCU的4Gb裸片和4個沒有PCU的8Gb裸片組合在一起,實現(xiàn)6GB堆棧(與之相比,普通HBM2有8GB堆棧)。 

值得注意的是,上面的論文和幻燈片將這種技術(shù)稱為功能內(nèi)存DRAM(FIMDRAM,F(xiàn)unction-In Memory DRAM),但這是該技術(shù)的內(nèi)部代號,這個技術(shù)現(xiàn)在的名稱是HBM-PIM。三星展示的是基于20nm原型芯片,該芯片在不增加功耗的情況下可實現(xiàn)每pin 2.4 Gbps的吞吐量。 

三星新型存算一體HBM2存儲器AI性能達(dá)1.2TFLOPS

論文將基礎(chǔ)技術(shù)描述為功能內(nèi)存DRAM(FIMDRAM),該功能在存儲庫中集成了16寬單指令多數(shù)據(jù)引擎,并利用存儲庫級并行性提供了比片外存儲高4倍的處理帶寬。另外,可以看到的是這種芯片存儲解決方案無需對常規(guī)存儲器控制器及其命令協(xié)議進(jìn)行任何修改,這使得FIMDRAM可以更快在實際應(yīng)用中使用。

三星新型存算一體HBM2存儲器AI性能達(dá)1.2TFLOPS

不幸的是,至少在目前看來,我們不會在最新的游戲GPU中看到這些功能。三星指出,這種新內(nèi)存要滿足數(shù)據(jù)中心、HPC系統(tǒng)和支持AI的移動應(yīng)用程序中的大規(guī)模處理需求。 

與大多數(shù)存內(nèi)計算技術(shù)一樣,希望這項技術(shù)能夠突破存儲芯片散熱的限制,尤其是考慮到HBM芯片通常部署在堆棧中,而這些堆棧并不都有利于散熱。三星的演講者沒有分享HBM-PIM如何應(yīng)對這些挑戰(zhàn)。 

三星電子存儲器產(chǎn)品計劃高級副總裁Kwangil Park表示:“我們開創(chuàng)性的HBM-PIM是業(yè)內(nèi)首個針對各種AI驅(qū)動的工作負(fù)載(如HPC,訓(xùn)練和推理)量身定制的可編程PIM解決方案。我們計劃通過與AI解決方案提供商進(jìn)一步合作以開發(fā)更高級的PIM驅(qū)動的應(yīng)用?!?nbsp;

注,文中圖片來自三星

雷鋒網(wǎng)編譯,原文鏈接:https://www.tomshardware.com/news/samsung-hbm2-hbm-pim-memory-tflops 

相關(guān)文章:

清華高濱:基于憶阻器的存算一體單芯片算力可能高達(dá)1POPs | CCF-GAIR 2020

沉寂近30年后火了!存內(nèi)計算如何打破AI算力瓶頸?

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說