0
本文作者: 劉偉 | 2017-05-11 15:57 |
雷鋒網(wǎng)按:上個(gè)月谷歌公布了關(guān)于TPU細(xì)節(jié)的論文,稱(chēng)“TPU處理速度比當(dāng)前 GPU 和 CPU 要快 15 到 30 倍”,引發(fā)科技圈熱議。Nvidia CEO黃仁勛更是親自撰文回?fù)?,并貼出Tesla P40 GPU 與 TPU 的性能對(duì)比圖,大有針尖對(duì)麥芒之勢(shì)。而在昨天的GTC大會(huì)上,Nvidia又發(fā)布了新一代GPU Tesla V100。這場(chǎng)ASIC 與GPU之爭(zhēng)愈發(fā)的好看了!
人工智能和機(jī)器學(xué)習(xí)對(duì)Google的重要性已經(jīng)不言而喻,為了在人工智能時(shí)代搶占先機(jī),這位科技巨人已經(jīng)開(kāi)始研發(fā)和制造自己的芯片。在去年的年度開(kāi)發(fā)者大會(huì)上,谷歌對(duì)外宣布了針對(duì)其特殊AI算法進(jìn)行了優(yōu)化的TPU芯片。據(jù)雷鋒網(wǎng)了解,如今已有數(shù)十種類(lèi)似的定制化AI芯片陸續(xù)問(wèn)世。這讓近年來(lái)在深度學(xué)習(xí)領(lǐng)域享有支配性地位的芯片供應(yīng)商N(yùn)vidia倍感壓力。
為了做出反擊,Nvidia也開(kāi)始加強(qiáng)其新推的GPU芯片的定制化和專(zhuān)業(yè)性。
在周三舉行的GTC大會(huì)上,Nvidia發(fā)布了基于其下一代圖形架構(gòu)Volta的,針對(duì)服務(wù)器市場(chǎng)的GPU新品 Tesla V100。該芯片擁有超過(guò)210億個(gè)晶體管和5,120個(gè)計(jì)算機(jī)內(nèi)核。但是對(duì)于AI來(lái)說(shuō),最重要的是,特斯拉V100配備了640個(gè)Tensor內(nèi)核,它們是專(zhuān)為運(yùn)行深入學(xué)習(xí)網(wǎng)絡(luò)中使用的數(shù)學(xué)運(yùn)算而設(shè)計(jì)的。據(jù)官方介紹,這些Tensor內(nèi)核為T(mén)esla V100提供了高達(dá)120 teraflops的、驚人的深度學(xué)習(xí)能力。
雷鋒網(wǎng)了解到,相比前代的Pascal架構(gòu),新芯片將深度學(xué)習(xí)訓(xùn)練速度提升了12倍,深度學(xué)習(xí)推理速度也提升了6倍。新架構(gòu)在運(yùn)行深度學(xué)習(xí)應(yīng)用方面的性能,相當(dāng)于100個(gè)中央處理器(比如Intel的中央處理器)。
為了使深度學(xué)習(xí)應(yīng)用在其硬件上更加高效的運(yùn)行,Nvidia提供了很多軟件工具。它發(fā)布了一款針對(duì)深度學(xué)習(xí)框架TensorFlow和Caffe的編譯器——TensorRT,用于改進(jìn)推理性能。Nvidia表示,Tesla V100的推理性能要比英特爾的Skylake CPU架構(gòu)快15到25倍。
雖然Nvidia正努力讓其芯片更加適合深度學(xué)習(xí),但它的競(jìng)爭(zhēng)對(duì)手卻可能會(huì)指出,Nvidia的最大缺陷在于,其GPU往往必須支持圖形生成功能。GPU之所被設(shè)計(jì)出來(lái),就是用于圖形生成的。由于必須支持圖形生成功能,GPU芯片增加了大量體積,這就意味著它在一定程度上要比專(zhuān)用芯片更加低效。
Google在最近的一篇博客中聲稱(chēng),其TPU在推理性能上要比現(xiàn)代GPU和CPU快15-30倍,同時(shí)功耗還要低30-80倍。(Nvidia對(duì)此反駁道,谷歌是在拿TPU和舊的GPU進(jìn)行比較。)事實(shí)上,這種對(duì)比并不完全公平。GPU是通用型芯片,可執(zhí)行繪圖運(yùn)算工作,用途多元。TPU則屬于ASIC,也就是專(zhuān)為特定用途設(shè)計(jì)的特殊規(guī)格邏輯IC,由于只執(zhí)行單一工作,速度更快也在情理之中。TPU和GPU之間除了性能較量,更多代表的是ASIC和通用型芯片這兩種設(shè)計(jì)思路間的博弈。
除了Nvidia和谷歌,另一大芯片巨頭Intel也加入了這場(chǎng)博弈。不久前,Intel以超過(guò)4億美元的價(jià)格收購(gòu)了AI芯片初創(chuàng)企業(yè)Nervana,并聲稱(chēng)將在2020年之前將深度學(xué)習(xí)訓(xùn)練速度提升100倍。
Nvidia表示,Tesla V100是它在深度學(xué)習(xí)領(lǐng)域更加專(zhuān)業(yè)化,并能夠與這些定制化芯片競(jìng)爭(zhēng)的有力證據(jù)。Nvidia GPU工程部高級(jí)副總裁Jonah Alben在談到芯片競(jìng)賽時(shí)說(shuō)道:“當(dāng)你考慮到構(gòu)成一款用于深度學(xué)習(xí)訓(xùn)練的優(yōu)秀芯片的所有要素時(shí),你會(huì)發(fā)現(xiàn)帶寬、輸入/輸出和數(shù)學(xué)運(yùn)算能力都很重要。而在所有的這些方面,我們都是專(zhuān)家。只要我們都用相同的油漆刷作畫(huà),就知道到底誰(shuí)更強(qiáng)了?!?/p>
雷鋒網(wǎng)認(rèn)為,盡管谷歌在定制化AI芯片領(lǐng)域走在了最前列,但Nvidia仍將在未來(lái)很多年里保持競(jìng)爭(zhēng)力。Gartner的分析師馬克·洪(Mark Hung)說(shuō)道,“目前為止,沒(méi)有任何一款A(yù)I芯片實(shí)現(xiàn)了大規(guī)模出貨。盡管對(duì)Nvidia來(lái)說(shuō),潛在的危險(xiǎn)始終存在,但在這些公司大規(guī)模出貨AI芯片前,并不會(huì)對(duì)Nvidia造成真正的威脅?!?/p>
這些即將到來(lái)的AI芯片與Nvidia之間的明爭(zhēng)暗斗表明了一點(diǎn),深度學(xué)習(xí)計(jì)算對(duì)更強(qiáng)計(jì)算能力的需求日益旺盛。幾年前GPU迎來(lái)大爆發(fā),正是因?yàn)樗鼘⑸疃葘W(xué)習(xí)網(wǎng)絡(luò)的訓(xùn)練時(shí)間從幾個(gè)月縮短到了幾天。早在20世紀(jì)50年代就已經(jīng)誕生的深度學(xué)習(xí),由于有強(qiáng)大的計(jì)算能力作為后盾,此刻終于爆發(fā)出了它的潛能。但是隨著越來(lái)越多企業(yè)試圖將深度學(xué)習(xí)融入它們的產(chǎn)品和服務(wù),對(duì)更快的芯片的需求將沒(méi)有止境。
Alben說(shuō)道:“以我所見(jiàn),人類(lèi)需要無(wú)限量的深度計(jì)算能力。越接近無(wú)限越好。”
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。