開放生態(tài)才是英特爾切走生成式AI蛋糕的利器

本文作者：包永剛

2024-04-11 18:53

導語：推理才是生成式AI變現(xiàn)的關鍵，誰能分走最大的蛋糕？

英特爾本周召開了年度Intel Vision大會，大部分人會首先被比英偉達H100訓練性能高70%，推理性能高50%，能效高40%，擁有TCO（總體擁有成本）的Gaudi 3吸引。

英特爾CEO帕特·基辛格發(fā)布Gaudi 3的時候也開心地跟隨現(xiàn)場伴奏搖晃起身體。

相比之下，Intel Vision上英特爾宣布將創(chuàng)建一個開放平臺助力企業(yè)推動AI創(chuàng)新很容易被忽略。

但這才是英特爾在生成式AI時代分走蛋糕最有效的利器，只有擁有開放且繁榮的生態(tài)，至強6、Gaudi3、酷睿Ultra、英特爾AI網(wǎng)絡連接卡才更容易備受青睞。

為什么開放生態(tài)是利器？

所有人都在說CUDA生態(tài)才是英偉達在AI領域里最強的護城河，這是英偉達耗費近20年建立的龐大生態(tài)。

可是現(xiàn)在大多數(shù)程序員都在AI框架級別或者更高級別進行編程，使用CUDA進行低級編程已經(jīng)不那么普遍。

這就意味著，英偉達的軟件生態(tài)護城河已經(jīng)不像原來那樣堅不可摧。開放生態(tài)是一個追趕甚至超越英偉達的機會。

“傳統(tǒng)模式中，幾家領導公司組建一個開放聯(lián)盟，各自有明確的分工，那時更多是一個選擇問題?！庇⑻貭柟靖笨偛?、英特爾中國軟件和先進技術(shù)事業(yè)部總經(jīng)理李映說，“這一次基于AI大模型的變化，是第一次出現(xiàn)開放、開源和整個行業(yè)或者說和技術(shù)創(chuàng)新的爆發(fā)點結(jié)合在一起?，F(xiàn)在開放、開源和閉源同時出現(xiàn)的時候，不是選擇，而是自然演變、發(fā)展的過程?！?/strong>

開放、開源的生態(tài)，將會對AI未來發(fā)展起到非常重要作用的趨勢已經(jīng)非常明顯。

這也讓所有人看到，區(qū)別于以往一個開放平臺或者聯(lián)盟成立的時候只有幾家聯(lián)盟成員，英特爾聯(lián)合Anyscale、Articul8、DataStax、Domino、Hugging Face、KX Systems、MariaDB、MinIO、Qdrant、RedHat、Redis、SAP、VMware、Yellowbrick和Zilliz共同宣布，將創(chuàng)建的開放平臺宣布之時就有大量聯(lián)盟成員。

英特爾院士、大數(shù)據(jù)技術(shù)全球首席技術(shù)官、大數(shù)據(jù)分析和人工智能創(chuàng)新院院長戴金權(quán)指出，“一個開放的生態(tài)，可以讓同一個生態(tài)系統(tǒng)中的創(chuàng)新相互促進。并且在同一生態(tài)里的新應用場景可以互通?！?/p>

英特爾要構(gòu)建一個什么樣的AI開放生態(tài)？Intel Vision上基辛格給出的答案是企業(yè)AI。

根據(jù)cnvrg.io的調(diào)研結(jié)果，2023年，有10%的企業(yè)成功將其生成式AI項目產(chǎn)品化。Gartner預計，2026年80%的企業(yè)將使用生成式AI。

這樣看來企業(yè)AI是一個確定性很高且潛力巨大的市場。

為企業(yè)AI構(gòu)建開放的生態(tài)，需要包含三個方面：開放的軟件堆棧、開放的平臺、英特爾開發(fā)者云平臺。這也是一層層突破英偉達強大的AI生態(tài)壁壘。

“我們推出的開放聯(lián)盟去搭建面向企業(yè)AI的開放平臺，能夠真正的幫助各個不同的RAG（檢索增強生成）組件中實現(xiàn)互聯(lián)互通，能夠?qū)崿F(xiàn)共同的努力，去構(gòu)建架構(gòu)藍圖這種的，保證在企業(yè)AI當中，有一個整體的可工作的框架?！崩钣惩瑫r表示，

“英特爾開發(fā)者云平臺不僅能幫助開發(fā)者最早接觸到英特爾最新的硬件，更重要的是能夠保證各種開源框架、組件在一個環(huán)境中，能夠保證這種框架之間的兼容性，開發(fā)者能夠擁有更好的用戶體驗，提升開發(fā)效率。”

RAG對于企業(yè)AI來說至關重要。因為目前AI模型比較通用，企業(yè)的數(shù)據(jù)與這些AI模型不太相關，把企業(yè)的隱私數(shù)據(jù)和通用的模型結(jié)合在一起就變成了一個很大的挑戰(zhàn)。

“很多人都非常堅定RAG可以解決企業(yè)的數(shù)據(jù)知識增強的問題。因為有一個開放的生態(tài)系統(tǒng)，有一個類似的實施標準的平臺，就很容易把數(shù)據(jù)中心級別的RAG系統(tǒng)運行在企業(yè)的AIPC上，可以變成一個個人知識庫。”戴金權(quán)說。

英特爾公司市場營銷集團副總裁、中國區(qū)云與行業(yè)解決方案部總經(jīng)理梁雅莉就說，對于企業(yè)AI而言，開放、易部署、可擴展、可靠非常重要。

英特爾AI的最新全景圖

構(gòu)建開放、繁榮的AI生態(tài)，是英特爾分走AI蛋糕，需要與眾多生態(tài)合作伙伴一起努力的方向。

藏開英特爾企業(yè)AI生態(tài)之下的，就是英特爾完整的AI生態(tài)全景圖，包含了至強6、Gaudi3、酷睿Ultra、英特爾AI網(wǎng)絡連接卡在內(nèi)的一系列硬件及oneAPI等軟件產(chǎn)品。

Intel Vision上英特爾展示的硬實力，最受關注是Gaudi3，直接看數(shù)據(jù)，相比上一代Gaudi 2，Gaudi 3在BF16精度下可提供4倍的AI計算能力、1.5倍的內(nèi)存帶寬、2倍的網(wǎng)絡帶寬，支持大規(guī)模系統(tǒng)橫向擴展，最多可擴展至8192個芯片的參考架構(gòu)。

對比英偉達H100，訓練Llama 7B、13B以及GPT-3 175B模型，Gaudi3速度比H100快40%~70%。

推理Llama 7B、70B以及Falcon 180B模型，速度比H100快50%，能效提高40%，在較長輸入和輸出序列上的推理性能優(yōu)勢更大。比H200也有30%的速度優(yōu)勢。

相比英偉達的GPU，英特爾Gaudi提出了TCO的優(yōu)勢，這是Gaudi3打動客戶的重要特性。

除了專用的AI加速器，英特爾的另一個殺手锏是至強處理器。

去年生成式AI更關注模型的訓練，對成本和功耗沒那么重視，企業(yè)都希望訓練一個自己的通用大模型。

“今年企業(yè)的關注重點轉(zhuǎn)到了推理。對企業(yè)來說，大模型訓練出來是需要推理變現(xiàn)且能夠盈利?！?/strong>英特爾公司市場營銷集團副總裁、中國區(qū)數(shù)據(jù)中心銷售總經(jīng)理、中國區(qū)運營商銷售總經(jīng)理莊秉翰說，“目前的利潤大多基于通用數(shù)據(jù)中心的應用，尤其是現(xiàn)在CPU的迭代非常迅速，每一代CPU又會帶來新的性能提升和能耗減少?！?/p>

英特爾為面向數(shù)據(jù)中心、云和邊緣的下一代處理器進行了品牌煥新，即英特爾至強6。

“至強6全新的簡潔品牌則是一個產(chǎn)品組合，可以解決數(shù)據(jù)中心在性能、功耗，以及多元工作負載等方面的各種問題?！鼻f秉翰介紹，配備能效核（E-cores）的英特爾至強6處理器將于2024年第二季度推出，提供卓越的效率，配備性能核（P-cores）的英特爾至強6處理器將緊隨其后推出，帶來更高的AI性能。

能效核的英特爾至強6處理器（代號為Sierra Forest），與第二代英特爾至強處理器相比，每瓦性能提高2.4倍，機架密度提高2.7倍?？蛻裟芤越?:1的比例替換舊系統(tǒng)，大幅降低能耗，實現(xiàn)可持續(xù)發(fā)展目標。

性能核的英特爾至強6處理器（代號為Granite Rapids），包含了對MXFP4數(shù)據(jù)格式的軟件支持，與使用FP16的第四代英特爾至強處理器相比，可將下一個令牌（token）的延遲時間最多縮短6.5倍，能夠運行700億參數(shù)的Llama-2模型。

雷峰網(wǎng)(公眾號：雷峰網(wǎng))了解到，對于130億參數(shù)以下的大模型，英特爾至強CPU都能滿足。

“對企業(yè)來說，大模型也處在初始階段，不需要立即部署一個很大的GPU集群，這對于運維和開發(fā)來說都是很大的挑戰(zhàn)。如果采用逐步部署生成式AI的節(jié)奏，可以通過CPU先做一些應用部署。”莊秉翰指出。

在邊緣端，英特爾發(fā)布了涵蓋英特爾酷睿Ultra、英特爾酷睿、英特爾凌動處理器和英特爾銳炫顯卡系列產(chǎn)品在內(nèi)的全新邊緣芯片，主要面向零售、工業(yè)制造和醫(yī)療等關鍵領域。英特爾邊緣AI產(chǎn)品組合內(nèi)的所有新品將于本季度上市，并將在今年年內(nèi)獲得英特爾Tiber邊緣平臺的支持。

在客戶端的AI PC，英特爾展示了即將推出的產(chǎn)品。包括將于2024年推出的下一代英特爾酷睿Ultra客戶端處理器家族（代號Lunar Lake），將具備超過100 TOPS平臺算力，其中神經(jīng)網(wǎng)絡處理單元（NPU）將有超過46 TOPS的算力。

在AI全景圖里，還有互聯(lián)產(chǎn)品。

英特爾中國網(wǎng)絡與邊緣事業(yè)部首席技術(shù)官、英特爾高級首席AI工程師張宇說，“現(xiàn)在的AI系統(tǒng)還是采用馮諾依曼的架構(gòu)，這個系統(tǒng)不僅要看它的算能，還要看它數(shù)據(jù)傳輸?shù)哪芰??！?/p>

通過超以太網(wǎng)聯(lián)盟（UEC），英特爾正在驅(qū)動面向AI高速互聯(lián)技術(shù)（AI Fabrics）的開放式以太網(wǎng)網(wǎng)絡創(chuàng)新，并推出一系列針對AI優(yōu)化的以太網(wǎng)解決方案。

英特爾的產(chǎn)品組合包括英特爾AI網(wǎng)絡連接卡（AI NIC）、集成到XPU的AI連接芯粒、基于Gaudi加速器的系統(tǒng)，以及一系列面向英特爾代工的AI互聯(lián)軟硬件參考設計。

從客戶端到邊緣端再到云端的推理和訓練，再加上網(wǎng)絡和軟件，英特爾展示了最新的AI全景圖，最重要的是英特爾宣布組建開放的企業(yè)AI生態(tài)，這才是英特爾能用強大的硬件在AI市場分到蛋糕的關鍵。

并且，英特爾在生成式AI從訓練轉(zhuǎn)向推理的關鍵節(jié)點，選擇企業(yè)AI這一對生成式AI更有付費能力的市場構(gòu)建開放生態(tài)，在恰當?shù)臅r間點選擇了正確的戰(zhàn)略。

接下來就是英特爾的執(zhí)行力以及生成式AI能否幫助企業(yè)盈利的問題。雷峰網(wǎng)

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

分享：

相關文章

Intel Vision gaudi3 算力至強6 酷睿ultra

英特爾和螞蟻鏈深化合作推出面向大規(guī)模數(shù)據(jù)保護的可 ...

英特爾新任CEO重磅宣布！提供新代工服務，7nm小芯片 ...

算力存力Buff都疊滿，至強6最強形態(tài)現(xiàn)身！

算力存力Buff都疊滿，至強6最強形態(tài)現(xiàn)身！

包永剛

編輯

發(fā)私信

當月熱門文章

部署 AI，到底選云還是高性價比一體機？

摩爾線程、沐曦完成上市輔導，國產(chǎn)AI芯片進入決賽階段

獨家｜溫強接任聯(lián)想芯片團隊技術(shù)負責人

最新文章

算力產(chǎn)業(yè)情報大覽：大廠算力項目驗收存在「潛規(guī)則」；明星AI公司大量囤卡后賣卡回血；萬卡集群項目「爛尾」；

摩爾線程、沐曦完成上市輔導，國產(chǎn)AI芯片進入決賽階段

「隱疾」叢生的算力租賃：欺詐套利、資本炒作、主體脫鉤

65%央企AI創(chuàng)新首選，百度智能云如何讓智能「涌現(xiàn)」？

部署 AI，到底選云還是高性價比一體機？

Arm將在2025年達成的兩大出貨量占比成就：服務器50%、PC平板40%

熱門搜索

高通智能手機 Windows iPhone 5S iPhone 4S 搜索量子計算大眾出海 ?？?/a> 無人車