0
英特爾本周召開了年度Intel Vision大會,大部分人會首先被比英偉達H100訓練性能高70%,推理性能高50%,能效高40%,擁有TCO(總體擁有成本)的Gaudi 3吸引。
英特爾CEO帕特·基辛格發(fā)布Gaudi 3的時候也開心地跟隨現(xiàn)場伴奏搖晃起身體。
相比之下,Intel Vision上英特爾宣布將創(chuàng)建一個開放平臺助力企業(yè)推動AI創(chuàng)新很容易被忽略。
但這才是英特爾在生成式AI時代分走蛋糕最有效的利器,只有擁有開放且繁榮的生態(tài),至強6、Gaudi3、酷睿Ultra、英特爾AI網(wǎng)絡連接卡才更容易備受青睞。
為什么開放生態(tài)是利器?
所有人都在說CUDA生態(tài)才是英偉達在AI領域里最強的護城河,這是英偉達耗費近20年建立的龐大生態(tài)。
可是現(xiàn)在大多數(shù)程序員都在AI框架級別或者更高級別進行編程,使用CUDA進行低級編程已經(jīng)不那么普遍。
這就意味著,英偉達的軟件生態(tài)護城河已經(jīng)不像原來那樣堅不可摧。開放生態(tài)是一個追趕甚至超越英偉達的機會。
“傳統(tǒng)模式中,幾家領導公司組建一個開放聯(lián)盟,各自有明確的分工,那時更多是一個選擇問題?!庇⑻貭柟靖笨偛?、英特爾中國軟件和先進技術(shù)事業(yè)部總經(jīng)理李映說,“這一次基于AI大模型的變化,是第一次出現(xiàn)開放、開源和整個行業(yè)或者說和技術(shù)創(chuàng)新的爆發(fā)點結(jié)合在一起?,F(xiàn)在開放、開源和閉源同時出現(xiàn)的時候,不是選擇,而是自然演變、發(fā)展的過程?!?/strong>
開放、開源的生態(tài),將會對AI未來發(fā)展起到非常重要作用的趨勢已經(jīng)非常明顯。
這也讓所有人看到,區(qū)別于以往一個開放平臺或者聯(lián)盟成立的時候只有幾家聯(lián)盟成員,英特爾聯(lián)合Anyscale、Articul8、DataStax、Domino、Hugging Face、KX Systems、MariaDB、MinIO、Qdrant、RedHat、Redis、SAP、VMware、Yellowbrick和Zilliz共同宣布,將創(chuàng)建的開放平臺宣布之時就有大量聯(lián)盟成員。
英特爾院士、大數(shù)據(jù)技術(shù)全球首席技術(shù)官、大數(shù)據(jù)分析和人工智能創(chuàng)新院院長戴金權(quán)指出,“一個開放的生態(tài),可以讓同一個生態(tài)系統(tǒng)中的創(chuàng)新相互促進。并且在同一生態(tài)里的新應用場景可以互通?!?/p>
英特爾要構(gòu)建一個什么樣的AI開放生態(tài)?Intel Vision上基辛格給出的答案是企業(yè)AI。
根據(jù)cnvrg.io的調(diào)研結(jié)果,2023年,有10%的企業(yè)成功將其生成式AI項目產(chǎn)品化。Gartner預計,2026年80%的企業(yè)將使用生成式AI。
這樣看來企業(yè)AI是一個確定性很高且潛力巨大的市場。
為企業(yè)AI構(gòu)建開放的生態(tài),需要包含三個方面:開放的軟件堆棧、開放的平臺、英特爾開發(fā)者云平臺。這也是一層層突破英偉達強大的AI生態(tài)壁壘。
“我們推出的開放聯(lián)盟去搭建面向企業(yè)AI的開放平臺,能夠真正的幫助各個不同的RAG(檢索增強生成)組件中實現(xiàn)互聯(lián)互通,能夠?qū)崿F(xiàn)共同的努力,去構(gòu)建架構(gòu)藍圖這種的,保證在企業(yè)AI當中,有一個整體的可工作的框架?!崩钣惩瑫r表示,
“英特爾開發(fā)者云平臺不僅能幫助開發(fā)者最早接觸到英特爾最新的硬件,更重要的是能夠保證各種開源框架、組件在一個環(huán)境中,能夠保證這種框架之間的兼容性,開發(fā)者能夠擁有更好的用戶體驗,提升開發(fā)效率。”
RAG對于企業(yè)AI來說至關重要。因為目前AI模型比較通用,企業(yè)的數(shù)據(jù)與這些AI模型不太相關,把企業(yè)的隱私數(shù)據(jù)和通用的模型結(jié)合在一起就變成了一個很大的挑戰(zhàn)。
“很多人都非常堅定RAG可以解決企業(yè)的數(shù)據(jù)知識增強的問題。因為有一個開放的生態(tài)系統(tǒng),有一個類似的實施標準的平臺,就很容易把數(shù)據(jù)中心級別的RAG系統(tǒng)運行在企業(yè)的AIPC上,可以變成一個個人知識庫。”戴金權(quán)說。
英特爾公司市場營銷集團副總裁、中國區(qū)云與行業(yè)解決方案部總經(jīng)理梁雅莉就說,對于企業(yè)AI而言,開放、易部署、可擴展、可靠非常重要。
英特爾AI的最新全景圖
構(gòu)建開放、繁榮的AI生態(tài),是英特爾分走AI蛋糕,需要與眾多生態(tài)合作伙伴一起努力的方向。
藏開英特爾企業(yè)AI生態(tài)之下的,就是英特爾完整的AI生態(tài)全景圖,包含了至強6、Gaudi3、酷睿Ultra、英特爾AI網(wǎng)絡連接卡在內(nèi)的一系列硬件及oneAPI等軟件產(chǎn)品。
Intel Vision上英特爾展示的硬實力,最受關注是Gaudi3,直接看數(shù)據(jù),相比上一代Gaudi 2,Gaudi 3在BF16精度下可提供4倍的AI計算能力、1.5倍的內(nèi)存帶寬、2倍的網(wǎng)絡帶寬,支持大規(guī)模系統(tǒng)橫向擴展,最多可擴展至8192個芯片的參考架構(gòu)。
對比英偉達H100,訓練Llama 7B、13B以及GPT-3 175B模型,Gaudi3速度比H100快40%~70%。
推理Llama 7B、70B以及Falcon 180B模型,速度比H100快50%,能效提高40%,在較長輸入和輸出序列上的推理性能優(yōu)勢更大。比H200也有30%的速度優(yōu)勢。
相比英偉達的GPU,英特爾Gaudi提出了TCO的優(yōu)勢,這是Gaudi3打動客戶的重要特性。
除了專用的AI加速器,英特爾的另一個殺手锏是至強處理器。
去年生成式AI更關注模型的訓練,對成本和功耗沒那么重視,企業(yè)都希望訓練一個自己的通用大模型。
“今年企業(yè)的關注重點轉(zhuǎn)到了推理。對企業(yè)來說,大模型訓練出來是需要推理變現(xiàn)且能夠盈利?!?/strong>英特爾公司市場營銷集團副總裁、中國區(qū)數(shù)據(jù)中心銷售總經(jīng)理、中國區(qū)運營商銷售總經(jīng)理莊秉翰說,“目前的利潤大多基于通用數(shù)據(jù)中心的應用,尤其是現(xiàn)在CPU的迭代非常迅速,每一代CPU又會帶來新的性能提升和能耗減少?!?/p> 英特爾為面向數(shù)據(jù)中心、云和邊緣的下一代處理器進行了品牌煥新,即英特爾至強6。 “至強6全新的簡潔品牌則是一個產(chǎn)品組合,可以解決數(shù)據(jù)中心在性能、功耗,以及多元工作負載等方面的各種問題?!鼻f秉翰介紹,配備能效核(E-cores)的英特爾至強6處理器將于2024年第二季度推出,提供卓越的效率,配備性能核(P-cores)的英特爾至強6處理器將緊隨其后推出,帶來更高的AI性能。 能效核的英特爾至強6處理器(代號為Sierra Forest),與第二代英特爾至強處理器相比,每瓦性能提高2.4倍,機架密度提高2.7倍??蛻裟芤越?:1的比例替換舊系統(tǒng),大幅降低能耗,實現(xiàn)可持續(xù)發(fā)展目標。 性能核的英特爾至強6處理器(代號為Granite Rapids),包含了對MXFP4數(shù)據(jù)格式的軟件支持,與使用FP16的第四代英特爾至強處理器相比,可將下一個令牌(token)的延遲時間最多縮短6.5倍,能夠運行700億參數(shù)的Llama-2模型。 雷峰網(wǎng)(公眾號:雷峰網(wǎng))了解到,對于130億參數(shù)以下的大模型,英特爾至強CPU都能滿足。 “對企業(yè)來說,大模型也處在初始階段,不需要立即部署一個很大的GPU集群,這對于運維和開發(fā)來說都是很大的挑戰(zhàn)。如果采用逐步部署生成式AI的節(jié)奏,可以通過CPU先做一些應用部署。”莊秉翰指出。 在邊緣端,英特爾發(fā)布了涵蓋英特爾酷睿Ultra、英特爾酷睿、英特爾凌動處理器和英特爾銳炫顯卡系列產(chǎn)品在內(nèi)的全新邊緣芯片,主要面向零售、工業(yè)制造和醫(yī)療等關鍵領域。英特爾邊緣AI產(chǎn)品組合內(nèi)的所有新品將于本季度上市,并將在今年年內(nèi)獲得英特爾Tiber邊緣平臺的支持。 在客戶端的AI PC,英特爾展示了即將推出的產(chǎn)品。包括將于2024年推出的下一代英特爾酷睿Ultra客戶端處理器家族(代號Lunar Lake),將具備超過100 TOPS平臺算力,其中神經(jīng)網(wǎng)絡處理單元(NPU)將有超過46 TOPS的算力。 在AI全景圖里,還有互聯(lián)產(chǎn)品。 英特爾中國網(wǎng)絡與邊緣事業(yè)部首席技術(shù)官、英特爾高級首席AI工程師張宇說,“現(xiàn)在的AI系統(tǒng)還是采用馮諾依曼的架構(gòu),這個系統(tǒng)不僅要看它的算能,還要看它數(shù)據(jù)傳輸?shù)哪芰??!?/p> 通過超以太網(wǎng)聯(lián)盟(UEC),英特爾正在驅(qū)動面向AI高速互聯(lián)技術(shù)(AI Fabrics)的開放式以太網(wǎng)網(wǎng)絡創(chuàng)新,并推出一系列針對AI優(yōu)化的以太網(wǎng)解決方案。 英特爾的產(chǎn)品組合包括英特爾AI網(wǎng)絡連接卡(AI NIC)、集成到XPU的AI連接芯粒、基于Gaudi加速器的系統(tǒng),以及一系列面向英特爾代工的AI互聯(lián)軟硬件參考設計。 從客戶端到邊緣端再到云端的推理和訓練,再加上網(wǎng)絡和軟件,英特爾展示了最新的AI全景圖,最重要的是英特爾宣布組建開放的企業(yè)AI生態(tài),這才是英特爾能用強大的硬件在AI市場分到蛋糕的關鍵。 并且,英特爾在生成式AI從訓練轉(zhuǎn)向推理的關鍵節(jié)點,選擇企業(yè)AI這一對生成式AI更有付費能力的市場構(gòu)建開放生態(tài),在恰當?shù)臅r間點選擇了正確的戰(zhàn)略。 接下來就是英特爾的執(zhí)行力以及生成式AI能否幫助企業(yè)盈利的問題。雷峰網(wǎng) 雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。