0
| 本文作者: 劉伊倫 | 2025-11-20 14:19 |
“求寒武紀(jì)原廠銷售資源!”、“找做沐曦的朋友,有個(gè)項(xiàng)目急詢報(bào)價(jià)!”
算力市場(chǎng)的風(fēng)向,正悄然生變:沒等來英偉達(dá)B200的火爆行情,反倒見證了國(guó)產(chǎn)算力的逐漸崛起。
“今年公司一定會(huì)落地國(guó)產(chǎn)算力項(xiàng)目,目前正在與一家已過會(huì)的國(guó)產(chǎn)芯片企業(yè)深度洽談。” 頭部算力租賃公司項(xiàng)目負(fù)責(zé)人林海的話,道出了行業(yè)內(nèi)的普遍共識(shí)。
據(jù)雷峰網(wǎng)了解,這一行業(yè)共識(shí)已在頭部企業(yè)落地生根:某頭部互聯(lián)網(wǎng)廠商已經(jīng)完成全系列國(guó)產(chǎn)芯片適配測(cè)試,并規(guī)劃將部分業(yè)務(wù)場(chǎng)景切換至國(guó)產(chǎn)方案。這樣的動(dòng)作并非個(gè)例,而是各大廠商基于供應(yīng)鏈安全與業(yè)務(wù)發(fā)展需求,形成的集體選擇。
市場(chǎng)端的迫切需求與企業(yè)層面的主動(dòng)布局相互呼應(yīng),資本端也在迅速跟進(jìn)。雷峰網(wǎng)了解到,國(guó)內(nèi)唯一專注于集成電路產(chǎn)業(yè)的融資租賃公司,正在推進(jìn)一個(gè)國(guó)產(chǎn)算力項(xiàng)目的放款。更多國(guó)產(chǎn)項(xiàng)目落地信息,歡迎添加作者微信 YONGGANLL6662 互通有無。
金融機(jī)構(gòu)對(duì)回報(bào)的測(cè)算向來苛刻,而這筆資金的注入,恰恰印證了在政策補(bǔ)貼的加持下,國(guó)產(chǎn)算力已具備商業(yè)化可行性。
據(jù)公開資料顯示,國(guó)產(chǎn)算力項(xiàng)目商業(yè)化進(jìn)程正在加速:科大訊飛與華為聯(lián)合打造的國(guó)產(chǎn)算力集群,在MoE模型訓(xùn)練上實(shí)現(xiàn)93%的效率;寒武紀(jì)MLU系列芯片邁入三大運(yùn)營(yíng)商的算力資源池;中科院部署了4096張沐曦算力卡,共計(jì)984P算力;螞蟻集團(tuán)已部署萬卡規(guī)模的國(guó)產(chǎn)算力集群,訓(xùn)練任務(wù)穩(wěn)定性超過98%。
商業(yè)化的扎實(shí)進(jìn)展、國(guó)產(chǎn)替代的高度共識(shí),正推動(dòng)一二級(jí)市場(chǎng)對(duì)國(guó)產(chǎn)算力賽道的熱情全面釋放。
2025年7月,曦望宣布完成近10億元人民幣的Pre-A輪融資,昉擎科技宣布完成總計(jì)數(shù)億元人民幣的天使輪融資;10月,AI算力芯片創(chuàng)業(yè)公司玉盤完成天使輪融資,投資方為源本基金。摩爾線程、沐曦已進(jìn)入IPO最終決賽圈,一級(jí)市場(chǎng)又涌現(xiàn)出哪些新的優(yōu)質(zhì)標(biāo)的?歡迎添加作者微信 YONGGANLL6662 交流更多信息。
二級(jí)市場(chǎng)更顯火爆,算力及半導(dǎo)體板塊成為領(lǐng)漲主線,中證半導(dǎo)體產(chǎn)業(yè)指數(shù)近三個(gè)月上漲42.48%,寒武紀(jì)、海光信息等核心企業(yè)股價(jià)年內(nèi)實(shí)現(xiàn)翻倍,半導(dǎo)體設(shè)備、國(guó)產(chǎn)芯片ETF頻繁異動(dòng)拉升。
外資機(jī)構(gòu)也敏銳捕捉到這一市場(chǎng)信號(hào)。據(jù)雷峰網(wǎng)了解,多家外資機(jī)構(gòu)正加速入場(chǎng)調(diào)研國(guó)內(nèi)算力產(chǎn)業(yè),國(guó)產(chǎn)芯片正是其布局核心。
這一趨勢(shì)已直接傳導(dǎo)至市場(chǎng)交易端,與國(guó)產(chǎn)算力的替代浪潮形成鮮明對(duì)比的是,曾經(jīng)炙手可熱的英偉達(dá)設(shè)備,已難現(xiàn)往日火爆行情。
“純靠倒貨賺差價(jià)?現(xiàn)在這行情還不如把錢存銀行穩(wěn)當(dāng)?!?服務(wù)器經(jīng)銷商張翔的話道出行業(yè)現(xiàn)狀,“2023年,一臺(tái)A100轉(zhuǎn)手就能賺十萬,現(xiàn)在除非你是一手貨主,不然賣一張4090也就賺200塊錢?!?/p>
微薄利潤(rùn)讓不少跟風(fēng)涌入的從業(yè)者鎩羽而歸?!皼]人覺得做英偉達(dá)設(shè)備貿(mào)易還有盼頭,要么轉(zhuǎn)頭銷售國(guó)產(chǎn)算力,要么回歸老本行,很多從通信行業(yè)下場(chǎng)的人,已經(jīng)重新回去賣帶寬了?!?張翔補(bǔ)充道。
更讓人頭疼的是交易中的信任危機(jī):定金詐騙、期貨違約屢見不鮮,海外供應(yīng)商潛逃導(dǎo)致維權(quán)無門的案例不在少數(shù),甚至出現(xiàn)“交款后保管對(duì)方網(wǎng)銀及U盾”的極端信任方式。當(dāng)曾經(jīng)的“香餑餑”變成高風(fēng)險(xiǎn)、低回報(bào)的“燙手山芋”,市場(chǎng)目光已轉(zhuǎn)向更具穩(wěn)定性與發(fā)展?jié)摿Φ膰?guó)產(chǎn)算力賽道。
此前,國(guó)產(chǎn)芯片一直面臨諸多質(zhì)疑。如今,政策支持、技術(shù)迭代與市場(chǎng)需求如何形成合力,讓國(guó)產(chǎn)芯片正一步步成為“可選項(xiàng)”?未來的算力江湖,又將迎來怎樣的格局重塑?
最高補(bǔ)貼達(dá)80%,國(guó)產(chǎn)算力與英偉達(dá)的「性價(jià)比差距」逐漸彌合
“7月份,我們總部發(fā)布了一份西北地區(qū)算力項(xiàng)目清單的文件,要求各地分支機(jī)構(gòu)對(duì)口援助西北地區(qū)的算力項(xiàng)目?!蹦炒笮徒鹑跈C(jī)構(gòu)算力項(xiàng)目負(fù)責(zé)人表示。
這并非個(gè)例。據(jù)悉,多家大型國(guó)有金融機(jī)構(gòu)或已接到相關(guān)通知,要求對(duì)八大節(jié)點(diǎn)的算力項(xiàng)目開展針對(duì)性幫扶,尤其向國(guó)產(chǎn)算力項(xiàng)目?jī)A斜,不僅提供專項(xiàng)資金,更主動(dòng)降低資金獲取門檻,解決“資金難”的問題。
除了引導(dǎo)社會(huì)資本加碼支持,實(shí)打?qū)嵉难a(bǔ)貼政策,更成為彌合國(guó)產(chǎn)算力性價(jià)比差距、撬動(dòng)市場(chǎng)選擇的關(guān)鍵“杠桿”。
曾經(jīng),國(guó)產(chǎn)算力深陷商業(yè)邏輯的困境:相關(guān)測(cè)算顯示,英偉達(dá)每P算力價(jià)格約12.5萬元,而國(guó)內(nèi)頭部芯片廠商每P算力價(jià)格達(dá)35萬元;更關(guān)鍵的是能耗差距,同等算力需求下,國(guó)產(chǎn)設(shè)備需投入更多臺(tái)數(shù),單臺(tái)能耗也更高,整體能耗是英偉達(dá)的3-5倍。在純市場(chǎng)驅(qū)動(dòng)的情境之下,幾乎沒有理由采購國(guó)產(chǎn)算力設(shè)備。
如今,補(bǔ)貼政策正打破這一僵局:北上深杭等承擔(dān)國(guó)家人工智能發(fā)展任務(wù)的城市,可享受40%的國(guó)家全額補(bǔ)貼,若疊加地方政府的補(bǔ)貼,最高補(bǔ)貼金額可達(dá)項(xiàng)目總投入的70%-80%,此類項(xiàng)目多由“國(guó)家隊(duì)”操盤落地;八大算力節(jié)點(diǎn)城市則是獲得10%-15%的基礎(chǔ)補(bǔ)貼,疊加超長(zhǎng)期國(guó)債與地方補(bǔ)貼后,力度最高可達(dá)40%。
“早在數(shù)月前,我們就接到了發(fā)展國(guó)產(chǎn)算力的文件,國(guó)產(chǎn)化已是明確方向。” 國(guó)產(chǎn)智算中心負(fù)責(zé)人陸柯直言。其負(fù)責(zé)的智算中心以華為昇騰910B芯片做為算力基座,根據(jù)客戶所簽訂的合同時(shí)間以及需求數(shù)量,設(shè)備月租價(jià)格在2-3萬元浮動(dòng),而該中心所在的西部城市,推出市、區(qū)兩級(jí)消納補(bǔ)貼,區(qū)級(jí)補(bǔ)貼50%、市級(jí)補(bǔ)貼 60%。
這意味著,若消納100萬元算力服務(wù),最低實(shí)際僅需支付40萬元,對(duì)需求方而言吸引力十足。
為杜絕套殼騙補(bǔ),各地也明確了消納方資質(zhì)要求:要么是互聯(lián)網(wǎng)大廠等指定主體,要么是在當(dāng)?shù)刈?cè)且形成一定規(guī)模的企業(yè),唯有帶動(dòng)當(dāng)?shù)谿DP增長(zhǎng),繳納稅款的主體才能拿到補(bǔ)貼。
值得注意的是,據(jù)雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))此前首發(fā)報(bào)道,最新“窗口指導(dǎo)”文件明確要求:有補(bǔ)貼等地方力量參與的項(xiàng)目,需全部使用國(guó)產(chǎn)芯片;即便部分項(xiàng)目已開工建設(shè),若當(dāng)前進(jìn)度較低,仍可要求拆除已使用的國(guó)外芯片。
從金融機(jī)構(gòu)的定向幫扶、梯度化的補(bǔ)貼激勵(lì),到“國(guó)產(chǎn)化優(yōu)先”的明確要求,政策端正從資金、市場(chǎng)、規(guī)則多維度發(fā)力,為國(guó)產(chǎn)算力掃清障礙。歡迎添加微信 YONGGANLL6662 交流更多國(guó)產(chǎn)芯片最新政策動(dòng)向。
英偉達(dá)并非推理場(chǎng)景「最優(yōu)解」,國(guó)產(chǎn)方案性價(jià)比更高
政策護(hù)航并非從國(guó)產(chǎn)芯片誕生之初就已經(jīng)制定,而是隨著技術(shù)、產(chǎn)品以及應(yīng)用場(chǎng)景的逐漸成熟,在關(guān)鍵節(jié)點(diǎn)順勢(shì)發(fā)力。
“這次國(guó)產(chǎn)算力熱潮與上一輪周期存在顯著差異?!?并行科技國(guó)產(chǎn)事業(yè)部負(fù)責(zé)人宋志方直言,“五年前的熱潮更多聚焦于資本層面,應(yīng)用場(chǎng)景相對(duì)稀缺,而DeepSeek等模型的落地,讓國(guó)產(chǎn)算力真正進(jìn)入行業(yè)視野,下游需求的爆發(fā)式增長(zhǎng)形成實(shí)質(zhì)性帶動(dòng)。更關(guān)鍵的是,國(guó)產(chǎn)芯片廠商已經(jīng)完成2-3代產(chǎn)品迭代,達(dá)到了可對(duì)標(biāo)英偉達(dá)主流卡水平?!?/strong>
寒武紀(jì)以思元系列構(gòu)建云邊端全棧布局,軟件平臺(tái)Cambricon NeuWare全面兼容最新PyTorch版本和Triton算子開發(fā)語言;沐曦發(fā)布首款全國(guó)產(chǎn)通用GPU曦云C600,推出MXMACA軟件棧技術(shù)體系,單機(jī)16卡即可支持百任務(wù)毫秒響應(yīng);摩爾線程S5000性能追趕業(yè)界領(lǐng)先水準(zhǔn),依托MUSA架構(gòu),實(shí)現(xiàn)第三代產(chǎn)品達(dá)成千億參數(shù)大模型高效訓(xùn)練。
在諸多應(yīng)用場(chǎng)景中,推理需求的爆發(fā)將成為國(guó)產(chǎn)算力最重要的突圍窗口。
外界看來,模型的迭代速度放慢,而殺手級(jí)的應(yīng)用也暫未出現(xiàn),由此判斷算力需求正在階段性停擺。事實(shí)上,以搜索為例,每一次搜索都在產(chǎn)生推理的需求,互聯(lián)網(wǎng)形態(tài)已經(jīng)被AI重構(gòu)。
火山引擎總裁譚待披露,豆包大模型日均Token用量從2024年5月的1200億飆升至2025年9月的30萬億,增幅達(dá)253倍。更具行業(yè)代表性的是,全行業(yè)推理Token總用量較2023年已實(shí)現(xiàn)300倍躍升。
沙利文分析相關(guān)數(shù)據(jù)顯示,2028年中國(guó)推理算力市場(chǎng)規(guī)模將達(dá)2931.2億元,行業(yè)對(duì)于推理技術(shù)進(jìn)步有著迫切需求。AI推理需求何時(shí)爆發(fā)?哪項(xiàng)推理優(yōu)化技術(shù)更為高效?歡迎添加微信 YONGGANLL6662 互通有無。
明確的需求之下,推理任務(wù)的技術(shù)特性為國(guó)產(chǎn)算力提供了精準(zhǔn)適配的空間。
推理任務(wù)多采用Decoder架構(gòu),其核心邏輯是單個(gè)查詢向量(Query)與鍵向量(Key)、值向量(Value)進(jìn)行注意力計(jì)算(Attention),單次輸出一個(gè)Token,本質(zhì)是通過單個(gè)Token與靜態(tài)參數(shù)開展局部計(jì)算。這意味著推理無需盲目追求“極致計(jì)算性能”與“訓(xùn)練級(jí)超大容量HBM”,而應(yīng)精準(zhǔn)匹配場(chǎng)景需求,以支撐大規(guī)模、低延遲的推理業(yè)務(wù)落地。
針對(duì)推理應(yīng)用場(chǎng)景,國(guó)產(chǎn)芯片廠商正在不斷迭代方案。
華為基于910B的硬件特性,在DeepSeek部署場(chǎng)景中開展了大量探索,推出針對(duì)性的專家并行方案,實(shí)現(xiàn)大規(guī)模推理業(yè)務(wù)的性能加速。專家并行方案顯著降低了單卡顯存占用,并將單卡并發(fā)能力提升至3倍,使企業(yè)能夠在相同算力投入下獲得更高的推理吞吐量。
此外,高顯存是國(guó)產(chǎn)芯片在推理場(chǎng)景中的核心優(yōu)化方向,910B搭載64GB顯存,平頭哥與昆侖芯的相關(guān)產(chǎn)品則將顯存容量提升至96GB。
除了硬件產(chǎn)品本身的性能與配置升級(jí),推理場(chǎng)景對(duì)算力彈性與成本優(yōu)化的需求,還推動(dòng)了異構(gòu)集群的落地應(yīng)用。多元算力協(xié)同的模式,進(jìn)一步拓寬了國(guó)產(chǎn)芯片的生存空間。
“針對(duì)推理業(yè)務(wù),年初行業(yè)對(duì)PD分離技術(shù)抱有高度期待,PD分離技術(shù)本身能帶來的性能優(yōu)化大約是20%,但其優(yōu)勢(shì)在于能將推理過程中的Prefill階段(計(jì)算密集型)與Decode階段(顯存密集型)拆分開來,這不僅保障了大規(guī)模部署的可行性,也為兩個(gè)階段的差異化適配與優(yōu)化創(chuàng)造了條件?!?宋志方表示。
據(jù)悉,天數(shù)智芯天垓150與英偉達(dá)H20組成的異構(gòu)集群,已成功應(yīng)用于DeepSeek的大規(guī)模推理部署場(chǎng)景,天垓150作為P節(jié)點(diǎn),專門承接計(jì)算密集型任務(wù)處理,配備141GB顯存的H20作為D節(jié)點(diǎn),專注承載顯存密集型相關(guān)工作。
“搭配國(guó)產(chǎn)芯片和英偉達(dá)芯片的方式去實(shí)現(xiàn)PD分離,對(duì)比純英偉達(dá)方案,在能耗以及成本方面一定是更優(yōu)的?!?/strong>宋志方表示,“一般會(huì)認(rèn)為英偉達(dá)的解決方案是最優(yōu)解,但從代碼的角度講,Prefill階段的每次請(qǐng)求計(jì)算量都很小,采用性能更強(qiáng)的芯片,計(jì)算速度會(huì)更快,但無法發(fā)揮芯片的完全的計(jì)算能力,因此采用國(guó)產(chǎn)芯片反而性價(jià)比會(huì)更高?!?/p> 渠道封閉、產(chǎn)能受限、需求放量,國(guó)產(chǎn)芯片步入「賣方市場(chǎng)」 隨著應(yīng)用場(chǎng)景的持續(xù)成熟,國(guó)產(chǎn)芯片的市場(chǎng)需求日益清晰。 “一款芯片能不能真正跑通市場(chǎng),核心在于能否抓住需求爆發(fā)的窗口,用戶愿意為產(chǎn)品買單才是最根本的邏輯。” 前芯片廠商研發(fā)專家楊濤表示。 這一說法,在當(dāng)前的AI芯片市場(chǎng)的增長(zhǎng)態(tài)勢(shì)中也得到了充分印證。 “國(guó)內(nèi)AI芯片市場(chǎng)正進(jìn)入高速增長(zhǎng)通道,每年增長(zhǎng)50%的判斷相對(duì)客觀,甚至有望達(dá)到70%-80%的增速。”服務(wù)器廠商資深專家夏雨補(bǔ)充道,“這一強(qiáng)勁增長(zhǎng)的核心驅(qū)動(dòng)力,來自推理算力需求的持續(xù)釋放與多模態(tài)應(yīng)用的全面爆發(fā)。” 此前長(zhǎng)期以英偉達(dá)為核心的算力貿(mào)易,在政策、技術(shù)及市場(chǎng)等因素的影響之下,已逐漸讓渡份額給國(guó)產(chǎn)芯片。 “芯片貿(mào)易門檻不高,可復(fù)制性極強(qiáng)。”張翔直言,“以當(dāng)前的B200設(shè)備為例,如今市場(chǎng)行情已高度透明,無論是貿(mào)易商還是終端客戶,都對(duì)設(shè)備基準(zhǔn)價(jià)格及合理利潤(rùn)空間了如指掌,不存在信息差帶來的額外收益?!?/p> 不少從業(yè)者表示,當(dāng)前售賣最新款英偉達(dá)設(shè)備能實(shí)現(xiàn)10萬元毛利已屬可觀,其投入產(chǎn)出比已遠(yuǎn)不及從前。 相比之下,國(guó)產(chǎn)芯片獨(dú)特的分銷體系與市場(chǎng)特征,使得其貿(mào)易環(huán)節(jié)的信息透明度相對(duì)較低,客觀上為貿(mào)易商保留了更穩(wěn)定的利潤(rùn)空間。貿(mào)易商的轉(zhuǎn)向,也將進(jìn)一步激活國(guó)產(chǎn)算力生態(tài)。 獨(dú)特的分銷體系,核心以“公對(duì)公”合作為主,一方面,受限于產(chǎn)能供給,頭部大客戶的需求已能充分消化國(guó)產(chǎn)芯片廠商的現(xiàn)有產(chǎn)能,以某頭部芯片廠商為例,其采用白名單供應(yīng)機(jī)制,僅向大型企業(yè)及國(guó)企開放合作。另一方面,AI芯片對(duì)技術(shù)服務(wù)的依賴度極高,在多數(shù)應(yīng)用場(chǎng)景中,后續(xù)的技術(shù)支持、模型適配等服務(wù)僅能由芯片原廠提供。 “直銷是目前最好的方式,因?yàn)橘Q(mào)易商普遍不具備技術(shù)服務(wù)能力,且國(guó)產(chǎn)芯片多為項(xiàng)目制,芯片原廠直接對(duì)項(xiàng)目負(fù)責(zé)?!蹦硣?guó)產(chǎn)芯片廠商市場(chǎng)負(fù)責(zé)人鐵云表示。 這一模式下,芯片廠商在服務(wù)器硬件適配方面也有著清晰的合作布局。 據(jù)悉,寒武紀(jì)合作的服務(wù)器廠商為浪潮,昆侖芯合作服務(wù)器廠商為新華三,從芯片廠商的角度,一般會(huì)選擇1-2家服務(wù)器廠商進(jìn)行合作,一般是1家大型OEM廠商為主,幫助芯片廠商定制機(jī)型,再搭配一個(gè)規(guī)模較小的服務(wù)器廠商作為儲(chǔ)備。 值得注意的是,即便服務(wù)器廠商是芯片廠商的關(guān)鍵硬件合作方,其技術(shù)服務(wù)能力仍難以達(dá)到原廠水準(zhǔn)。因此在實(shí)際合作中,涉及技術(shù)支持、模型適配等核心環(huán)節(jié),仍需芯片原廠直接介入。這也決定了最終的銷售路徑并非由服務(wù)器廠商直接出貨,而是由服務(wù)器廠商完成硬件組裝后,再由芯片原廠主導(dǎo)銷售與后續(xù)服務(wù)。國(guó)產(chǎn)芯片分銷體系的更多玩法與內(nèi)幕,歡迎添加微信 YONGGANLL6662 交流探討。 此外,國(guó)產(chǎn)芯片的貨源不易在市場(chǎng)上流通,還與服務(wù)器廠商的備貨邏輯密切相關(guān)。站在服務(wù)器廠商的角度,通用性較低的產(chǎn)品市場(chǎng)接受度低,客戶需求差異大,一旦備貨后未能及時(shí)售出,極易造成庫存積壓;而通用性強(qiáng)的產(chǎn)品可復(fù)制性更高,更易實(shí)現(xiàn)規(guī)?;N售,因此很多通用性低的產(chǎn)品,服務(wù)器廠商通常沒有備貨,進(jìn)而導(dǎo)致流入市場(chǎng)的國(guó)產(chǎn)設(shè)備數(shù)量減少。 國(guó)產(chǎn)芯片公司也會(huì)儲(chǔ)備經(jīng)銷商,但僅限于分銷部分中低端型號(hào)的產(chǎn)品,以及負(fù)責(zé)服務(wù)中小客戶,而且做為代理,也能起到為國(guó)產(chǎn)芯片廠商墊資的作用。 直銷主導(dǎo)的銷售路徑、服務(wù)器廠商對(duì)通用性不足產(chǎn)品的審慎備貨,再加上經(jīng)銷商僅覆蓋中低端型號(hào)的分銷局限,多重因素疊加,國(guó)產(chǎn)芯片逐步走入賣方市場(chǎng)。 國(guó)產(chǎn)算力市場(chǎng)新局面:窗口期競(jìng)速、超節(jié)點(diǎn)破局、價(jià)格逐漸下探 當(dāng)下的國(guó)內(nèi)算力市場(chǎng)正迎來洗牌期,A100淘汰換代、推理需求爆發(fā)都將為國(guó)產(chǎn)芯片的發(fā)展提供窗口期,這也不可避免的讓國(guó)產(chǎn)芯片迎來最激烈的競(jìng)爭(zhēng)期。 在這一背景下,市場(chǎng)對(duì)國(guó)產(chǎn)芯片的落地效率提出了更高要求。 “一款芯片產(chǎn)品量產(chǎn)推向市場(chǎng)后,若一年內(nèi)仍未能形成商業(yè)化批量采購,本質(zhì)上意味著產(chǎn)品商業(yè)化落地不成功,因?yàn)榭紤]到半導(dǎo)體行業(yè)的高速迭代,市場(chǎng)留給企業(yè)實(shí)現(xiàn)規(guī)?;涞氐拇翱谄?,往往僅有一年到一年半時(shí)間?!辫F云表示。 而要在短窗口期內(nèi)快速突破市場(chǎng)、搶占份額,單純比拼單卡性能的傳統(tǒng)路徑已難以為繼,系統(tǒng)整體效率與規(guī)?;渴鹉芰Φ闹匾匀找嫱癸@,最直接的表現(xiàn)便是催生了超節(jié)點(diǎn)產(chǎn)品的崛起。 目前國(guó)內(nèi)超節(jié)點(diǎn)產(chǎn)品生態(tài)逐漸豐富:昇騰384超節(jié)點(diǎn)集成384顆昇騰910C AI芯片和192顆鯤鵬CPU,通信帶寬提升15倍,支持?jǐn)?shù)萬卡集群擴(kuò)展;平頭哥磐久AL128超節(jié)點(diǎn)單柜集成128張加速卡,實(shí)現(xiàn)訓(xùn)練端到端加速比3倍提升;中科曙光scaleX640超節(jié)點(diǎn)實(shí)現(xiàn)全球首個(gè)單機(jī)柜640卡超節(jié)點(diǎn),MOE大模型訓(xùn)練效率提升30%-40%。 “超節(jié)點(diǎn)是AI時(shí)代的基礎(chǔ)設(shè)施形態(tài),其解決高效通信的問題,讓集群的效率大幅提升,也就變相的降低了成本,原先1000張卡才能實(shí)現(xiàn)的效果,現(xiàn)在或許500張就足夠了。”夏雨表示。 超節(jié)點(diǎn)的核心競(jìng)爭(zhēng)力體現(xiàn)在兩方面:一是芯片本身的性能表現(xiàn),二是互聯(lián)鏈路與架構(gòu)的優(yōu)化能力。盡管國(guó)產(chǎn)芯片單卡性能與英偉達(dá)存在差距,但國(guó)內(nèi)廠商在網(wǎng)絡(luò)互聯(lián)技術(shù)領(lǐng)域具備差異化優(yōu)勢(shì),通過擴(kuò)大工程化集成規(guī)模,實(shí)現(xiàn)了整體性能的彎道超車。 要將這種優(yōu)勢(shì)轉(zhuǎn)化為市場(chǎng)份額,定價(jià)策略與市場(chǎng)鋪設(shè)節(jié)奏成為關(guān)鍵。 相關(guān)行業(yè)人士透露,頭部廠商的單套超節(jié)點(diǎn)產(chǎn)品落地價(jià)約7000-8000萬元,目前廠商為加速市場(chǎng)滲透、快速鋪開應(yīng)用場(chǎng)景,持續(xù)下調(diào)價(jià)格,部分項(xiàng)目折扣力度可達(dá)五折。 “芯片行業(yè)本身具備較高利潤(rùn)空間,英偉達(dá)相關(guān)產(chǎn)品毛利約70%,即便適度讓利甚至以低毛利策略拓展市場(chǎng),仍具備可持續(xù)性?!毕挠瓯硎?。 此外,超節(jié)點(diǎn)作為硬件集群形態(tài)的創(chuàng)新,其性能發(fā)揮與規(guī)?;涞?,最終離不開軟件生態(tài)的深度協(xié)同。 軟硬件協(xié)同是國(guó)產(chǎn)AI芯片的重要考題:在生態(tài)層面,國(guó)產(chǎn)廠商仍處于“各立標(biāo)準(zhǔn)”的分散狀態(tài),華為昇騰依托MindSpore框架與Ascend API,寒武紀(jì)則基于Cambricon NeuWare平臺(tái)打造專有接口,沐曦、壁仞等也需適配PyTorch/TensorFlow的自定義算子接口。 這種“無統(tǒng)一標(biāo)準(zhǔn)”的現(xiàn)狀,導(dǎo)致開發(fā)者若想在不同芯片間遷移模型,需重新做算子適配、性能調(diào)優(yōu),甚至修改底層代碼。以千億參數(shù)大模型遷移為例,從英偉達(dá)GPU轉(zhuǎn)向國(guó)產(chǎn)芯片,往往需要1-3個(gè)月的適配周期,這正是生態(tài)建設(shè)門檻高、壁壘深的核心原因。 鐵云認(rèn)為,AI領(lǐng)域尚未形成類似圖形計(jì)算領(lǐng)域DirectX、Vulkan的全球通用標(biāo)準(zhǔn)API。若未來行業(yè)能誕生統(tǒng)一的API標(biāo)準(zhǔn),將大幅降低生態(tài)建設(shè)門檻,打破當(dāng)前不同技術(shù)路徑下的生態(tài)壁壘,屆時(shí)生態(tài)競(jìng)爭(zhēng)格局或?qū)⒂瓉砀拘愿淖儭?/p> 需求爆發(fā)、市場(chǎng)交替、技術(shù)迭代的周期變化之下,美元基金投資人張音表示,“明年,AI產(chǎn)業(yè)的關(guān)注重點(diǎn)將回歸算力基礎(chǔ)設(shè)施投資建設(shè)?!眹?guó)產(chǎn)算力熱潮,不是短期資本炒作的 “風(fēng)口”,而是技術(shù)迭代到一定階段、需求積累到特定程度的必然結(jié)果。 作者長(zhǎng)期關(guān)注算力與芯片產(chǎn)業(yè),歡迎添加微信 YONGGANLL6662 交流更多信息。 注:文中林海、張翔、楊濤、夏雨、張音均為化名。 雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。