丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
業(yè)界 正文
發(fā)私信給岑大師
發(fā)送

0

當(dāng)智算變局到來,我們該如何 “用對” 算力?| GAIR Live016

本文作者: 岑大師   2025-10-30 11:49
導(dǎo)語:卡脖子的不是模型,是“用不對”的算力。

當(dāng)智算變局到來,我們該如何 “用對” 算力?| GAIR Live016

2025 年的 AI 圈,終于從 “大模型崇拜” 走進了 “應(yīng)用現(xiàn)實主義”。

當(dāng)百度文心、阿里通義、騰訊混元等基礎(chǔ)模型的參數(shù)競賽告一段落,當(dāng) “百模大戰(zhàn)” 變成 “百業(yè)應(yīng)用”,企業(yè)們突然發(fā)現(xiàn):曾經(jīng)被當(dāng)作 “基建” 的算力,成了應(yīng)用落地的 “勝負(fù)手”—— 不是沒有算力,而是找不到 “剛好能用” 的算力;不是算力不夠,而是 “用不對地方” 的算力在浪費;不是買不起算力,而是 “不會用算力” 的成本在吞噬利潤。

而 Oracle 與 OpenAI 簽下 3000 億美元的算力大單同樣是行業(yè)變化的風(fēng)向標(biāo):這不是簡單的 “賣算力”,而是 “生態(tài)綁定”:OpenAI 需要 Oracle 的超大規(guī)模算力集群支撐 GPT-5 的訓(xùn)練與推理,Oracle 則通過綁定頭部模型公司鎖定未來十年的算力需求。這反映了全球算力市場的兩個核心趨勢:

其一是 “算力需求從集中走向爆發(fā)” 。大模型訓(xùn)練需要巨量算力(GPT-5 的訓(xùn)練算力是 GPT-3 的 10 倍),而多模態(tài)、Agent(智能體)等應(yīng)用的推理算力更是指數(shù)級增長。比如一個直播 AI 中控,要同時處理視頻流、語音識別、觀眾互動,其推理算力消耗是普通文本模型的 5 倍;

其次, “算力供給從規(guī)?;呦蚨ㄖ苹?nbsp;。市場需要的,不是 “通用算力”,而是 “匹配模型需求的算力”:比如 NVIDIA 的 H20 芯片,因高顯存(80GB)、低功耗(350W)成了 “推理圣體”,而國產(chǎn)芯片如華為昇騰 950,因支持 FP8 精度,在短視頻推理場景下性價比超過 H100。

回到國內(nèi),我們有世界第二大的計算規(guī)模(788 百億億次每秒),有 200 多個超算 / 智算中心,但供需錯配 、技術(shù)錯配 、模式錯配、認(rèn)知錯配的痛點,正在給智算市場帶來新的機會和挑戰(zhàn)。

正是在這樣的背景下,雷峰網(wǎng)(公眾號:雷峰網(wǎng)) GAIR Live 于 9 月 18 日推出 “算力變革下的生存之道” 主題論壇。三位 “起而行之” 的實踐者,善思開悟四川分公司 CEO、AGI 產(chǎn)品負(fù)責(zé)人余溢、超云方案與生態(tài)部總經(jīng)理張春雨、矩向科技 CEO黃朝波進行了分享。

這場討論沒有 “高大上” 的技術(shù)名詞,只有 “接地氣” 的問題:

模型公司找算力時,到底是 “選便宜的” 還是 “選好用的”?

算力廠商面對同質(zhì)化競爭,如何從 “賣設(shè)備” 轉(zhuǎn)向 “賣服務(wù)”?

應(yīng)用公司用算力,是 “堆 GPU” 還是 “云邊協(xié)同”?

未來的算力市場,是 “英偉達(dá)一家獨大” 還是 “國產(chǎn)芯片崛起”?

這些問題,不是 “理論問題”,而是 “生存問題”—— 當(dāng)大模型的 “技術(shù)紅利” 消失,剩下的就是 “算力效率” 的比拼:誰能把算力用對地方,誰能把算力成本降下來,誰能把算力與應(yīng)用綁定,誰就能在應(yīng)用爆發(fā)期活下來。

在這次分享中,三位嘉賓從各自的實踐出發(fā),沒有講 “應(yīng)該怎樣”,而是講 “正在怎樣”—— 他們的判斷,是算力市場從 “混亂” 走向 “有序” 的關(guān)鍵線索;他們的經(jīng)驗,是 AI 應(yīng)用從 “實驗室” 走向 “產(chǎn)業(yè)” 的實用指南。如果你是模型公司的 CTO,想找 “性價比最高的算力”;如果你是算力廠商的 CEO,想破 “同質(zhì)化競爭” 的局;如果你是應(yīng)用公司的創(chuàng)業(yè)者,想 “用算力降本增效”,三位嘉賓會給你最直接的答案。

當(dāng)智算變局到來,我們該如何 “用對” 算力?| GAIR Live016

以下是此次圓桌討論的精彩分享,AI 科技評論進行了不改原意的編輯整理:


01

AI 算力市場的變革

岑峰:大家晚上好!我是雷峰網(wǎng)的岑峰。上周,Oracle 與 OpenAI 簽下了3000億美元的算力大單,這不僅標(biāo)志著 AI 算力需求的大爆發(fā),也預(yù)示著全球計算市場的深刻變革。從技術(shù)路徑到產(chǎn)業(yè)布局,再到供需關(guān)系和競爭規(guī)則,一切都在重構(gòu)。

與此同時,我國的計算規(guī)模已達(dá)788百億億次每秒(788 EFLOPS),擁有200多個計算中心,但同時也面臨諸多挑戰(zhàn)。因此,我們今天將圍繞算力供給、模型研發(fā)和應(yīng)用落地等多個方面,探討如何在計算變革中找到生存之道。

今晚,我們有幸邀請到三位嘉賓:善思開悟四川分公司 CEO、AGI 產(chǎn)品負(fù)責(zé)人余溢、超云方案與生態(tài)部總經(jīng)理張春雨、矩向科技 CEO 黃潮波。我們期待今晚能進行一場深入的討論。

首先,讓我們請三位嘉賓分別介紹一下自己和他們的公司。

余溢:大家好,我是余溢。這是我的第一次創(chuàng)業(yè),之前在阿里和字節(jié)主要從事國際支付合規(guī)與反洗錢業(yè)務(wù),2023年我才開始進入智算領(lǐng)域。我們公司“善思開悟”致力于提供一站式 AI 解決方案,主要有三條業(yè)務(wù)線,首先是算力業(yè)務(wù),在雅安建有西南地區(qū)規(guī)模最大的超算中心,并提供超算和智算的租賃等服務(wù);第二個是數(shù)據(jù)業(yè)務(wù), 擁有獨立團隊負(fù)責(zé)數(shù)據(jù)基站的數(shù)據(jù)標(biāo)注服務(wù);第三則是AI應(yīng)用業(yè)務(wù),由我負(fù)責(zé)的四川公司和 AGI 團隊,專注于“AI +行業(yè)解決方案”的應(yīng)用落地。我們的生態(tài)位覆蓋了從基礎(chǔ)設(shè)施到下游應(yīng)用的各個環(huán)節(jié)。

張春雨:大家好,我是張春雨。我目前在超云負(fù)責(zé)解決方案和生態(tài)合作工作,整個工作經(jīng)歷都在算力相關(guān)廠商,曾任職于浪潮信息、H3C 等。

超云公司全稱是超云數(shù)字技術(shù)集團有限公司,公司成立于2010年,是中國電子 CEC 和云基地聯(lián)合注資成立的國家高新技術(shù)企業(yè)、工信部專精特新“小巨人”企業(yè),超云專注于數(shù)據(jù)中心產(chǎn)品及服務(wù);產(chǎn)品覆蓋加速計算、通用計算、信創(chuàng)及私有云等領(lǐng)域,可幫助客戶快速構(gòu)建 AIDC 算力基座;依托北京、南京、廣深三大研發(fā)中心及全國營銷技術(shù)服務(wù)體系,服務(wù)于互聯(lián)網(wǎng)、金融、電信、制造、教育、能源及公共服務(wù)等多個行業(yè)。

黃朝波:大家好,我是黃朝波。我個人以前是做算力芯片的,做的是 CPU 芯片研發(fā),也曾在公有云公司優(yōu)刻得負(fù)責(zé)底層軟件協(xié)同創(chuàng)新。因此,我們的核心技術(shù)優(yōu)勢在于既懂軟件又懂硬件,擅長底層的軟硬件協(xié)同創(chuàng)新。

我們將這一技術(shù)體系凝練為“融合計算”,包含三個維度:計算架構(gòu)的異構(gòu)融合、軟硬件堆棧的融合,以及云邊端的平行擴展融合。我們的理念是“授人以漁”,不直接做算力云,而是將這些技術(shù)賦能給合作伙伴,幫助他們以低門檻、專業(yè)化的方式建立自己的智算云。我們的目標(biāo)是協(xié)助國內(nèi)涌現(xiàn)幾十家甚至更多的專業(yè)智算云公司。


02

洞察市場變局

岑峰:我們都看到了 Oracle 和 Open AI 的大單,這背后不僅有算力需求的爆發(fā),還有云廠商和大模型公司之間更深層次的一個戰(zhàn)略綁定和生態(tài)合作。我想請三位從各自的專業(yè)角度出發(fā)去解讀這樣的一種超級大單的一個現(xiàn)象,他會可能產(chǎn)生怎樣的一些機會和挑戰(zhàn)?余總,您認(rèn)為這種變化趨勢的根源是什么?

余溢: 核心矛盾在于結(jié)構(gòu)性失衡,機遇挑戰(zhàn)并存

余溢: 我認(rèn)為這個問題本質(zhì)上是供需關(guān)系的不匹配。2023年,國內(nèi)算力市場曾處于供不應(yīng)求的狀態(tài),促使企業(yè)和國家大量超前建設(shè)算力;然而到了2024至2025年,供應(yīng)在局部地區(qū)大于了需求,但頭部模型廠商和大型企業(yè)仍然面臨算力緊缺的問題。

這背后有一個關(guān)鍵認(rèn)知:算力不是電力,它不是一個通用的指標(biāo)。不同的設(shè)備(GPU的算力( TFlops ), 顯存大小, 顯卡帶寬, 機器內(nèi)卡間連接方式,機器間連接方式等)規(guī)格各異,導(dǎo)致算力無法像普通商品一樣自由流通。這就好比鋼鐵,有普通生鐵,也有高精尖的特種鋼,用途和價值完全不同。

我認(rèn)為,雖然局部供需錯配依然存在,但整體亂象正在趨于緩解。我的判斷基于三點:需求方、供給方和政策導(dǎo)向。

首先,從需求端看,訓(xùn)練和推理需求都非常旺盛。大模型參數(shù)量越來越大,對算力的需求不斷“堆高”。同時,多模態(tài)和 Agent(智能體)應(yīng)用的爆發(fā),導(dǎo)致推理任務(wù)的計算量激增,算力消耗未來會越來越大。盡管像 DeepSeek 這樣的稀疏模型提高了算力利用率,但總體需求仍然呈上升趨勢。

其次,從供給端看,國產(chǎn)化芯片正在發(fā)揮作用。過去,國產(chǎn)芯片在基礎(chǔ)模型訓(xùn)練上難以與 NVIDIA 競爭,但在以推理為主的應(yīng)用趨勢下,其性能不斷優(yōu)化,獲得了很好的利用。這讓部分原本閑置的國產(chǎn)算力得到了有效消耗。同時,服務(wù)器和芯片的消耗量證明整體供給是有人買單的。

最后,政策導(dǎo)向也起到了關(guān)鍵作用。政府及時進行窗口指導(dǎo),治理了許多亂象,鼓勵企業(yè)先有需求再進行建設(shè),而不是盲目地先建設(shè)再找客戶。這有效減少了套取補貼等行為。

總的來說,過去那些閑置的中小型算力池,特別是國產(chǎn)算力,在推理任務(wù)的爆發(fā)中得到了很好的利用。與要求嚴(yán)苛的訓(xùn)練任務(wù)不同,推理對算力的要求相對更靈活。這一變化讓許多閑散的算力資源得到了盤活,緩解了市場的錯配問題。

岑峰:謝謝余總,余總之前曾用“大煉鋼鐵”來形容計算中心的建設(shè),現(xiàn)在國家的政策也在促進合作,這與 Oracle 和 Open AI 的生態(tài)合作方向是一致的。在國產(chǎn)芯片算力得到更好應(yīng)用的新供需局勢下,您認(rèn)為會帶來哪些新的挑戰(zhàn)和機遇呢?

余溢:我認(rèn)為這是一個機遇與挑戰(zhàn)并存的局面,主要體現(xiàn)在兩個方面:生態(tài)建設(shè)和技術(shù)創(chuàng)新。

首先是生態(tài)建設(shè)。對國產(chǎn)芯片企業(yè)來說,這是一個絕佳的時機。目前,市場對推理算力的旺盛需求正推動它們快速完善生態(tài)、提升技術(shù)和服務(wù)。許多國產(chǎn)芯片公司正積極上市,市場前景一片看好。但生態(tài)建設(shè)的護城河很高,就像 NVIDIA 一樣,即便是其新卡發(fā)布后,生態(tài)兼容性也需要時間去完善。

對國內(nèi)企業(yè)而言,這是一個挑戰(zhàn),但更是機遇。有了市場的需求,就會有更多企業(yè)去實踐、去“踩坑”,從而形成解決問題的經(jīng)驗,逐步建立起自己的生態(tài)。值得一提的是,一些頭部國產(chǎn)芯片企業(yè)也開始放棄純自研,轉(zhuǎn)而兼容 NVIDIA 的生態(tài),這說明“開放”是發(fā)展正道,通過兼容帶動整個上下游共同發(fā)展。

此外,技術(shù)創(chuàng)新也帶來了新機遇。

我覺得未來僅僅比較 GPU 的算力值,也就是多少 PFLOPs ,意義真的不大了。像A100和4090,如果只論純 GPU 算力它們差不多,但A100有 Nvlink 和 80GB 顯存,這使其能用于訓(xùn)練大型模型,這是4090無法比擬的。算力并不是簡單地把不同的卡堆疊起來就能解決問題,也不能強行將不同型號的卡統(tǒng)一處理任務(wù)。最終我們還是要看整體算力的利用率。

現(xiàn)在,隨著推理業(yè)務(wù)的爆發(fā),我們看到了一個有趣的現(xiàn)象。當(dāng)前主流模型,比如基于MoE(Mixture of Experts)稀疏架構(gòu)的模型,像 DeepSeek 或千問,雖然其基座模型的總參數(shù)量可能達(dá)到萬億級別,但在單次推理時,并非所有參數(shù)都會被激活。推理一個300B的模型,可能實際只使用了30B的參數(shù),相當(dāng)于只激活了十分之一的專家。這意味著對算力的實際消耗變少了,但對顯存的需求卻大大增加了,因為所有專家選擇的邏輯都需要存儲在顯存中。

這種變化帶來了一個重要機會:GPU 的顯存利用率變得至關(guān)重要,而純算力可能出現(xiàn)冗余。這就是為什么現(xiàn)在做推理時,24GB 或 48GB 顯存的4090,甚至一些魔改芯片,會非常好用——只要能把顯存放大,就能發(fā)揮很好的效果。

因此,對于國產(chǎn)芯片而言,這是一個巨大的機會。我們需要發(fā)展能夠提高顯存容量,并能更好地滿足推理需求的芯片。同時,對于現(xiàn)有計算中心而言,那些相對老舊的A系列或三零系列設(shè)備,如果直接淘汰將是巨大的浪費。但如果將它們重新利用,投入到推理項目中,可以大大提升現(xiàn)有資源的利用率,這是一個很好的老舊設(shè)備重利用機會。

最后,從運營模式上看,傳統(tǒng)的粗放式運營,即一個項目就將整套裸金屬資源包給一兩個大客戶的方式,在當(dāng)前市場下可能不再有效。未來的趨勢是,計算中心,特別是作為第三方平臺時,需要有能力將一個大的算力集群更精細(xì)化地切分和調(diào)度,去服務(wù)大量中小型、長尾客戶,特別是那些做垂直領(lǐng)域或小型模型的企業(yè)。這種精細(xì)化的運營模式將能更好地匹配多樣化的算力需求,也是一個重要的市場機會。

岑峰: 余總作為 AGI 應(yīng)用的專家,剛才更多是從模型公司的需求以及算力提供方的角度,探討了雙方的互相促進。您認(rèn)為在共建生態(tài)的整體趨勢下,未來的模型公司和算力提供方之間,如何才能實現(xiàn)共贏?

余溢: 這個問題很有意思,因為這意味著目前雙方可能并未完全達(dá)到共贏狀態(tài)。我認(rèn)為核心原因在于,當(dāng)前市場供需匹配存在結(jié)構(gòu)性失衡:只有少數(shù)幾家頭部模型公司對大量算力有需求,但算力供應(yīng)商卻有上千家。這些供應(yīng)商提供的服務(wù)相對同質(zhì)化,都是標(biāo)準(zhǔn)化的設(shè)備、組網(wǎng)和合同,最終導(dǎo)致的結(jié)果就是大家陷入了純粹的價格競爭,價格被壓得很低。

要實現(xiàn)共贏,首先自然需要市場自身的調(diào)節(jié)。這并非一個特許經(jīng)營市場,價格最終會回歸價值,市場會進行分流和淘汰。對模型廠商而言,尤其是一些非頭部企業(yè),他們的資金多來源于融資,因此會非常謹(jǐn)慎地尋求最低成本的算力。他們自己也還在摸索盈利模式,所以對價格敏感度極高。

在這種環(huán)境下,算力提供方需要大幅提升自身競爭力。僅僅提供同質(zhì)化服務(wù)是行不通的。一些能將價格壓得很低的競爭者,往往是通過“羊毛出在豬身上”的邏輯來盈利,例如通過二級市場獲利、獲取政府補貼、爭取綠電指標(biāo),或從其他合作項目中獲得收益,這些都在經(jīng)濟合理范圍內(nèi)。所以,提升自身競爭力的核心在于優(yōu)化效率,避免純粹的同質(zhì)化服務(wù)。

此外,我們已經(jīng)看到一些外部因素正在引導(dǎo)市場進行健康分流。例如,政府的“窗口指導(dǎo)意見”,明確要求在沒有下游消納方的情況下,不得超前建設(shè)。這本質(zhì)上是為了打造更健康的產(chǎn)業(yè)鏈,避免盲目投資。那些沒有明確下游需求而超前建設(shè)的供應(yīng)商將逐步退出。同時,那些自身運營效率低、缺乏資金優(yōu)勢的供應(yīng)商,也將被市場淘汰或轉(zhuǎn)向服務(wù)長尾客戶。

另一個重要的共贏路徑是,算力持有方應(yīng)積極開辟“第二曲線”。舉例來說,有些大廠既是算力需求方也是提供方,在投資其他模型公司時,會把算力作為投資款的重要組成部分,這是一種非常良性的投資方式。有能力的算力服務(wù)商也可以借鑒,將算力作為投資,投向與自身下游相關(guān)的初創(chuàng)企業(yè)。這需要一定的投資能力和對AI應(yīng)用的理解力,但無疑是提升競爭力和開辟新增長點的有效方式。

最后,宏觀調(diào)控也將持續(xù)發(fā)揮作用。早期我們看到了對算力建設(shè)的大力支持,但當(dāng)出現(xiàn)亂象后,政策迅速收緊。未來,可以期待更多宏觀調(diào)控政策出臺,對市場進行進一步規(guī)范。對于模型買方,目前期望他們主動改變現(xiàn)狀可能不現(xiàn)實,但一個明顯的趨勢是,國產(chǎn)化替代會越來越強勁。無論是擁有自研芯片的大廠傾向于內(nèi)采,還是政府政策的積極鼓勵,都在推動整個行業(yè)向國產(chǎn)化方向邁進。

張春雨: 服務(wù)商的綜合服務(wù)能力越來越重要

岑峰:張總,像 Oracle 和 OpenAI 這樣大單的算力合作,您認(rèn)為會給國內(nèi)智算力市場帶來怎樣的沖擊或者說影響?

張春雨:我認(rèn)為影響比較有限,國內(nèi)市場會按自己的節(jié)奏走。雖然國外市場是全球風(fēng)向標(biāo),英偉達(dá)曾引導(dǎo)“算力規(guī)模決定模型質(zhì)量”的理念,但 DeepSeek 出現(xiàn)后,這一觀點已出現(xiàn)多元化路線。

盡管國外投資規(guī)模龐大,國內(nèi)也在大力投入,如阿里三年投資3800億人民幣,騰訊、字節(jié)等也有相當(dāng)規(guī)模的投入。重要的是,國內(nèi)的建設(shè)節(jié)奏已受政策引導(dǎo)。年初的“窗口指導(dǎo)”正是針對此前算力摸底中發(fā)現(xiàn)的盲目、小規(guī)模建設(shè)導(dǎo)致的嚴(yán)重浪費。

現(xiàn)在國家正引導(dǎo)算力建設(shè)向八大樞紐、十大集群集中,并對規(guī)模、地點和參與方進行規(guī)范。因此,國外的大單更多是揭示未來算力趨勢,對國內(nèi)具體路徑的影響有限。

前面余總也提到,目前國內(nèi)算力建設(shè)已經(jīng)更加謹(jǐn)慎。過去為爭指標(biāo)而盲目建設(shè)的現(xiàn)象減少,取而代之的是“先有客戶再建設(shè)”的模式,甚至采取輕量化運營,積極利用閑散算力。從具體市場看,今年訓(xùn)練側(cè)的建設(shè)明顯放緩,項目減少且大項目決策周期拉長。但在推理側(cè),采購需求依然旺盛,尤其互聯(lián)網(wǎng)客戶對 RTX 50系顯卡等消費級算力需求量大,許多頭部算力提供商也通過間接方式服務(wù)互聯(lián)網(wǎng)行業(yè)。

岑峰:剛才您提到了算力需求的改變,現(xiàn)在市場用戶在尋找計算中心資源時,最關(guān)心的核心要素是什么?未來計算中心在技術(shù)架構(gòu)和商業(yè)模式上可能出現(xiàn)怎樣的演變?

張春雨: 目前來看,整個市場仍處于一個供大于求的階段,這一點從高端 GPU 甚至整機價格的下降就能看出來。因此,客戶在選擇算力資源時,首先關(guān)注的肯定是價格,特別是對于那些兩三年以上的長期合作訂單,價格因素至關(guān)重要。

在價格之外,客戶現(xiàn)在非??粗胤?wù)商的綜合服務(wù)能力。因為可選的算力資源實在太多了,他們會仔細(xì)考量你的技術(shù)與服務(wù)水平,以及提供的算力類型。例如,H系列是當(dāng)前主流,B 系列是未來趨勢,而 A 系列(A100/A800)由于不支持 FP8 ,在運行 DeepSeek 這類新型模型時,性價比已大幅降低。

同時算力規(guī)模也決定了客戶的選擇意愿,能夠匹配客戶所需的大規(guī)模算力通常更具吸引力。此外,服務(wù)商過往的案例和口碑,尤其是在大模型服務(wù)方面的經(jīng)驗,也是客戶評估的重要依據(jù)。最后,上線周期雖然不像2023年那樣,當(dāng)時“時間就是競爭力”的概念非常突出,但現(xiàn)在大客戶仍要求服務(wù)商能根據(jù)他們的特定配置需求(如網(wǎng)卡、內(nèi)存、組網(wǎng)、存儲等)進行快速調(diào)整和部署。

這種供大于求的局面,也讓一些中小型的算力服務(wù)商面臨嚴(yán)峻挑戰(zhàn)。他們多數(shù)是在前幾年風(fēng)口期入場,如今設(shè)備高價購入,卻只能低價出租,加上服務(wù)能力跟不上,很多都陷入困境,不得不轉(zhuǎn)讓設(shè)備。

從技術(shù)架構(gòu)的角度看,我認(rèn)為未來有幾個趨勢。首先,訓(xùn)練和推理之間芯片的界限正變得模糊。雖然理論上芯片有側(cè)重,但實際應(yīng)用中更多是考慮性價比。例如,英偉達(dá)的 H20 芯片,雖然是 H100 的“閹割版”,但因其獨特的顯存配置,被業(yè)界譽為“推理圣體”,在處理 DeepSeek 這類模型時表現(xiàn)卓越,性價比甚至高于 H100 或 H200 進行推理。

其次,未來計算中心將是多元異構(gòu)的。盡管在未來兩三年內(nèi),英偉達(dá)仍將占據(jù)主導(dǎo)地位,但國產(chǎn)芯片,如華為新發(fā)布的昇騰950,以及寒武紀(jì)、昆侖芯等,正迎來“百花齊放”的局面。新建的計算中心必須具備統(tǒng)一納管和調(diào)度包括英偉達(dá)和國產(chǎn)芯片在內(nèi)的多種算力資源的能力。

第三,一站式服務(wù)將成為重要方向。許多垂類行業(yè)的小型企業(yè),缺乏自行預(yù)訓(xùn)練大型模型的能力,他們更需要一個直接的結(jié)果。因此,計算中心需要提供“算力+平臺+開發(fā)服務(wù)”的整體解決方案,形成類似“AI工廠”的模式,幫助客戶基于開源模型進行微調(diào),實現(xiàn)特定場景的應(yīng)用。

最后,智能化運維將變得至關(guān)重要。目前H系列產(chǎn)品在高負(fù)載下故障率較高,維修通道不暢且成本昂貴,這催生了一個龐大的維修市場。未來的技術(shù)設(shè)計必須充分考慮運維需求,包括對溫濕度、故障率的監(jiān)控告警,以及處理時效性等。

在商業(yè)模式方面,也有明顯的轉(zhuǎn)變。簡單提供裸金屬租賃的模式已經(jīng)很難盈利,因為設(shè)備降價快、租金持續(xù)走低、閑置率居高不下。未來將轉(zhuǎn)向更精細(xì)化、靈活的計費方式,如按卡、按 PFLOPs 、按時長、按利用率,甚至按 TOKEN 進行租賃。同時,從原來的獨享模式轉(zhuǎn)向共享模式,以提升資源利用率和整體收益。

至于算力網(wǎng)的概念,我個人與黃總的看法一致,并不認(rèn)為簡單地將所有算力拉通就能解決效率問題。因為不同服務(wù)商的算力類型、規(guī)模、網(wǎng)絡(luò)帶寬、甚至應(yīng)用成熟度都差異巨大。算力網(wǎng)絡(luò)可以解決互聯(lián)互通,但無法彌補這種本質(zhì)上的能力差異。

余溢: 我也想說一下我對“算力網(wǎng)”的看法。我一直覺得這個概念在現(xiàn)階段更像是人為創(chuàng)造的。因為它目前無法做到讓不同型號的機器協(xié)同完成一個任務(wù)。你可以把同一型號的機器連在一起,讓它們共同完成一件事,但你不能把不同型號的機器連在一起,因為它們只能處理不同的任務(wù),無法形成一個統(tǒng)一的整體。

張春雨: 算力網(wǎng)這個理念是好的,未來,隨著分布式訓(xùn)練或推理技術(shù)的發(fā)展,當(dāng)網(wǎng)絡(luò)延遲不再是主要問題,并且調(diào)度層能夠屏蔽底層不同算力的差異時,我認(rèn)為實現(xiàn)這個目標(biāo)是有可能的。但就目前來看,僅靠接入一個網(wǎng)絡(luò)并不能徹底解決算力消納的問題,這在現(xiàn)階段還不太現(xiàn)實。

黃朝波: 卷創(chuàng)新、卷模式、卷資源整合

岑峰:聽了張總的解釋,我感覺現(xiàn)在的計算市場有點像十年前的云計算,大家都在思考如何更好地組織和調(diào)度算力,而不是簡單地堆砌資源。黃總,您之前曾提到,計算中心會經(jīng)歷一個“打時間差”的階段,最終會走向類似“綜合計算”的模式。剛才余總也提到,一些大廠會要求算力提供方提供標(biāo)準(zhǔn)化的服務(wù)。我想請教您,驅(qū)動這種“內(nèi)卷”的核心因素是什么?這種趨勢對于產(chǎn)業(yè)鏈,特別是中小企業(yè),又意味著什么?

黃朝波:首先,我更愿意用“綜合計算”來代替“通算”,因為它不僅涵蓋了通用的 CPU 計算,更將智算、超算、甚至是未來的量子計算和類腦計算都統(tǒng)籌進來。算力作為基礎(chǔ)設(shè)施,需要賦能千行百業(yè),這就決定了它必須是一個綜合計算的過程。

至于您提到的“內(nèi)卷”,其核心原因在于算力生產(chǎn)方的話語權(quán)較弱。智算中心只是最基礎(chǔ)的算力資源提供者,而云計算平臺會在這個基礎(chǔ)上進行多層增值,包括封裝成算力服務(wù)、模型和數(shù)據(jù),以及最終的業(yè)務(wù)解決方案。這些增值環(huán)節(jié)與業(yè)務(wù)結(jié)合緊密,利潤也更高。但同時,它們要求智算中心提供相對標(biāo)準(zhǔn)化的產(chǎn)品,這就導(dǎo)致智算中心在競爭中處于不利地位,大家只能通過價格來“內(nèi)卷”。

對于產(chǎn)業(yè)鏈上的中小企業(yè)來說,我認(rèn)為這既是挑戰(zhàn)也是機遇。許多企業(yè)目前的“內(nèi)卷”停留在低層次,比如拼價格、拼誰的毛利更低。我認(rèn)為我們應(yīng)該轉(zhuǎn)向更高層次的“內(nèi)卷”,去卷創(chuàng)新、卷模式、卷資源整合。

同時,很多中小企業(yè)都試圖進行“垂直整合”,從底層算力到上層應(yīng)用全鏈條都自己搞定。實際上,這種模式只有大廠才有能力做到。對于中小企業(yè)而言,更明智的做法是聚焦。在軟硬件堆棧的某個薄弱環(huán)節(jié)上,將其做到極致,然后把規(guī)模做大,這可能是提升競爭力的關(guān)鍵。

岑峰: 剛才三位都提到了,未來長期來看算力會變得更加充裕,而如何提供差異化服務(wù)來獲得客戶會成為關(guān)鍵。我想請教黃總,在未來的計算產(chǎn)業(yè)鏈中,誰會占據(jù)更好的生態(tài)位?是掌握算力資源的計算中心,還是掌握算法和模型的廠商,又或者是掌握應(yīng)用和客戶的第三方服務(wù)商?

黃朝波: 我認(rèn)為首先可以排除智算中心。它位于產(chǎn)業(yè)鏈最上游,難以控制局面,只能深陷價格戰(zhàn),而且屬于重資產(chǎn)投入,可能更適合政府、央企和國企來做。

至于模型、算法廠商和掌握應(yīng)用、客戶的第三方服務(wù)商,我認(rèn)為最終有價值的形態(tài)會介于兩者之間。模型和算法本身只是工具,它必須落地到具體的行業(yè)和業(yè)務(wù)場景中才能產(chǎn)生價值。所以,模型公司最終一定會聚焦在自己更擅長、更有客戶資源的特定行業(yè)和場景。

而對于掌握應(yīng)用和客戶的第三方企業(yè)來說,面向普通消費者的(To C)市場競爭激烈,很難形成差異化。而面向企業(yè)的(To B)市場則會面臨大量定制化需求,如果只是停留在上層應(yīng)用,很容易變得業(yè)務(wù)分散,營收也難以做大。

所以,無論是從模型算法廠商,還是從應(yīng)用服務(wù)商,最終都會向中間靠攏,形成一種面向特定行業(yè)和特定場景的解決方案提供商。這種形態(tài)融合了模型算法的能力和應(yīng)用落地的經(jīng)驗,從而在產(chǎn)業(yè)鏈中占據(jù)更有價值的生態(tài)位。

岑峰:黃總剛才提到了“綜合計算”這個概念,因為未來的各行各業(yè)都會有相應(yīng)的計算需求。您認(rèn)為對于想進入計算賽道的玩家來說,是建立服務(wù)各行各業(yè)的綜合計算能力更重要,還是專注于某個領(lǐng)域做精做專更重要?

黃朝波:我認(rèn)為,現(xiàn)在再花大力氣去做那些基礎(chǔ)的智算建設(shè),意義已經(jīng)不大了。因為大廠在這方面已經(jīng)做得非常成熟,我們很難超越。

對于中小企業(yè)來說,真正的機會在于聚焦在業(yè)務(wù)賦能和場景賦能上,也就是我們常說的“最后一公里”或“最后五公里”。換句話說,就是去做行業(yè)專屬云或領(lǐng)域?qū)僭啤?/p>

至于這些企業(yè)如何獲取 MaaS、PaaS、IaaS 等基礎(chǔ)服務(wù)能力,我認(rèn)為有兩種方式:一是自己投入研發(fā);二是與像我們這樣的廠商合作。我們會提供底層能力,讓他們能夠?qū)W⒂跇I(yè)務(wù)場景的賦能。這樣做不僅能降低成本,還能幫助他們快速聚焦在核心價值上。在 AI 快速發(fā)展的背景下,底層的技術(shù)各家都是重復(fù)的,沒必要自己去面面俱到,把精力集中在最能創(chuàng)造價值的環(huán)節(jié),才是中小企業(yè)的生存之道。


03

破局:企業(yè)路徑與實踐

岑峰:我們剛才討論了市場的挑戰(zhàn),現(xiàn)在我想把話題拉回到各位嘉賓所在的企業(yè)。接下來,請三位分享一下,在各自的領(lǐng)域,你們是如何定義和構(gòu)建自己的破局路徑的?最好能結(jié)合公司正在做的具體實踐來談一談。

余溢: 我們善思的 AGI 業(yè)務(wù),核心概念是“AI+行業(yè)”。雖然我們團隊規(guī)模很小,但項目覆蓋 B端、G端 和 C端,做得事情還挺多的。

我們認(rèn)為,未來的 AI 應(yīng)用應(yīng)該聚焦在很垂直、很細(xì)分的領(lǐng)域。我們的方法論是讓專業(yè)的人做專業(yè)的事:我們只負(fù)責(zé)技術(shù),然后深度綁定行業(yè)內(nèi)的合作伙伴。他們有充足的行業(yè)知識、痛點和數(shù)據(jù),而我們則提供技術(shù)能力,共同開發(fā)垂類應(yīng)用,真正把這個行業(yè)的需求吃透。

舉個例子,我們做了一款叫做“直播 AI 中控”的應(yīng)用。它能用 AI 替代直播間里除了主播以外的所有人工,幫助品牌方在不影響 GMV 的情況下,大幅節(jié)省人力成本。一個直播間的中控人員一個月成本可能就要上萬,一年就是幾十萬。我們的產(chǎn)品就是為他們節(jié)省了這筆開支,甚至提供了很多小工具來提高整體運營效率。

再比如為政企類客戶做會議紀(jì)要產(chǎn)品時,我們通過技術(shù)與體驗的結(jié)合讓工具更好用:服務(wù)上,支持租賃式內(nèi)網(wǎng)部署,滿足安全性、合規(guī)性要求;技術(shù)上,融合語音識別、語義分析、歷史文件調(diào)用、上下文理解、本地知識庫對接等多模型能力;交互上,打造類 Agent 的便捷操作界面,貼合客戶日常使用習(xí)慣 —— 讓模型從 “難用的技術(shù)” 變成 “順手的工具”。

在這里,我們并不追求使用多高級的大模型,而是始終把為客戶交付真實價值放在首位。大模型只是我們眾多技術(shù)手段中的一個工具。在那個直播項目中,我們用到了傳統(tǒng)的算法、機器學(xué)習(xí)模型、Transformer 大模型,還有網(wǎng)絡(luò)、視頻流等技術(shù)。而且作為應(yīng)用方,我們也在盡量減少算力成本,通過云邊結(jié)合,甚至本地計算來提高效率、減少延遲,我覺得這也會是未來 AI 應(yīng)用的一個趨勢。

最后,我想說,現(xiàn)在對于我們這種做AI應(yīng)用的小公司來說,是一個絕佳的機會。大廠擅長做基礎(chǔ)模型和大賽道,但他們既不愿意也做不好那些像“毛細(xì)血管”一樣細(xì)分的垂直領(lǐng)域。因為大廠人力成本高、考核周期短,很難為一個小眾市場投入巨大的精力。這就給了我們這些創(chuàng)業(yè)企業(yè)很好的生存空間。我認(rèn)為,現(xiàn)在最大的挑戰(zhàn)是懂業(yè)務(wù)的人不懂技術(shù),懂技術(shù)的人不懂業(yè)務(wù)。我們做的,就是找到這個平衡點,通過和客戶深度綁定,確保技術(shù)能真正落地,解決實際問題。

岑峰:余總強調(diào)了解決客戶的實際問題,特別是如何幫助技術(shù)和人手都不足的創(chuàng)業(yè)公司破局。我想請教張總,超云是如何看待當(dāng)前的機會,以及未來有什么樣的發(fā)展方向?

張春雨:我們專注于算力設(shè)備。前兩年,超云就制定了“All in AI 和 AI in All ”的戰(zhàn)略,意味著我們所有的重要業(yè)務(wù)都圍繞著AI展開。

在產(chǎn)品方面,我們目前主要聚焦推理??蛻粼谶x擇推理整機時最關(guān)心的就是性價比和高可靠性。舉個例子,市面上有些消費級顯卡,比如 RTX 4090,在跑一些大語言模型時還好,但如果處理多模態(tài)任務(wù),因為超頻和散熱問題,很容易出現(xiàn)“掉卡”現(xiàn)象,穩(wěn)定性很差。我們就是要幫客戶解決這些痛點,提供價格合理、可靠性高,并且能批量交付的產(chǎn)品。

在方案方面,很多客戶都問我們,同樣是賣一款產(chǎn)品,為什么選擇我們。我的回答很簡單,因為我們在這個行業(yè)里服務(wù)了大量客戶,深知在什么場景下該用什么樣的卡,搭配什么樣的內(nèi)存和硬盤。是選擇直通模式還是 PCIe 版本,我們都做了大量的驗證。我們不直接做應(yīng)用,但我們的優(yōu)勢就在于,能為客戶提供匹配特定場景的最佳方案。我們有專業(yè)的方案團隊,負(fù)責(zé)幫助客戶進行推理方案的設(shè)計,包括組網(wǎng)、存儲搭配以及整體調(diào)優(yōu)。

我們很清楚自己的定位。超云不會去做垂直應(yīng)用,而是專注于產(chǎn)品和方案。我印象特別深刻的是,我們很多成功的項目都離不開生態(tài)伙伴的合作。我們提供一體機這樣的硬件和平臺,而生態(tài)伙伴則負(fù)責(zé)解決客戶實際的應(yīng)用落地問題。正如余總所說,如果只是單純賣機器,客戶可能根本不知道怎么用,結(jié)果當(dāng)然是不太順利的。賣設(shè)備不是終點,最終還是要看它能不能真正用起來。

現(xiàn)在我們有了更清晰的思路。我會明確告訴客戶,我們的一體機能提供到什么程度:硬件、平臺,外加一個低代碼開發(fā)工具。這樣客戶自己就可以做一些簡單的應(yīng)用,比如知識問答。但如果他們有更復(fù)雜的應(yīng)用場景,比如在教育、醫(yī)療或金融等領(lǐng)域,我們就會匹配相應(yīng)的生態(tài)伙伴。這種邊界清晰的合作模式,能讓我們專注于自己的核心優(yōu)勢,同時確保客戶的實際需求得到滿足,避免我們陷入那些“苦活、累活”中。

余溢: 張總說得太對了。這就是我們行業(yè)從業(yè)者的共同感受。要讓一體機真正發(fā)揮作用,關(guān)鍵在于生態(tài)伙伴,他們能結(jié)合客戶實際需求,提供終端應(yīng)用服務(wù)。如果只是純粹賣機器,這東西到客戶手里,可能就用不起來。

張春雨: 沒錯。這就是為什么我們現(xiàn)在這么幸運,有合作伙伴愿意去做這些“臟活、苦活、累活”,而我們則能專注于提供底層的、更標(biāo)準(zhǔn)化的產(chǎn)品和服務(wù)。岑峰:黃總,面對當(dāng)前的新局面,您打算采取哪些方式來“做大做強”?

黃朝波:其實我個人對“一體機”這種模式一直不太看好,我覺得它只是一個階段性的產(chǎn)物。我更喜歡從終局來思考:未來三五年,市場最終會走向哪里?從公有云的發(fā)展歷史來看,它最終會統(tǒng)一一切,而一體機比私有云還要更“私有化”,從長期看,它必然會回歸到公有云加混合云的模式。

一體機模式面臨一個巨大的挑戰(zhàn):軟件工作量非常大,而且現(xiàn)在的 AI 工程師很昂貴,但客戶又不舍得為軟件付費,這導(dǎo)致用戶體驗很差,形成惡性循環(huán)。因此,我們的觀點依然是,要回歸到大規(guī)模運營,通過公共云模式來分?jǐn)傑浖杀尽?/p>


04

下一個關(guān)鍵變量

岑峰:我們注意到,大模型已經(jīng)進入下半場,是以應(yīng)用為導(dǎo)向的。剛才幾位嘉賓也聊了很多。未來,如果像自動駕駛、行業(yè)大模型等各種應(yīng)用爆發(fā),會對計算市場產(chǎn)生哪些顛覆性的影響?三位嘉賓又如何判斷,下一個能影響計算市場生存法則的關(guān)鍵變量是什么?

黃朝波:好的,我先簡單談?wù)勎业目捶?。從技術(shù)架構(gòu)來看,未來最大的變化是云邊端一體化?,F(xiàn)在,英偉達(dá)的芯片架構(gòu)在數(shù)據(jù)中心和終端設(shè)備上是一樣的,只是規(guī)格大小不同。由于終端算力有限,一些計算任務(wù)必須放到邊緣甚至云端去完成。對于自動駕駛這樣對算力要求極高的應(yīng)用來說,云邊端一體化是必然趨勢。

要實現(xiàn)這個目標(biāo),對技術(shù)要求非常高,包括底層的網(wǎng)絡(luò)、多集群管理、跨集群調(diào)度以及上層業(yè)務(wù)的微服務(wù)重構(gòu)等,這是一個非常復(fù)雜但前景廣闊的領(lǐng)域。一旦成功,就意味著每輛車都需要海量的算力,我們現(xiàn)在建設(shè)的算力將遠(yuǎn)遠(yuǎn)不夠。因此,未來要想真正推動智算發(fā)展,必須重點關(guān)注并投入到這些對算力需求特別大的場景中去。

至于誰將掌握話語權(quán),我的觀點依然是:以終為始。最終的結(jié)局是算力必然過剩,這是不可避免的。算力廠商很難再像現(xiàn)在這樣擁有絕對的話語權(quán),因為英偉達(dá)目前的地位是特定時期的產(chǎn)物。從長期來看,誰掌握了業(yè)務(wù),誰就掌握了一切。當(dāng)然,業(yè)務(wù)是碎片化的,所以最終掌握話語權(quán)的,是那些能將技術(shù)賦能到具體業(yè)務(wù)場景的平臺。核心還是回到平臺本身。

岑峰:張總,您怎么看黃總關(guān)于“平臺”和“業(yè)務(wù)賦能”的觀點?您會怎么看影響計算市場的一個關(guān)鍵變量?

張春雨:黃總在這方面見解很獨到,我完全認(rèn)同。我個人認(rèn)為,要說影響計算市場的下一個關(guān)鍵變量,還是“需求為王”。

不管是2023年的供不應(yīng)求,還是現(xiàn)在的供大于求,甚至是未來誰將占據(jù)主導(dǎo),都取決于需求。我覺得,未來真正的變化,會來源于現(xiàn)象級應(yīng)用的爆發(fā)。我們現(xiàn)在用的豆包等應(yīng)用,對算力的消耗還比較平穩(wěn),但一旦多模態(tài)的推理需求爆發(fā)出來,對算力的需求將呈指數(shù)級增長。

就在昨天,我參加一個客戶沙龍,有個客戶是做多模態(tài)視頻推理的。他告訴我,處理海量視頻數(shù)據(jù),對顯存和算力的要求是以百萬臺 H20 為單位起步的。這個規(guī)模聽起來非常驚人,也預(yù)示著未來真正的市場大變局,一定會由這種現(xiàn)象級的多模態(tài)應(yīng)用來驅(qū)動。

岑峰:張總剛才提到了現(xiàn)象級應(yīng)用,那余總作為應(yīng)用領(lǐng)域的專家,您認(rèn)為哪些方向可能會產(chǎn)生這樣的現(xiàn)象級應(yīng)用呢?

余溢:這個問題嘛,我只能憑感覺說了,因為我們公司做的都是些小眾的長尾賽道,專門避開那些大風(fēng)口。

不過我非常認(rèn)同張總說的多模態(tài),這應(yīng)該是個共識。像語音、視頻這類應(yīng)用,本身對算力的消耗就非常巨大,一旦爆發(fā),對算力市場的沖擊會是現(xiàn)象級的。

另外,我特別看好細(xì)分賽道里的 AI Agent。這些 Agent 需要處理多個任務(wù)來最終得到一個結(jié)果,它的運行邏輯就像是一個閉環(huán)。只要中間一步出錯,整個流程就得重新跑,所以對算力的消耗也相當(dāng)可觀。我覺得未來很可能會出現(xiàn)一些在特定細(xì)分領(lǐng)域,能處理復(fù)雜多任務(wù)的現(xiàn)象級 Agent 應(yīng)用。

還有一個方向是 AI 智能硬件。我們公司自己就在做 AI 玩具,這類產(chǎn)品需要處理實時的音視頻流,對即時響應(yīng)的要求特別高。比如情感陪伴類的硬件,像國內(nèi)的“芙崽”和海外的 Ropet,一旦規(guī)模起來,對算力的需求會很驚人?,F(xiàn)在很多這類產(chǎn)品用戶體驗不好,就是因為算力跟不上。我做了之后就發(fā)現(xiàn),它們確實非常缺算力,但因為成本高,大家在這方面投入得還不夠。隨著算力成本的下降和技術(shù)的成熟,智能硬件也會成為現(xiàn)象級應(yīng)用的一個重要載體。

所以總的來說,我認(rèn)為多模態(tài)、Agent 和智能硬件這些細(xì)分領(lǐng)域會是未來的大機會。它們雖然不像大模型那樣光鮮亮麗,但卻能解決實際痛點,并且一旦規(guī)?;瑢λ懔Φ男枨髸尸F(xiàn)爆炸式增長,從而顛覆整個計算市場。

岑峰:那您認(rèn)為當(dāng)前 AI 應(yīng)用市場的最大機遇和挑戰(zhàn)是什么?對于創(chuàng)業(yè)者來說,如何構(gòu)建自己的核心競爭力,來避免陷入同質(zhì)化的競爭?

余溢:我認(rèn)為,機遇和挑戰(zhàn)其實是硬幣的兩面,要構(gòu)建核心競爭力,我個人有幾個建議:

第一,要解決真需求,必須是客戶真正需要、愿意付費的業(yè)務(wù)場景。我們不能憑空想象,而要從實際痛點出發(fā)。

第二,你的團隊要具備相應(yīng)的能力。這不只是技術(shù)能力,還包括對業(yè)務(wù)的深刻理解和資源整合能力。創(chuàng)業(yè)公司不能像大廠那樣什么都做,必須專注于自己擅長的事,把精力用在刀刃上。

第三,要避開大廠主攻的領(lǐng)域,因為他們的資源優(yōu)勢太明顯。我們應(yīng)該選擇那些大廠看不上、不愿意做的細(xì)分賽道,也就是我們常說的“長尾市場”。

最后,我想強調(diào)一點,很多人以為技術(shù)是唯一的護城河,但我認(rèn)為它可能不是最重要的競爭力。因為大廠會不斷開源基礎(chǔ)模型,技術(shù)能力很快就會被拉平。真正的壁壘在于數(shù)據(jù)。AI 時代和之前的互聯(lián)網(wǎng)時代不同,復(fù)制一個產(chǎn)品沒那么容易了。一旦你率先進入市場,快速積累了用戶和數(shù)據(jù),就形成了一個強大的數(shù)據(jù)壁壘,讓后來者很難追趕。

說到底,現(xiàn)在的機遇和挑戰(zhàn)其實是一體兩面。機遇在于基礎(chǔ)模型已經(jīng)成熟、成本低廉,外部環(huán)境也已準(zhǔn)備就緒。很多人說晚了,我反而覺得不晚,真正的應(yīng)用爆發(fā)潮可能要到今年底或明年初。而挑戰(zhàn)也隨之而來。創(chuàng)業(yè)者必須選好自己能做、能把得住的賽道,踏踏實實地去深挖,而不是光停留在商業(yè)計劃書上。

岑峰:剛才余總從需求端談了如何為客戶創(chuàng)造價值,我想請教張總,從供給端來看,未來的計算中心運營模式會發(fā)生哪些變化?計算中心又該如何為客戶提升價值呢?

張春雨:我認(rèn)為從供給端來看,未來計算中心的運營模式一定會向“易取易用”和更貼近應(yīng)用的方向發(fā)展。

首先,我們會從單一的裸金屬租賃,轉(zhuǎn)向更加多元化的服務(wù)模式。這個多元化體現(xiàn)在兩方面:第一是使用方式上的靈活。我們不再只賣算力,而是提供各種套餐。比如,客戶可以根據(jù)需求選擇就近部署,或者選擇性價比更高的方案,甚至根據(jù)芯片類型(國產(chǎn)還是英偉達(dá))來做選擇。對一些學(xué)校來說,他們可能只需要短期使用兩三個月,那就可以選擇靈活的套餐,而不需要獨占整個設(shè)備。

第二是提供增值服務(wù)。我認(rèn)為可以分為兩種模式:

第一種模式我稱之為“AI工廠”模式,這是一種更高級的交付模式。我們不只提供“廚房”,而是能直接“端菜”,根據(jù)客戶的場景和預(yù)算,提供預(yù)訓(xùn)練或微調(diào)等服務(wù),幫助他們直接拿到想要的結(jié)果。

另一種模式是“AI商店”模式:這是一個更深層次的模式,我們不再是賣算力或Token,而是幫助客戶提升他們的 KPI 。比如,客戶可能希望通過我們的解決方案來“降低人力投入”或“提升效率”。我們提供的價值不再是簡單的算力,而是實實在在的降本增效。

當(dāng)然,這些增值服務(wù)不是任何一家公司能單獨完成的。超云的優(yōu)勢在于提供設(shè)備和平臺,但要構(gòu)建一個完整的體系,我們必須和像余總、黃總這樣的公司合作,才能真正為客戶提供完整的解決方案。

岑峰:黃總,矩向科技正在將算力供給、平臺和應(yīng)用消費這幾個環(huán)節(jié)串聯(lián)起來。您認(rèn)為這種模式如何幫助中小服務(wù)商在激烈的競爭中找到新的生存空間,并實現(xiàn)可持續(xù)發(fā)展?

黃朝波:這是一個非常好的問題,也是我們一直在深入思考的方向。我想先用芯片行業(yè)的一個現(xiàn)象來做類比:

上世紀(jì)80年代,英特爾非常強大,它既做芯片設(shè)計,又做芯片制造。當(dāng)時大家都覺得英特爾是不可戰(zhàn)勝的。但到了1988年,臺積電成立,專注于重資產(chǎn)的制造;1990年,Arm 成立,專注于技術(shù)賦能。緊接著,涌現(xiàn)出大量無晶圓廠的(fabless)芯片設(shè)計公司,其中的佼佼者就是英偉達(dá)、高通、博通,還有我的老東家Marvell。

我們對比一下現(xiàn)在的市值:英特爾市值1000多億,而英偉達(dá)市值一度超過4萬億,差不多是英特爾的三十到四十倍。這個例子說明,當(dāng)產(chǎn)業(yè)進行分工之后,每個企業(yè)都可以輕裝上陣,聚焦在自己最擅長的創(chuàng)新能力上,而其他的資源都可以輕松獲取。這就是產(chǎn)業(yè)分工的巨大價值。

回到算力這個事情上,智算的出現(xiàn)給了大家機會,但時間窗口并不長。我認(rèn)為,我們可以按照芯片行業(yè)的模式對智算產(chǎn)業(yè)進行分工,智算中心專注于重資產(chǎn)的算力提供,智算云:專注于業(yè)務(wù)賦能、客戶和市場營銷,技術(shù)賦能方比如我們矩向?qū)W⒂谔峁┘夹g(shù)支持,眾多經(jīng)銷商和最終客戶專注于業(yè)務(wù)落地。

大家合力構(gòu)建一個開放、分工協(xié)作的生態(tài),很多企業(yè)現(xiàn)在都在努力,但往往是孤軍奮戰(zhàn),努力的成果也像孤島一樣難以為繼。我們建議,未來需要有一個開放式的全新產(chǎn)業(yè)鏈,讓數(shù)千家公司共同參與進來。每個企業(yè)做好自己的事情,通過創(chuàng)新脫穎而出,最終實現(xiàn)共同的成長和收益。


05

QA

岑峰: 接下來,我們來回答一些觀眾的問題。有觀眾提問說,不同型號的服務(wù)器現(xiàn)在無法“歸同”,想問一下這個研發(fā)難度大嗎?這會是一個新的機會嗎?這個問題似乎張總來回答比較合適。

張春雨:這位觀眾的用詞可能不是特別準(zhǔn)確,他說的“歸同”應(yīng)該是指統(tǒng)一納管、統(tǒng)一管理和統(tǒng)一調(diào)度。

我認(rèn)為可以從三個層面來看,首先是統(tǒng)一管理和運維, 這是最基礎(chǔ)的層面。服務(wù)器和 PC 不同,它需要規(guī)模化部署和運維。目前,市面上已經(jīng)有很多第三方軟件可以做到這一點,比如對幾百甚至上千臺不同服務(wù)器進行統(tǒng)一的地址分配和系統(tǒng)安裝。這部分的技術(shù)難度不大,也已經(jīng)有很多成熟的解決方案。

統(tǒng)一資源調(diào)度這部分難度會高一些,服務(wù)器種類很多,有通用服務(wù)器、GPU 服務(wù)器、國產(chǎn)服務(wù)器等等?,F(xiàn)在,單一的平臺已經(jīng)能夠做到基本的資源調(diào)度,比如將不同類型的設(shè)備歸到一個組里,進行統(tǒng)一管理,這也是沒問題的。

最后是異構(gòu)算力整合,這是目前難度最大、也最具有挑戰(zhàn)性的領(lǐng)域。簡單來說,就是把不同架構(gòu)、不同品牌的算力整合起來,實現(xiàn)統(tǒng)一調(diào)度。比如說,當(dāng)一個訓(xùn)練任務(wù)來了,平臺可以根據(jù)算力閑置情況,優(yōu)先分配給英偉達(dá)的 GPU,如果英偉達(dá)的算力跑滿了,再自動切換到國產(chǎn)算力。目前,北京有很多公司正在攻克這個難題。雖然很難,但并非完全無解。通常,只要設(shè)備不是特別小眾,都可以通過引入第三方服務(wù)來解決,但需要為此支付額外的費用。所以,這的確是一個機會,但它需要一定的技術(shù)投入和成本。

余溢: 對,張總剛才說到那個異構(gòu)算力的問題,我就一直覺得這個概念挺有意思的。如果我的理解沒錯,目前的技術(shù)還無法真正做到“歸同”。也就是說,你沒辦法讓一個任務(wù)同時在 NVIDIA 和另一個品牌的顯卡上協(xié)同工作。如果強行這么做,結(jié)果會是以最慢的那個為準(zhǔn),你快的那部分先算完了,也得等著慢的那部分,整個任務(wù)最終的速度是由最慢的那個來決定的。所以,這種方式在AI訓(xùn)練場景下,效率是完全無法保證的。

張春雨: 是的,沒錯,這個技術(shù)現(xiàn)在確實還不太成熟。我也接觸過很多客戶,他們也都在問這個問題。我覺得這塊還是得讓黃總來解釋,他才是最專業(yè)的。

黃朝波: 因為我以前做芯片的,我可以稍微解釋一下。行業(yè)里有個專業(yè)術(shù)語叫“多元異構(gòu)”,指的就是這個問題。我的結(jié)論很簡單:多元異構(gòu)在推理場景下可以,但在訓(xùn)練場景下最好別這么做。

為什么呢?因為我們做訓(xùn)練時,是集群計算。同一個計算任務(wù),最好在同一種架構(gòu)上跑。計算的過程中,我們不知道會遇到多少復(fù)雜問題,所以盡量把問題簡化。而在訓(xùn)練場景下,不同架構(gòu)硬是湊在一起,只會讓問題變得更復(fù)雜,最終可能導(dǎo)致訓(xùn)練失敗,反而降低了效率。

所以,正確的做法是,我們做的多元異構(gòu)調(diào)度,不是讓同一個任務(wù)去跑在不同的架構(gòu)上,我們的異構(gòu)調(diào)度指的是不同任務(wù)在調(diào)度時被分配到不同的地方,僅此而已。同一個計算任務(wù),不能多元。

岑峰: 對,幾位嘉賓剛才的解答非常透徹,也讓我們更清楚地認(rèn)識到,客戶對這個領(lǐng)域的認(rèn)知還需要一個逐步加深的過程,這場對話讓我們對智算市場的現(xiàn)狀和未來有了更清晰的理解。

最后,我想請三位嘉賓各自用一句話做個總結(jié),對智算市場的未來進行展望,或者給正在這個賽道上的企業(yè)和個人一些建議。

余溢: 謝謝主持人。我的總結(jié)是,我對未來市場非常有信心。

首先,我認(rèn)為整個 AI 市場未來會分流和分層,變得更專業(yè)化。頭部企業(yè)會繼續(xù)深耕頭部市場,而中小企業(yè)和創(chuàng)業(yè)者則會專注長尾市場。每個團隊都能找到自己的生態(tài)位,各司其職,競爭格局也會因此變得更清晰。

其次,我堅信,真正的 AI 應(yīng)用爆發(fā)期就在未來一年內(nèi)。應(yīng)用的爆發(fā)會帶動整個行業(yè)生態(tài)一起進步,而技術(shù)的每一次更新,也都會推動整個行業(yè)向前發(fā)展。

張春雨: 我的看法跟余總很相似。首先,前不久國務(wù)院發(fā)布的“人工智能+”政策,我相信它會像當(dāng)年的“互聯(lián)網(wǎng)+”一樣,甚至潛力更大。根據(jù)我十幾年的行業(yè)經(jīng)驗,我預(yù)測未來5到10年,算力市場依然會保持非常高的增速。

另外,從從業(yè)者的角度看,不管是做芯片、整機、平臺還是應(yīng)用,只要我們能深耕和聚焦,就一定會有所收獲。

黃朝波: 我總結(jié)三點吧。第一,我們認(rèn)為現(xiàn)在這種算力調(diào)度和轉(zhuǎn)售業(yè)務(wù)可能只是一個臨時狀態(tài),未來必然會走向消亡。

第二,智算云才是未來。我們推斷,未來的智算云市場可能會呈現(xiàn)“三七開”的局面,即70%的市場由巨頭主導(dǎo),另外30%則由專業(yè)的輕量化廠商來占據(jù)。這些廠商將更專注于創(chuàng)新,以地域或行業(yè)為特色,更容易實現(xiàn)快速迭代和演進。

第三,我想特別提到國務(wù)院的 AI 政策,里面有一個詞引起了我的關(guān)注:“AI原生”。它和“AI+”是完全不同的概念?!癆I+”是 AI 賦能現(xiàn)有業(yè)務(wù),而“AI原生”意味著要推倒重來,重新構(gòu)建業(yè)務(wù)、場景和服務(wù)體系。這給了我們很多啟發(fā),也希望未來能有更多朋友一起討論。

岑峰: 感謝三位嘉賓的精彩分享。今天由于時間關(guān)系,我們的線上圓桌就暫時到這里了。就像大家所說,這個領(lǐng)域變化非常快,所以我們也會和嘉賓們保持密切溝通。再次感謝三位嘉賓和所有觀眾的參與。


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說