丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給朱可軒
發(fā)送

0

國產(chǎn) AI Infra 變革進(jìn)行時(shí):新勢力正在崛起

本文作者: 朱可軒   2025-03-10 10:02
導(dǎo)語:DeepSeek 方法論重構(gòu) AI 基礎(chǔ)設(shè)施,驛心科技實(shí)現(xiàn) AI Infra 軟硬整合架構(gòu)突破。

作者丨朱可軒

編輯丨陳彩嫻

近日,“源神”Deepseek 密集開源了一系列代碼庫,包括FlashMLA、DeepEP、DeepGEMM、DualPipe 等項(xiàng)目及 3FS 系統(tǒng),幾乎實(shí)現(xiàn)了對 AI Infra 底層計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)的全覆蓋式優(yōu)化,這對于 AI Infra 而言也能提供許多有價(jià)值的參考。

當(dāng)前,國內(nèi) AI Infra 領(lǐng)域公司圍繞 DeepSeek 帶來的一系列啟發(fā),也正在思考下一步大模型訓(xùn)推優(yōu)化更好的解決方案,驛心科技便是其中之一。

上周 DeepSeek 開源 3FS 等一系列組件,充分說明了從存儲(chǔ)到網(wǎng)絡(luò)往 GPU 里面?zhèn)鬏敂?shù)據(jù)的能力是 AI 訓(xùn)練和推理中最重要的問題,這也正是驛心科技想解決的核心技術(shù)問題。

國產(chǎn) AI Infra 變革進(jìn)行時(shí):新勢力正在崛起

據(jù)了解,驛心科技于 2023 年 9 月由前曠視科技創(chuàng)始合伙人吳文昊成立,致力于從基礎(chǔ)架構(gòu)做研發(fā),基于 GPU 服務(wù)器本地存儲(chǔ)與通用以太網(wǎng)絡(luò),提供與傳統(tǒng)智算基于 RDMA 的存儲(chǔ)網(wǎng)絡(luò)、單獨(dú)部署商業(yè)訓(xùn)練存儲(chǔ)同等的能力,大幅降低模型落地成本與加速部署,方便后續(xù)在 DeepSeek 等通用模型層面做優(yōu)化,加速模型的運(yùn)行效率。

值得注意的是,驛心所用的硬件完全是使用標(biāo)準(zhǔn)企業(yè)服務(wù)器以及標(biāo)準(zhǔn)網(wǎng)絡(luò),不需要任何的定制硬件、網(wǎng)絡(luò)和軟件。相比之下,過去 AI Infra 部署使用的傳統(tǒng)高性能文件存儲(chǔ)往往需要使用定制硬件服務(wù)器,特定網(wǎng)絡(luò)交換,以及定制的操作系統(tǒng)內(nèi)核和客戶端。

換言之,驛心所提出的 AI Infra 整體解決方案效率更高、性價(jià)比更高。


重構(gòu)之下的新機(jī)會(huì)

在常規(guī)視野中,AI Infra 包含供應(yīng)鏈和云兩層,但經(jīng)過兩年的 AGI 技術(shù)躍進(jìn),大模型逐漸成為基礎(chǔ)設(shè)施的趨勢已然明朗,許多觀點(diǎn)認(rèn)為模型甚至可能成為新的“OS”。

而在此之中,架構(gòu)重構(gòu)和供應(yīng)鏈重構(gòu)為 AI Infra 帶來了創(chuàng)業(yè)空間。

架構(gòu)方面,HPC、云和 AI 所需要的 Infra 均存在差異。首先,云的計(jì)算、網(wǎng)絡(luò)和存儲(chǔ)并非專門為 AI 或者 HPC 設(shè)計(jì)優(yōu)化的,當(dāng)中的不匹配會(huì)帶來價(jià)值差:云圍繞網(wǎng)絡(luò)而生,通過 CPU、網(wǎng)絡(luò)、存儲(chǔ)資源的超賣解決利潤問題,不能超賣則沒有利潤來源。

隨著 AI Infra 的大規(guī)模興起,這個(gè)價(jià)值點(diǎn)已經(jīng)被重構(gòu)了,因?yàn)?AI Infra 以 GPU 為中心,基于此,云大廠很難提供最為優(yōu)化的底層 Infra,因?yàn)槠溥€需要照顧到自身云原生應(yīng)用的 Infra 需求。

此外,AI 雖然從 HPC 孵化而來,二者也都追求千卡萬卡的規(guī)模,但從計(jì)算范式上看存在差距:本質(zhì)在于 HPC 聚焦于做仿真、模擬世界的運(yùn)行,追求確定性,需要高精度計(jì)算,而 AI 追求概率,需要的是 next token 夠準(zhǔn)確。

除技術(shù)架構(gòu)外,國內(nèi)芯片供應(yīng)鏈重構(gòu)也正在催生巨大的 AI Infra 機(jī)會(huì),DeepSeek 無疑進(jìn)一步推動(dòng)了重構(gòu)的發(fā)生。

在重構(gòu)發(fā)生的同時(shí),算力設(shè)備、能耗、機(jī)房空間和資金四大瓶頸也限制了 AI 算力的發(fā)展。對此,驛心依托 GPU 服務(wù)器本地存儲(chǔ)與通用以太網(wǎng)絡(luò),構(gòu)建了一套獨(dú)具優(yōu)勢的一體化解決方案:

國產(chǎn) AI Infra 變革進(jìn)行時(shí):新勢力正在崛起

Tier 0 ← Tier 1

首先是 AI 集群一體化方案技術(shù)創(chuàng)新:驛心的 Tier-0 存儲(chǔ)方案能有效利用 GPU 服務(wù)器內(nèi)部存儲(chǔ),在搭建AI基礎(chǔ)集群設(shè)施時(shí),不需要再構(gòu)建專屬的存儲(chǔ)集群以及存儲(chǔ)網(wǎng)絡(luò),大幅削減了模型落地成本,顯著加速了部署進(jìn)程。

這不僅為企業(yè)和科研機(jī)構(gòu)減輕了經(jīng)濟(jì)負(fù)擔(dān),更讓先進(jìn)的人工智能模型能夠以更快的速度從理論走向?qū)嵺`,賦能千行百業(yè)。

其次在 AI 存儲(chǔ)層面,驛心科技能支持多云多數(shù)據(jù)中心的全局文件系統(tǒng)(Global Namespace),讓大模型的上載與更新完全無縫進(jìn)行,提供統(tǒng)一的存儲(chǔ)管理,讓 AI 數(shù)據(jù)訪問更高效。

不僅能夠支持傳統(tǒng)的文件和對象存儲(chǔ),也能利用好 DeepSeek 剛剛開源的 3FS 并行文件系統(tǒng);具備智能的數(shù)據(jù)分層和緩存機(jī)制,可快速響應(yīng) AI 工作負(fù)載對數(shù)據(jù)的需求,提升訓(xùn)練和推理速度;有強(qiáng)大的數(shù)據(jù)安全與保護(hù)功能,保障 AI 數(shù)據(jù)的完整性和機(jī)密性;還能靈活擴(kuò)展,輕松應(yīng)對 AI 項(xiàng)目中不斷增長的數(shù)據(jù)量需求。

在模型優(yōu)化層面,驛心科技立足前沿,積極布局和擁抱開源生態(tài)。其解決方案為后續(xù)在 DeepSeek 等通用模型的優(yōu)化工作提供了堅(jiān)實(shí)基礎(chǔ),能夠深度挖掘模型潛力,全方位加速模型運(yùn)行效率,讓人工智能真正做到快而準(zhǔn),助力客戶在瞬息萬變的市場競爭中搶占先機(jī),引領(lǐng)行業(yè)發(fā)展新潮流。

驛心的解決方案無疑精準(zhǔn)解決了目前 AI 訓(xùn)練與推理的主要痛點(diǎn),這些痛點(diǎn)的洞察背后,實(shí)際上也與吳文昊橫跨 HPC、云計(jì)算和 AI 的經(jīng)歷有一定關(guān)系:

國產(chǎn) AI Infra 變革進(jìn)行時(shí):新勢力正在崛起

從 1999 年清華本科畢業(yè)到美國,直到 2008 年去微軟,這期間吳文昊一直在做 HPC,博士期間他主要做矩陣計(jì)算高性能實(shí)現(xiàn)與并行計(jì)算 MPI 協(xié)議研發(fā),2008 年到微軟之后負(fù)責(zé)微軟 HPC 及微軟云 Azure 產(chǎn)品管理,2011 年,吳文昊作為微軟云 Azure 存儲(chǔ)團(tuán)隊(duì)的 PM 負(fù)責(zé)了 Mellanox 進(jìn)微軟云 Azure 的項(xiàng)目。

隨后的 2013 年,吳文昊離開微軟,加入企業(yè)閃存市場“開拓者”Fusion-io,并于 2015 年回國加入曠視,此后一直聚集于 AI,一直到 2020 年正式離開曠視。

當(dāng)前的驛心科技,已重點(diǎn)布局三個(gè)領(lǐng)域:

一是云和大模型,這部分客戶的痛點(diǎn)主要在于自研、交付及客戶服務(wù)成本高,繼而需要專業(yè)存儲(chǔ)、獨(dú)立網(wǎng)絡(luò)互聯(lián)互通、多云數(shù)據(jù)同步與遷移,以及輕量級客戶服務(wù)界面。

據(jù)吳文昊介紹,這方面驛心目前已經(jīng)在國內(nèi)頭部互聯(lián)網(wǎng)大廠完成了 技術(shù)驗(yàn)證,并且后者在全球只評測了兩家,除驛心外還有一家美國存儲(chǔ)公司。

二是AI研發(fā)類客戶,涵蓋汽車、自動(dòng)駕駛,乃至機(jī)器人等垂直行業(yè),其對 AI 和 GPU 存儲(chǔ)能力需求不斷攀升。這類企業(yè)利用 AI 技術(shù)最快完成行業(yè)內(nèi) AI 閉環(huán),如自動(dòng)駕駛,通常通過物理產(chǎn)品與 VLA 模型服務(wù)(視覺 + 語言 + 行動(dòng))實(shí)現(xiàn) AI 閉環(huán)。

對此,就需要驛心提供專業(yè) AI Infra 解決方案以及 VLA 模型與數(shù)據(jù)能力,來幫助他們構(gòu)建垂直行業(yè)解決方案。目前,驛心也正加深同比亞迪電子的合作,繼而提供針對AI研發(fā)類客戶的一體機(jī)聯(lián)合解決方案。

值得一提的是,吳文昊也將這部分客戶描述為“AI 工廠”。在他看來,“從第一性原理出發(fā),DeepSeek 的出現(xiàn)正說明了中國是真正的‘AI 工廠’。先不論 GPU 在哪生產(chǎn),如果要打造 AI 工廠,最終供應(yīng)鏈仍將來自中國?!?/p>

第三類客戶為傳統(tǒng)客戶,包含半導(dǎo)體、制造、金融、能源等行業(yè),它們需要安全、可擴(kuò)展的存儲(chǔ)解決方案。與 AI 研發(fā)類企業(yè)相比,這類企業(yè) AI 需求增長較快,也在向 AI 領(lǐng)域發(fā)力,逐步迭代,完成商業(yè)閉環(huán)后有望成為 AI 研發(fā)類企業(yè)。

就此,驛心也通過與 OEM 廠商的合作,提供了針對細(xì)分行業(yè)及整合核心行業(yè)應(yīng)用的存算一體機(jī)方案。


寫在最后

開源和工程化的實(shí)現(xiàn)讓 DeepSeek 在 AGI 之路上往前邁進(jìn)了一步,同時(shí),也揭示了中美兩國在 AGI 軟硬一體上的兩種不同思路:

美國的 AGI 在 Infra 上追求平臺化發(fā)展,而中國的 AGI 如 DeepSeek 更強(qiáng)調(diào)通過算法驅(qū)動(dòng)的軟硬一體優(yōu)化來降低底層Infra 成本與提高效率。

驛心也是如此——在海外市場聯(lián)合 HammerSpace 提供的存儲(chǔ)方案更為水平化,而驛心則針對國內(nèi)市場給出了更加垂直的一體化方案。吳文昊認(rèn)為,正如 DeepSeek 從模型往下軟硬一體整體優(yōu)化的方法論所展示的巨大市場影響力,整個(gè)AI Infra的軟硬一體優(yōu)化與整合同樣會(huì)存在諸多市場空間。

對此,驛心和 DeepSeek 的做法有什么異同點(diǎn)呢?

驛心創(chuàng)始人吳文昊告訴 AI 科技評論,“Necessity is the mother of invention。對于 LLM 這樣的超級單一應(yīng)用,對數(shù)據(jù)使用的 pattern 趨于簡化統(tǒng)一,更易于針對這些 pattern 做優(yōu)化。“

他認(rèn)為,“從存儲(chǔ)到網(wǎng)絡(luò)往 GPU 里面?zhèn)鬏敂?shù)據(jù)的能力在 LLM 時(shí)代才是關(guān)鍵。因此,我們的 AI Infra 能力聚焦在存儲(chǔ)與模型層面?!?/p>

再次,在存儲(chǔ)層面,針對大模型訓(xùn)練和推理,通過 Tier-0 方案直接整合 GPU 服務(wù)器內(nèi)部的存儲(chǔ)空間。如無必要,勿增實(shí)體,這樣直接整合不僅解決成本,機(jī)房空間,能耗等核心瓶頸問題,而且極大提升存儲(chǔ)性能與數(shù)據(jù)帶寬。

在模型優(yōu)化層面,針對類似于 DeepSeek 這樣的主流模型,驛心結(jié)合算力、網(wǎng)絡(luò)、分布式 KV Cache 等能力,提高LLM集群的吞吐,同時(shí)通過可靠的 Tier-0/Tier-1 存儲(chǔ)方案保證模型與數(shù)據(jù)的可靠性,同時(shí)支持模型的后訓(xùn)練與推理加速。

當(dāng)前,驛心最新一輪融資即將 Close。之后在多模態(tài)和端側(cè)方面,驛心將尋求更多突破:“未來 AI Infra 特別是 AI 存儲(chǔ)將會(huì)迎來巨大增長,因?yàn)槎嗄B(tài)的數(shù)據(jù)量較之語言模型要大幾十上百倍?!眳俏年桓嬖V AI 科技評論。

另外,“端側(cè) AI 也需要經(jīng)過兩三個(gè)周期才能達(dá)到如今語言模型的水平,所以未來在端側(cè),數(shù)據(jù)生成、合成、存儲(chǔ)使用也存在許多值得關(guān)注的問題,這當(dāng)中也蘊(yùn)藏著新的機(jī)遇。”

總得來講,中國 AI 行業(yè)整體邁向 AGI,不僅需要算法人員的創(chuàng)新,也需要更多像驛心一樣有實(shí)力的 Infra 創(chuàng)業(yè)團(tuán)隊(duì)加入。如此,整個(gè)行業(yè)才能攜手定義下一代 AI Infra 的發(fā)展,這才是核心關(guān)鍵點(diǎn)所在。雷峰網(wǎng)雷峰網(wǎng)(公眾號:雷峰網(wǎng))

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

國產(chǎn) AI Infra 變革進(jìn)行時(shí):新勢力正在崛起

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說