騰訊混元開源首款混合推理MoE模型，性能優(yōu)異，激活參數(shù)僅13B

本文作者：小七

2025-06-27 16:51

導(dǎo)語：騰訊混元開源首款13B激活MoE模型Hunyuan-A13B，性能比肩主流大模型，推理速度更快成本更低。

6月27日，騰訊混元宣布開源首個(gè)混合推理MoE模型 Hunyuan-A13B，總參數(shù)80B，激活參數(shù)僅13B，效果比肩同等架構(gòu)領(lǐng)先開源模型，但是推理速度更快，性價(jià)比更高。這意味著，開發(fā)者可以用更低門檻的方式獲得更好的模型能力。

即日起，模型已經(jīng)在 Github 和 Huggingface 等開源社區(qū)上線，同時(shí)模型API也在騰訊云官網(wǎng)正式上線，支持快速接入部署。

這是業(yè)界首個(gè)13B級別的MoE開源混合推理模型，基于先進(jìn)的模型架構(gòu)，Hunyuan-A13B表現(xiàn)出強(qiáng)大的通用能力，在多個(gè)業(yè)內(nèi)權(quán)威數(shù)據(jù)測試集上獲得好成績，并且在Agent工具調(diào)用和長文能力上有突出表現(xiàn)。

騰訊混元開源首款混合推理MoE模型，性能優(yōu)異，激活參數(shù)僅13B

*加粗為最高分，下劃線表示第二名，數(shù)據(jù)來源于模型各個(gè)公開的測試數(shù)據(jù)集得分

對于時(shí)下熱門的大模型Agent能力，騰訊混元建設(shè)了一套多Agent數(shù)據(jù)合成框架，接入了MCP、沙箱、大語言模型模擬等多樣的環(huán)境，并且通過強(qiáng)化學(xué)習(xí)讓Agent在多種環(huán)境里進(jìn)行自主探索與學(xué)習(xí)，進(jìn)一步提升了Hunyuan-A13B的效果。

在長文方面，Hunyuan-A13B支持256K原生上下文窗口，在多個(gè)長文數(shù)據(jù)集中取得了優(yōu)異的成績。

騰訊混元開源首款混合推理MoE模型，性能優(yōu)異，激活參數(shù)僅13B

在實(shí)際使用場景中，Hunyuan-A13B模型可以根據(jù)需要選擇思考模式，快思考模式提供簡潔、高效的輸出，適合追求速度和最小計(jì)算開銷的簡單任務(wù)；慢思考涉及更深、更全面的推理步驟，如反思和回溯。這種融合推理模式優(yōu)化了計(jì)算資源分配，使用戶能夠通過加think/no_think切換思考模式，在效率和特定任務(wù)準(zhǔn)確性之間取得平衡。

騰訊混元開源首款混合推理MoE模型，性能優(yōu)異，激活參數(shù)僅13B

Hunyuan-A13B模型對個(gè)人開發(fā)者較為友好，在嚴(yán)格條件下，只需要1張中低端GPU卡即可部署。目前，Hunyuan-A13B已經(jīng)融入開源主流推理框架生態(tài)，無損支持多種量化格式，在相同輸入輸出規(guī)模上，整體吞吐是前沿開源模型的2倍以上。

Hunyuan-A13B 集合了騰訊混元在模型預(yù)訓(xùn)練、后訓(xùn)練等多個(gè)環(huán)節(jié)的創(chuàng)新技術(shù)，這些技術(shù)共同增強(qiáng)了其推理性能、靈活性和推理效率。

預(yù)訓(xùn)練環(huán)節(jié)，Hunyuan-A13B 訓(xùn)練了20T tokens的語料，覆蓋了多個(gè)領(lǐng)域。高質(zhì)量的語料顯著提升了模型通用能力。此外，在模型架構(gòu)上，騰訊混元團(tuán)隊(duì)通過系統(tǒng)性分析，建模與驗(yàn)證，構(gòu)建了適用于 MoE 架構(gòu)的 Scaling Law 聯(lián)合公式。這一發(fā)現(xiàn)完善了MoE 架構(gòu)的 Scaling Law 理論體系，并為 MoE 架構(gòu)設(shè)計(jì)提供了可量化的工程化指導(dǎo)，也極大的提升了模型預(yù)訓(xùn)練的效果。

后訓(xùn)練環(huán)節(jié)，Hunyuan-A13B采用了多階段的訓(xùn)練方式，提升了模型的推理能力，同時(shí)兼顧了模型創(chuàng)作、理解、Agent等通用能力。

騰訊混元開源首款混合推理MoE模型，性能優(yōu)異，激活參數(shù)僅13B
圖：Hunyuan-A13B后訓(xùn)練四個(gè)步驟

為更好的提升大語言模型能力，騰訊混元也開源了兩個(gè)新的數(shù)據(jù)集，以填補(bǔ)行業(yè)內(nèi)相關(guān)評估標(biāo)準(zhǔn)的空白。其中，ArtifactsBench用于彌合大語言模型代碼生成評估中的視覺與交互鴻溝，構(gòu)建了一個(gè)包含 1825個(gè)任務(wù)的新基準(zhǔn)，涵蓋了從網(wǎng)頁開發(fā)、數(shù)據(jù)可視化到交互式游戲等九大領(lǐng)域，并按難度分級以全面評估模型的能力；C3-Bench針對Agent場景模型面臨的三個(gè)關(guān)鍵挑戰(zhàn)：規(guī)劃復(fù)雜的工具關(guān)系、處理關(guān)鍵的隱藏信息以及動(dòng)態(tài)路徑?jīng)Q策，設(shè)計(jì)了1024條測試數(shù)據(jù)，以發(fā)現(xiàn)模型能力的不足。

Hunyuan-A13B模型是騰訊內(nèi)部應(yīng)用和調(diào)用量最大的大語言模型之一，有超過 400+ 業(yè)務(wù)用于精調(diào)或者直接調(diào)用，日均請求超1.3億。本次進(jìn)行升級更新并對外開源，是繼混元large后混元大語言模型推出的又一重要開源模型，參數(shù)更小，但是性能和效果實(shí)現(xiàn)了大幅的提升。接下來，騰訊混元也將推出更多尺寸、更多特色的模型，將更多實(shí)踐技術(shù)與社區(qū)共享，促進(jìn)大模型開源生態(tài)的繁榮。

騰訊混元堅(jiān)定擁抱開源，持續(xù)推進(jìn)多尺寸、多場景的全系模型開源，旗下圖像、視頻、3D、文本等多種模態(tài)基礎(chǔ)模型已全面開源。未來，混元計(jì)劃推出多尺寸混合推理模型，從0.5B到32B的dense模型，以及激活13B的MoE模型，適配企業(yè)與端側(cè)不同需求，混元圖像、視頻、3D等多模態(tài)基礎(chǔ)模型及配套插件模型也將持續(xù)開源。

騰訊混元開源首款混合推理MoE模型，性能優(yōu)異，激活參數(shù)僅13B