0
本文作者: Nemo | 2025-02-19 14:20 |
2月18日,國內(nèi)領(lǐng)先的可觀測與應(yīng)用安全廠商基調(diào)聽云發(fā)布了《大模型服務(wù)性能評(píng)測 DeepSeek-R1 API 版》第一期報(bào)告,對多家提供 DeepSeek-R1 API 服務(wù)的廠商進(jìn)行全面評(píng)測,為開發(fā)者和終端用戶提供了重要參考。
DeepSeek-R1 推理大模型自 2025 年 1 月 20 日發(fā)布以來備受關(guān)注,其邏輯推理能力出色,引發(fā)全球轟動(dòng)。然而,隨著用戶量暴增,該模型官方服務(wù)頻繁報(bào)錯(cuò),服務(wù)器繁忙問題突出。在此背景下,多家第三方服務(wù)商推出相關(guān)服務(wù),市場競爭加劇。
此次評(píng)測利用基調(diào)聽云撥測工具,模擬真實(shí)用戶進(jìn)行主動(dòng)監(jiān)控,從網(wǎng)絡(luò)性能、接口響應(yīng)時(shí)間、推理速度、內(nèi)容生成速度等多個(gè)關(guān)鍵指標(biāo),對主流云服務(wù)廠商的 API 接口展開深入測試。評(píng)測數(shù)據(jù)綜合了多個(gè)城市、運(yùn)營商、主機(jī)和時(shí)間維度的分析,確保結(jié)果的科學(xué)性與可靠性。
評(píng)測結(jié)果顯示,在參與評(píng)測的火山引擎、DeepSeek 官方、硅基流動(dòng)、騰訊云、阿里云百煉等廠商中,火山引擎表現(xiàn)最為突出,在 API 響應(yīng)性能上全面領(lǐng)先,平均速度、推理速度、生成速度均為最優(yōu),可用性高達(dá) 99.83% ,是 API 接入的首選推薦。DeepSeek 官方雖推理速度較快,但首 Token 延遲長達(dá) 7.753 秒,可用性僅 42.21%,成為明顯短板。硅基流動(dòng)首 Token 響應(yīng)快且可用性穩(wěn)定,但平均速度較弱。騰訊云整體性能較低,總性能最差且可用性一般。阿里云百煉平均速度最慢,首包時(shí)間最長,不過可用性尚可。
DeepSeek R1評(píng)測結(jié)果(圖片來自基調(diào)聽云公眾號(hào))
從不同維度進(jìn)一步分析,火山引擎在北京、上海、廣州、深圳、蘇州、成都、重慶、武漢、成都、杭州等所有城市測試中均保持最高性能;DeepSeek 官方在重慶的首 Token 時(shí)間最長,其他城市在 9 秒內(nèi);硅基流動(dòng)的可用性在廣州表現(xiàn)最差,其他城市在 98% 以上。運(yùn)營商維度,DeepSeek 官方在中國移動(dòng)網(wǎng)絡(luò)下建連時(shí)間較長,其他運(yùn)營商下均在 0.05 秒以內(nèi),其余服務(wù)商指標(biāo)未見明顯差異。主機(jī)維度,騰訊云主機(jī)數(shù)量最多、分布最廣,DeepSeek 官方主機(jī)數(shù)量最少。時(shí)間維度上,不同時(shí)段各服務(wù)商表現(xiàn)不同,整體受用戶流量和服務(wù)器負(fù)載影響。
此次評(píng)測為開發(fā)者和企業(yè)用戶提供了深度數(shù)據(jù)支撐,有助于其科學(xué)選擇服務(wù)商,優(yōu)化產(chǎn)品體驗(yàn)。此外,基調(diào)聽云還為普通用戶整理了支持 DeepSeek-R1 的第三方服務(wù)及相關(guān)網(wǎng)站信息,涵蓋免費(fèi)和付費(fèi)模式,方便用戶選擇使用。同時(shí),基調(diào)聽云預(yù)告正在對網(wǎng)頁版本的 DeepSeek-R1 服務(wù)進(jìn)行評(píng)測,后續(xù)將發(fā)布網(wǎng)頁版評(píng)測結(jié)果。
附:《大模型服務(wù)性能評(píng)測 DeepSeek-R1 API 版》
報(bào)告原文https://mp.weixin.qq.com/s/WDAQ5qc968HfvzuU3_NntQ
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。