SuperCLUE多模態(tài)視覺評測榜：文心4.5 Turbo總分并列國內第一

本文作者：小七

2025-08-29 12:33

導語：SuperCLUE-VLM榜發(fā)布，文心國內第一，逼近GPT-5。

8月29日消息，中文多模態(tài)視覺語言模型測評基準（SuperCLUE-VLM）8月榜單正式發(fā)布，百度ERNIE-4.5-Turbo-VL多模態(tài)大模型以 66.47分的成績并列位居國內模型第一，在真實場景任務下的領先優(yōu)勢明顯。

本次評估覆蓋Claude-Opus-4.1、Gemini-2.5-Pro、GPT-5(high)、ERNIE-4.5-Turbo-VL、Doubao-Seed-1.6-thinking、hunyuan-t1-vision、Qwen-V1-Max-Latest等國內外15款多模態(tài)模型。基于中文場景特點，SuperCLUE-VLM圍繞基礎認知、視覺推理和視覺應用三大核心維度進行評測，全面考察模型在真實任務場景下的能力。

測評結果顯示，Gemini-2.5-Pro 以總分74.99分領先，OpenAI GPT-5(high) 以總分68.59分位居第二，百度ERNIE-4.5-Turbo-VL-32k-preview 以總分66.47分并列國內模型第一。有分析人士點評，文心大模型在多模態(tài)領域的多維度領先優(yōu)勢十分突出。ERNIE-4.5-Turbo-VL等國內其他頭部模型在視覺推理、視覺應用等高階任務上的顯著進步，凸顯了中國在多模態(tài)大模型領域的競爭潛力。

SuperCLUE多模態(tài)視覺評測榜：文心4.5 Turbo總分并列國內第一

SuperCLUE-VLM多模態(tài)視覺語言基準評測總榜

據早前公開報道，6月30日百度開源文心4.5系列10款模型，其中 ERNIE-4.5-VL視覺語言模型（ERNIE-4.5-VL-28B-A3B；ERNIE-4.5-VL-424B-A47B）具備復雜的圖文與視頻理解能力，支持超過100種語言交互，其跨模態(tài)能力覆蓋文檔處理、視頻管理、學習解題等核心任務場景。

作為國內最早投入大模型產研的企業(yè)，百度依托“芯片-框架-模型-應用”的全棧自研體系，持續(xù)推動文心大模型能力進化。得益于飛槳文心的聯合優(yōu)化，文心大模型的能力拓展和效率提升。截至目前，飛槳文心開發(fā)者數量已超過2185萬，服務超過67萬家企業(yè)，創(chuàng)建的模型達到110萬。

雷峰網版權文章，未經授權禁止轉載。詳情見轉載須知。

0人收藏

小七

編輯

發(fā)私信

當月熱門文章