0
本文作者: 小七 | 2025-08-29 12:33 |
8月29日消息,中文多模態(tài)視覺(jué)語(yǔ)言模型測(cè)評(píng)基準(zhǔn)(SuperCLUE-VLM)8月榜單正式發(fā)布,百度ERNIE-4.5-Turbo-VL多模態(tài)大模型以 66.47分 的成績(jī)并列位居國(guó)內(nèi)模型第一,在真實(shí)場(chǎng)景任務(wù)下的領(lǐng)先優(yōu)勢(shì)明顯。
本次評(píng)估覆蓋Claude-Opus-4.1、Gemini-2.5-Pro、GPT-5(high)、ERNIE-4.5-Turbo-VL、Doubao-Seed-1.6-thinking、hunyuan-t1-vision、Qwen-V1-Max-Latest等國(guó)內(nèi)外15款多模態(tài)模型?;谥形膱?chǎng)景特點(diǎn),SuperCLUE-VLM圍繞基礎(chǔ)認(rèn)知、視覺(jué)推理和視覺(jué)應(yīng)用三大核心維度進(jìn)行評(píng)測(cè),全面考察模型在真實(shí)任務(wù)場(chǎng)景下的能力。
測(cè)評(píng)結(jié)果顯示,Gemini-2.5-Pro 以總分74.99分領(lǐng)先,OpenAI GPT-5(high) 以總分68.59分位居第二,百度ERNIE-4.5-Turbo-VL-32k-preview 以總分66.47分并列國(guó)內(nèi)模型第一。有分析人士點(diǎn)評(píng),文心大模型在多模態(tài)領(lǐng)域的多維度領(lǐng)先優(yōu)勢(shì)十分突出。ERNIE-4.5-Turbo-VL等國(guó)內(nèi)其他頭部模型在視覺(jué)推理、視覺(jué)應(yīng)用等高階任務(wù)上的顯著進(jìn)步,凸顯了中國(guó)在多模態(tài)大模型領(lǐng)域的競(jìng)爭(zhēng)潛力。
SuperCLUE-VLM多模態(tài)視覺(jué)語(yǔ)言基準(zhǔn)評(píng)測(cè)總榜
據(jù)早前公開(kāi)報(bào)道,6月30日百度開(kāi)源文心4.5系列10款模型,其中 ERNIE-4.5-VL視覺(jué)語(yǔ)言模型(ERNIE-4.5-VL-28B-A3B;ERNIE-4.5-VL-424B-A47B)具備復(fù)雜的圖文與視頻理解能力,支持超過(guò)100種語(yǔ)言交互,其跨模態(tài)能力覆蓋文檔處理、視頻管理、學(xué)習(xí)解題等核心任務(wù)場(chǎng)景。
作為國(guó)內(nèi)最早投入大模型產(chǎn)研的企業(yè),百度依托“芯片-框架-模型-應(yīng)用”的全棧自研體系,持續(xù)推動(dòng)文心大模型能力進(jìn)化。得益于飛槳文心的聯(lián)合優(yōu)化,文心大模型的能力拓展和效率提升。截至目前,飛槳文心開(kāi)發(fā)者數(shù)量已超過(guò)2185萬(wàn),服務(wù)超過(guò)67萬(wàn)家企業(yè),創(chuàng)建的模型達(dá)到110萬(wàn)。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。