0
本文作者: nebula | 2024-09-29 14:23 |
9月29日消息,基準(zhǔn)測(cè)試平臺(tái)Chatbot Arena日前公布最新大模型盲測(cè)榜單,10天前發(fā)布的阿里通義千問開源模型Qwen2.5再次闖入全球十強(qiáng),其大語言模型Qwen2.5-72B-Instruct排名LLM榜單第十,是前十唯一的中國(guó)大模型;Qwen系列視覺語言模型Qwen2-VL-72B-Instruct排名Vision榜單第九,是得分最高的開源大模型。
同一時(shí)間,全球開源社區(qū)基于Qwen系列二次開發(fā)的衍生模型數(shù)量突破7.43萬,超越Llama系列衍生模型的7.28萬。通義千問Qwen成長(zhǎng)為世界最大的生成式語言模型族群,在Hugging Face社區(qū)的開源模型權(quán)威榜單Open LLM Leaderboard上,Qwen系列及其衍生模型包攬了前十全部座次。
不論是模型性能還是生態(tài)影響力,Qwen都創(chuàng)造了中國(guó)開源大模型的歷史。
Qwen2.5-72B-Instruct排名Chatbot Arena大語言模型榜單第十
Chatbot Arena是由開放研究機(jī)構(gòu)LMSYS Org推出的大模型性能測(cè)試平臺(tái),自2023年5月推出以來一直是世界頂級(jí)大模型的最重要競(jìng)技場(chǎng)。平臺(tái)目前集成了全球70多個(gè)大模型,采用匿名方式將大模型兩兩組隊(duì),交給用戶進(jìn)行盲測(cè),用戶根據(jù)真實(shí)對(duì)話體驗(yàn)對(duì)模型能力進(jìn)行投票。
9月19日發(fā)布的Qwen2.5迅速進(jìn)榜,旗艦?zāi)P蚎wen2.5-72B-Instruct得分位列LLM榜單第十,居于OpenAI的o1、GPT-4o等模型之后,是得分最高的中國(guó)大模型;同天開源的視覺語言模型Qwen2-VL-72B-Instruct闖入Vision榜單第九,略遜于GPT-4o、Gemini-1.5-Pro等閉源模型,是成績(jī)最好的開源模型。此前Qwen系列已有多款開源模型闖入Chatbot Arena榜單。
Chatbot Arena官方發(fā)文,Qwen2-VL-72B-Instruct是排名最高的開源視覺語言模型
Qwen2.5的發(fā)布在海內(nèi)外開源社區(qū)引發(fā)一場(chǎng)狂歡,這套開源模型涵蓋多個(gè)尺寸的大語言模型、多模態(tài)模型、數(shù)學(xué)模型和代碼模型,幾乎所有尺寸的模型都實(shí)現(xiàn)了同等規(guī)模業(yè)界最佳性能,發(fā)布10天下載量超過150萬。有國(guó)外開發(fā)者稱贊通義千問稱得上是真正的“開放AI”;有用戶測(cè)評(píng)發(fā)現(xiàn)Qwen2.5從0.5B到72B都是SOTA水平,于是發(fā)起話題:“大家都用Qwen2.5替換了那些常用模型?”
海外開源社區(qū)盛贊Qwen2.5
雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。