丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給nebula
發(fā)送

0

首批通過,最高評(píng)級(jí),商湯小浣熊喜提中國信通院代碼大模型能力評(píng)估“三好生”

本文作者: nebula 2024-06-13 15:07
導(dǎo)語:代碼大模型該選哪家?中國信通院給予商湯小浣熊最高評(píng)級(jí)。

6月11日,中國信息通信研究院(以下簡稱“信通院”)公布可信AI代碼大模型首輪評(píng)估結(jié)果,商湯小浣熊獲得最高評(píng)級(jí)(4+級(jí)),在代碼通用能力、專用場景和應(yīng)用成熟度多個(gè)評(píng)估維度中表現(xiàn)優(yōu)秀。

首批通過,最高評(píng)級(jí),商湯小浣熊喜提中國信通院代碼大模型能力評(píng)估“三好生” 

信通院在2024上半年正式啟動(dòng)可信AI代碼大模型評(píng)估,以《智能化軟件工程技術(shù)和應(yīng)用要求 第1部分:代碼大模型》標(biāo)準(zhǔn)為評(píng)估依據(jù),該標(biāo)準(zhǔn)也是業(yè)內(nèi)首個(gè)代碼大模型標(biāo)準(zhǔn),其涵蓋通用能力、專用場景能力和應(yīng)用成熟度三大部分,包括16個(gè)能力項(xiàng)、100多個(gè)能力要求,全面從輸入多樣性、任務(wù)多樣性、語言完備度、結(jié)果可接收性、結(jié)果準(zhǔn)確度等維度,考核代碼大模型的全棧技術(shù)能力。

首批通過,最高評(píng)級(jí),商湯小浣熊喜提中國信通院代碼大模型能力評(píng)估“三好生” 

圖片來源:中國信息通信研究院

商湯小浣熊是本次評(píng)分最高的代碼大模型之一,作為首批參評(píng)企業(yè)獲得4+級(jí)評(píng)級(jí),信通院給出測評(píng)結(jié)論:

在通用能力方面,其代碼解釋、代碼轉(zhuǎn)換等方面表現(xiàn)突出;

在專用場景方面,其支持網(wǎng)站開發(fā)、桌面應(yīng)用開發(fā)、移動(dòng)應(yīng)用開發(fā)、數(shù)據(jù)庫開發(fā)等多個(gè)場景的開發(fā)能力;

在應(yīng)用成熟度方面,其數(shù)據(jù)分類分級(jí)、模型性能、模型服務(wù)可維護(hù)性、風(fēng)險(xiǎn)可控性等方面均表現(xiàn)優(yōu)秀。

「小浣熊家族」是基于商湯“日日新SenseNova”大模型體系打造的 AI Native 生產(chǎn)力系列工具,覆蓋軟件開發(fā)、數(shù)據(jù)分析、編程教育等多個(gè)場景,旨在通過先進(jìn)的人工智能技術(shù)優(yōu)化和提升工作效率。

小浣熊家族現(xiàn)已推出代碼小浣熊和辦公小浣熊兩位產(chǎn)品成員。

官網(wǎng)鏈接:https://raccoon.sensetime.com/login?utm_source=JUNEXTY

其中,代碼小浣熊是基于大模型的軟件智能研發(fā)助手,覆蓋軟件需求分析、架構(gòu)設(shè)計(jì)、代碼編寫、軟件測試等環(huán)節(jié),滿足用戶代碼編寫、編程學(xué)習(xí)等各類需求,現(xiàn)已支持Python、Java、JavaScript、C++、Go、SQL等90+主流編程語言和VS Code, JetBrains全家桶, Android Studio等主流IDE。

辦公小浣熊則是基于大模型的大模型原生數(shù)據(jù)分析產(chǎn)品,可以通過用戶的自然語言輸入,自動(dòng)將數(shù)據(jù)轉(zhuǎn)化為有意義的分析和可視化結(jié)果。

小浣熊家族背后的「小浣熊代碼大模型」,在權(quán)威測試集HumanEval Coding測試中一次通過率達(dá)到78.1%,在數(shù)據(jù)分析場景下的數(shù)據(jù)測試集(1000+題目)中以85.71%的正確率超過GPT-4。

小浣熊代碼大模型自上線以來,累計(jì)為10萬+個(gè)人用戶提供服務(wù),單日代碼生成數(shù)量達(dá)到10億+Tokens,總體平均代碼采納率超過30%,用戶編碼能效提升達(dá)到20%~78%。

首批通過,最高評(píng)級(jí),商湯小浣熊喜提中國信通院代碼大模型能力評(píng)估“三好生” 

在企業(yè)用戶方面,商湯小浣熊代碼大模型已經(jīng)被包括金融、新能源汽車等行業(yè)在內(nèi)的200+以上企業(yè)客戶使用,憑借其突出的數(shù)理能力覆蓋多元落地場景。

例如,在與金山辦公的合作中,小浣熊代碼大模型憑借卓越的代碼生成及工具調(diào)用能力助力WPS 365打造更高效釋放場景能力的智能辦公平臺(tái),為用戶多元、碎片化的辦公需求提供新質(zhì)生產(chǎn)力。

在金融領(lǐng)域,基于小浣熊代碼大模型,商湯科技與海通證券合作打造智能研發(fā)助手,輔助金融企業(yè)研發(fā)人員進(jìn)行代碼編程,為開發(fā)者提供代碼智能補(bǔ)全與對(duì)話問答服務(wù),可輔助生產(chǎn)代碼約20%代碼,降低開發(fā)技術(shù)門檻,有效提高開發(fā)效率。在減少開發(fā)者重復(fù)工作同時(shí),還能幫助團(tuán)隊(duì)更早發(fā)現(xiàn)并修正開發(fā)中的錯(cuò)誤,提升軟件交付質(zhì)量。

未來,商湯小浣熊將持續(xù)降低大模型技術(shù)的開發(fā)和應(yīng)用門檻,賦能更多場景實(shí)現(xiàn)創(chuàng)新。

雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說