丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
業(yè)界 正文
發(fā)私信給嘉嘉
發(fā)送

0

騰訊“混元”AI大模型登頂CLUE總榜,彰顯自然語言理解領域強大實力

本文作者: 嘉嘉 2022-05-25 15:18
導語:騰訊“混元”AI大模型最新進展:一個月內(nèi)橫掃CLUE三大榜單

5月24日,騰訊“混元”AI大模型在CLUE(中文語言理解評測集合)總排行榜、閱讀理解、大規(guī)模知識圖譜三個榜單同時登頂,一舉打破三項紀錄。

據(jù)了解,CLUE總榜由分類任務和閱讀理解任務構(gòu)成。騰訊“混元”AI大模型在一個月內(nèi)先后實現(xiàn)分類任務、閱讀理解雙佳績,最終以 84.730的成績?nèi)〉每偘竦谝弧?/p>

騰訊“混元”AI大模型登頂CLUE總榜,彰顯自然語言理解領域強大實力

作為中文最具權威的自然語言理解榜單之一,CLUE共開設了包含文本相似度、分類、上下文推理、閱讀理解在內(nèi)的9項子任務,旨在推動NLP(自然語言處理預)訓練模型技術的不斷進步和突破。

NLP(自然語言處理)技術是人工智能領域的一個核心研究方向,其目的是使得計算機具備人類的聽、說、讀、寫等能力,并利用知識和常識進行推理和決策。目前,越來越多的科技企業(yè)和研發(fā)機構(gòu)投入到該領域的研究當中,在CLUE等業(yè)界榜單的競爭也十分激烈。

在預訓練階段,除常規(guī)公開數(shù)據(jù)集之外,“混元”大模型還學習了商業(yè)領域特有的文本數(shù)據(jù)集。因此,相較于業(yè)界其他AI大模型,“混元”能夠更好地理解各種長度文本信息,應對搜索、廣告、新聞、問答等多樣化的場景任務,在閱讀理解、知識圖譜相關的下游任務中也更加具有優(yōu)勢。

除性能提升之外,“混元”大模型通過借助數(shù)據(jù)及模型課程學習、多短句合并掩碼、改進PowerSGD(優(yōu)化通信算法)等方法,有效壓縮低帶寬環(huán)境下GPU節(jié)點訓練的通信數(shù)據(jù)量和通信耗時,實現(xiàn)訓練效率的大幅提升。

目前,騰訊“混元”AI大模型研發(fā)團隊已經(jīng)將改進的PowerSGD方法貢獻給PyTorch開源社區(qū),將在PyTorch下個版本中正式上線。

得益于“混元”AI大模型在自然語言理解、跨模態(tài)檢索領域強大的技術能力,自今年4月以來,該模型已成功斬獲MSR-VTT、MSVD、CLUE等各大權威AI榜單榜首,這意味著,騰訊在人工智能領域的技術研發(fā)已取得突破性進展。

目前,“混元“NLP大模型已經(jīng)應用于騰訊內(nèi)部多個業(yè)務,并在騰訊廣告的數(shù)據(jù)挖掘任務中帶來超過5%的指標提升,提升廣告推薦的精準度,優(yōu)化用戶體驗。未來,騰訊混元AI大模型研發(fā)團隊將根據(jù)具體場景需求持續(xù)推進大模型的研究和優(yōu)化,加速AI技術在各個產(chǎn)業(yè)的應用和落地。

雷峰網(wǎng)(公眾號:雷峰網(wǎng))

雷峰網(wǎng)版權文章,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說