國內(nèi)首個(gè)醫(yī)療專科推理數(shù)據(jù)集開源，螞蟻百靈大模型助力行業(yè)落地

本文作者：曉楠

2023-12-28 17:50

導(dǎo)語：這將有助于提升大模型在醫(yī)療領(lǐng)域的專業(yè)性。

12月28日，由信通院主辦的“虹橋之源”大模型驅(qū)動(dòng)數(shù)字經(jīng)濟(jì)新生態(tài)峰會(huì)在上海召開。會(huì)上，螞蟻集團(tuán)商業(yè)機(jī)器智能部總經(jīng)理顧進(jìn)杰介紹螞蟻正式開源國內(nèi)首個(gè)醫(yī)療?？仆评頂?shù)據(jù)集，這將有助于提升大模型在醫(yī)療領(lǐng)域的專業(yè)性。國內(nèi)首個(gè)醫(yī)療?？仆评頂?shù)據(jù)集開源，螞蟻百靈大模型助力行業(yè)落地螞蟻集團(tuán)商業(yè)機(jī)器智能部總經(jīng)理顧進(jìn)杰介紹國內(nèi)首個(gè)醫(yī)療專科推理數(shù)據(jù)集

在醫(yī)療行業(yè)，通用型語言模型在應(yīng)對(duì)醫(yī)療問診時(shí)，會(huì)直接給出答案，而醫(yī)生則會(huì)根據(jù)專業(yè)知識(shí)進(jìn)行反復(fù)的癥狀探討，才能給出答案。另外，大模型的幻覺問題和推理能力不足，當(dāng)前高質(zhì)量的中文醫(yī)學(xué)?？茢?shù)據(jù)集又較為稀缺，這對(duì)訓(xùn)練出色的醫(yī)療領(lǐng)域大模型提出了挑戰(zhàn)。

為克服這些難題，螞蟻集團(tuán)與上海仁濟(jì)醫(yī)院泌尿科專家團(tuán)隊(duì)聯(lián)合研發(fā)，基于醫(yī)生團(tuán)隊(duì)臨床經(jīng)驗(yàn)，通過構(gòu)造模擬病例數(shù)據(jù)的方式，推出了首個(gè)中文醫(yī)療?？茊柎鹜评頂?shù)據(jù)集RJUA-QA，這也是業(yè)內(nèi)首個(gè)臨床?？茢?shù)據(jù)集。

數(shù)據(jù)集由訓(xùn)練、驗(yàn)證、測(cè)試三部分組成，包含2132個(gè)問答對(duì)，每個(gè)問答對(duì)由醫(yī)生根據(jù)臨床經(jīng)驗(yàn)編寫的問題、專家提供的回答以及用于幫助推理的上下文構(gòu)成，病種覆蓋了97.6%以上的泌尿科就醫(yī)人群，能真實(shí)復(fù)刻診療場(chǎng)景。數(shù)據(jù)集能提高大模型在醫(yī)療診斷推理方面的能力，并作為在嚴(yán)肅可控場(chǎng)景下應(yīng)用的評(píng)測(cè)基準(zhǔn)。

顧進(jìn)杰進(jìn)一步介紹了螞蟻百靈大模型在醫(yī)療領(lǐng)域的技術(shù)進(jìn)展。“專業(yè)性、可控性、輕量化是大模型技術(shù)在醫(yī)療行業(yè)落地的三個(gè)重要挑戰(zhàn)和機(jī)會(huì)?！鳖欉M(jìn)杰說道。

專業(yè)性上，由于醫(yī)療行業(yè)有超百個(gè)科室，每個(gè)?？坪图膊?，都需要專業(yè)的調(diào)試。螞蟻集團(tuán)聯(lián)合醫(yī)療專家共同研發(fā)了多模態(tài)醫(yī)療知識(shí)引擎，進(jìn)一步推動(dòng)中國專業(yè)醫(yī)療數(shù)據(jù)集的構(gòu)建與開放。

在可控性方面，百靈大模型結(jié)合知識(shí)圖譜技術(shù)，讓大模型的每一個(gè)回答都有據(jù)可依。“生成內(nèi)容可以滿足不同醫(yī)院、不同科目的定制需求，包括風(fēng)格與調(diào)性等”，顧進(jìn)杰說。螞蟻集團(tuán)在超大規(guī)模圖學(xué)習(xí)和知識(shí)圖譜技術(shù)長(zhǎng)期積累，今年聯(lián)合OpenKG發(fā)布的OpenSPG開源項(xiàng)目，重新定義了工業(yè)界的知識(shí)圖譜語義架構(gòu)，知識(shí)檢索增強(qiáng)技術(shù)也是大幅提升大模型正確性與可控性的重要課題。

醫(yī)療行業(yè)有數(shù)據(jù)隱私、專業(yè)知識(shí)和系統(tǒng)自主性的需求，考慮到機(jī)構(gòu)的算力成本與便捷部署，百靈大模型還攻堅(jiān)了輕量化技術(shù)。在12月份開源的模型輕量化框架（PIA）中，集成了模型剪枝、壓縮、量化、推理加速等全鏈路環(huán)節(jié)的優(yōu)化，具備開箱即用、功能無損、低代碼接入等優(yōu)點(diǎn)，可在天級(jí)別完成10倍以上壓縮比。

據(jù)雷峰網(wǎng)(公眾號(hào)：雷峰網(wǎng))了解，目前，螞蟻百靈大模型在中英文的醫(yī)療考試以及基準(zhǔn)測(cè)試達(dá)到或超過了GPT4水準(zhǔn)，例如，在中文醫(yī)療LLM評(píng)測(cè)榜單promptCBLUE上，取得A榜第一，B榜第二的成績(jī)；在國際醫(yī)療問答榜單PubMedQA中，以80.6%的準(zhǔn)確率取得了前五的成績(jī)，而且是前十中參數(shù)量最小的模型，更適合被機(jī)構(gòu)部署和使用。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

曉楠

主筆

發(fā)私信

當(dāng)月熱門文章

國內(nèi)首個(gè)醫(yī)療專科推理數(shù)據(jù)集開源，螞蟻百靈大模型助力行業(yè)落地

國內(nèi)首個(gè)醫(yī)療專科推理數(shù)據(jù)集開源，螞蟻百靈大模型助力行業(yè)落地