0
ChatGPT的發(fā)布在全球掀起了大模型產(chǎn)業(yè)化的浪潮,短短半年間,許多行業(yè)因大模型的出現(xiàn)而脫胎換骨。“大模型在改變?nèi)斯ぶ悄艿耐瑫r(shí),也在改變著全世界”逐漸成為人們的共識(shí)。
在通用大模型領(lǐng)域,擁有著深厚技術(shù)儲(chǔ)備的騰訊、阿里、百度、華為等國(guó)內(nèi)科技與互聯(lián)網(wǎng)巨頭企業(yè)接連發(fā)力,打造出混元、通義千問(wèn)、文心一言、盤古等AI大模型,在大模型產(chǎn)業(yè)化的競(jìng)爭(zhēng)浪潮中占據(jù)第一梯隊(duì)。
大模型之火越燒越烈,從通用大模型一路蔓延至專業(yè)性更強(qiáng)的醫(yī)療垂類大模型。
然而,受限于醫(yī)療行業(yè)的專業(yè)性與嚴(yán)肅性,基于專業(yè)語(yǔ)料、高質(zhì)量數(shù)據(jù)的醫(yī)療垂直領(lǐng)域大模型研發(fā)門檻顯然更高。
自今年2月起,騰訊、阿里、百度、華為、訊飛、商湯,以及來(lái)自醫(yī)療信息化、醫(yī)療影像、互聯(lián)網(wǎng)醫(yī)療等領(lǐng)域的多家企業(yè)陸續(xù)公布了在醫(yī)療領(lǐng)域大模型方面的布局,近兩個(gè)月來(lái),更是有多款醫(yī)療大模型先后發(fā)布。
在這條賽道之上,深耕醫(yī)療領(lǐng)域的專業(yè)玩家是否更具優(yōu)勢(shì)?
雷峰網(wǎng)《醫(yī)健AI掘金志》基于公開(kāi)資料,對(duì)布局醫(yī)療大模型的企業(yè)、研究機(jī)構(gòu)及其相關(guān)產(chǎn)品進(jìn)行了盤點(diǎn)。
(雷峰網(wǎng)《醫(yī)健AI掘金志》后續(xù)將推出更多醫(yī)療大模型相關(guān)話題文章,如《醫(yī)療信息化廠商的「GPT焦慮癥」》等,歡迎添加作者微信qiaoyw186搶先交流。)
2021年4月,華為發(fā)布盤古NLP(中文語(yǔ)言)大模型、盤古視覺(jué)大模型、盤古科學(xué)計(jì)算大模型,同年9月,華為推出用于藥物研發(fā)細(xì)分場(chǎng)景的大模型,盤古藥物分子大模型。
據(jù)介紹,該模型是由華為云聯(lián)合中國(guó)科學(xué)院上海藥物研究所共同訓(xùn)練而成。依托華為云一站式醫(yī)療研發(fā)平臺(tái) EIHealth,盤古藥物分子大模型學(xué)習(xí)了 17 億個(gè)藥物分子的化學(xué)結(jié)構(gòu)。
國(guó)際歐亞科學(xué)院院士、華為云人工智能領(lǐng)域首席科學(xué)家田奇曾介紹,盤古大模型解決了傳統(tǒng)AI開(kāi)發(fā)的作坊式開(kāi)發(fā)、樣本標(biāo)注代價(jià)大、模型維護(hù)困難、模型泛化不足、行業(yè)人短缺等難題。
在《醫(yī)健AI掘金志》此前與華為云醫(yī)療產(chǎn)品總監(jiān),醫(yī)療首席科學(xué)家喬楠博士的對(duì)話中,喬楠博士介紹,華為云基于盤古藥物分子大模型打造的AI輔助藥物設(shè)計(jì)平臺(tái),能夠覆蓋藥物設(shè)計(jì)的全流程,為靶點(diǎn)發(fā)現(xiàn)、藥物篩選、分子優(yōu)化三個(gè)環(huán)節(jié)提供支撐。
在靶點(diǎn)發(fā)現(xiàn)環(huán)節(jié),2019年以來(lái),華為云針對(duì)基因數(shù)據(jù)、基因多組學(xué)數(shù)據(jù)、基因調(diào)控網(wǎng)絡(luò)數(shù)據(jù)陸續(xù)發(fā)布了三個(gè)算法:AutoGenome、AutoOmics、AutoGGN,通過(guò)從細(xì)胞系、動(dòng)物模型、病人身體組織中測(cè)到的多組學(xué)數(shù)據(jù)進(jìn)行AI建模,為生物標(biāo)記物發(fā)現(xiàn)和靶點(diǎn)發(fā)現(xiàn)等相關(guān)問(wèn)題提供依據(jù)。
在藥物篩選環(huán)節(jié),華為云打造了一個(gè)獨(dú)有的小分子庫(kù)生成功能,基于盤古藥物分子大模型,從模型學(xué)習(xí)到的類藥化學(xué)空間中均衡采樣,生成新穎且類藥性質(zhì)更優(yōu)的化合物分子庫(kù),幫助加速藥物篩選過(guò)程。
在分子優(yōu)化環(huán)節(jié),分子搜索功能基于華為云盤古藥物分子大模型的小分子化合物表征,以使用者輸入的參考化合物結(jié)構(gòu)為起點(diǎn),從海量的小分子庫(kù)中搜索到相似結(jié)構(gòu)和排序,可以實(shí)現(xiàn)百億級(jí)小分子的秒級(jí)搜索。
在實(shí)際應(yīng)用中,華為云聯(lián)合西安交通大學(xué)第一附屬醫(yī)院劉冰教授團(tuán)隊(duì),基于華為云盤古藥物分子大模型研發(fā)出了近四十年來(lái)首個(gè)新靶點(diǎn)、新類別的抗生素,將藥物設(shè)計(jì)周期從數(shù)年縮短至數(shù)月,成本降低70%。
2022年7月25日,云南白藥公告其與華為達(dá)成全面合作,雙方將在人工智能藥物研發(fā)領(lǐng)域開(kāi)展交流與合作,探索聯(lián)合科研創(chuàng)新機(jī)制。
今年6月6日,潤(rùn)達(dá)醫(yī)療與華為云計(jì)算技術(shù)有限公司在上海正式簽署全面戰(zhàn)略合作協(xié)議,雙方將基于華為云平臺(tái)打造面向醫(yī)療領(lǐng)域的AI大模型,實(shí)現(xiàn)智慧醫(yī)療服務(wù)。
2022年5月,百度對(duì)外發(fā)布了文心生物計(jì)算大模型,并將生物領(lǐng)域研究對(duì)象的特性融入模型,構(gòu)建面向化合物分子、蛋白分子、基因組學(xué)信息的生物計(jì)算領(lǐng)域預(yù)訓(xùn)練大模型。
目前正式對(duì)外發(fā)布的文心生物計(jì)算大模型,包括化合物通用表征模型、蛋白結(jié)構(gòu)分析模型以及單序列蛋白表征模型。
在實(shí)際應(yīng)用中,文心生物計(jì)算大模型已幫助百克生物等醫(yī)藥公司縮短了化合物分子選型的周期。
今年3月16日,百度正式發(fā)布新一代大語(yǔ)言模型,生成式AI產(chǎn)品“文心一言”。在3月21日召開(kāi)的的2023年百度&GBI生態(tài)峰會(huì)上,百度文心大模型首個(gè)落地醫(yī)藥行業(yè)的應(yīng)用GBIBot正式發(fā)布。
這款醫(yī)藥垂類對(duì)話機(jī)器人,使用了百度靈醫(yī)智惠在醫(yī)療健康行業(yè)的技術(shù)積累,實(shí)現(xiàn)了文心大模型與GBI專業(yè)數(shù)據(jù)庫(kù)的有機(jī)結(jié)合。
據(jù)峰會(huì)當(dāng)日介紹,百度已具備醫(yī)療健康大模型,對(duì)應(yīng)的應(yīng)用層即為智慧醫(yī)療。這一模型來(lái)自百度的三大中臺(tái)技術(shù),即數(shù)據(jù)中臺(tái)、知識(shí)中臺(tái)和AI中臺(tái)。
百度曾基于國(guó)家級(jí)項(xiàng)目和數(shù)百家醫(yī)院實(shí)踐,制定醫(yī)療健康標(biāo)準(zhǔn)大數(shù)據(jù),構(gòu)建醫(yī)療健康大數(shù)據(jù)治理平臺(tái),據(jù)峰會(huì)介紹,百度擁有超過(guò)1億的數(shù)據(jù)治理單據(jù)、2100萬(wàn)日審核醫(yī)囑、13萬(wàn)日推薦檢查、180萬(wàn)日服務(wù)患者、20萬(wàn)日服務(wù)醫(yī)生數(shù)量。
同時(shí),百度還具有知識(shí)圖譜構(gòu)建能力,可將優(yōu)質(zhì)病歷、診斷指南、專家共識(shí)、科研成果等知識(shí)信息由閱讀級(jí)轉(zhuǎn)換到計(jì)算、決策級(jí)。再基于AI中臺(tái)技術(shù),百度由此形成了千億級(jí)參數(shù)的醫(yī)療健康大模型。
據(jù)此,GBI數(shù)據(jù)庫(kù)的接入可以使其數(shù)據(jù)資源經(jīng)過(guò)前述技術(shù)處理,為藥企用戶提供更加智能的服務(wù)。
而對(duì)于藥企客戶而言,文心一言作為一種CPT(生成型預(yù)訓(xùn)練變換模型),還將在前述技術(shù)的基礎(chǔ)上,提供多輪交互式對(duì)話。從用戶體驗(yàn)的角度上說(shuō),這相較于此前的關(guān)鍵詞檢索、語(yǔ)義查詢更加精準(zhǔn)便捷。
在今年5月舉辦的《中國(guó)AI藥物研發(fā)大會(huì)》上,百度生命科學(xué)解決方案架構(gòu)師馬羅亞介紹了百度生命科學(xué)行業(yè)布局及解決方案。
其中,百度基于文心大模型,深入生命科學(xué)行業(yè),推出螺旋槳系列產(chǎn)品,為藥物研發(fā)、基因檢測(cè)等提供算法工具,在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、mRNA序列優(yōu)化、虛擬篩選、ADMET預(yù)測(cè)等方面具有較強(qiáng)優(yōu)勢(shì),可作為藥物研發(fā)階段重要工具,加速藥物研發(fā)進(jìn)程。
2023年6月19日,騰訊云在國(guó)家科技傳播中心召開(kāi)行業(yè)大模型及智能應(yīng)用技術(shù)峰會(huì),首次公布騰訊云行業(yè)大模型研發(fā)進(jìn)展,啟動(dòng)行業(yè)大模型共建合作。
據(jù)騰訊云介紹,此次公布的行業(yè)大模型解決方案立足不同企業(yè)的需求場(chǎng)景,依托騰訊云 TI 平臺(tái)打造行業(yè)大模型精選商店,為企業(yè)客戶提供 MaaS(Model-as-a-Service)一站式服務(wù)。
依托騰訊云 TI 平臺(tái)打造行業(yè)大模型精選商店,為企業(yè)客戶提供涵蓋模型預(yù)訓(xùn)練、模型精調(diào)、智能應(yīng)用開(kāi)發(fā)等一站式行業(yè)大模型解決方案。
騰訊云MaaS的技術(shù)底座是一系列的行業(yè)大模型,包括金融、政府、文旅、傳媒、教育等。
基于這些基礎(chǔ)模型,騰訊云的客戶只要加入自己的場(chǎng)景數(shù)據(jù),就可以生成契合自身業(yè)務(wù)需要的專屬模型;同時(shí)也可根據(jù)自身業(yè)務(wù)場(chǎng)景需求,定制不同參數(shù)、不同規(guī)格的模型服務(wù)。
在醫(yī)療健康領(lǐng)域,騰訊云可以幫助醫(yī)療機(jī)構(gòu)構(gòu)建和部署自己的疾病預(yù)測(cè)模型,提高診斷準(zhǔn)確率和治療效果;在金融領(lǐng)域,騰訊云可以幫助銀行和保險(xiǎn)公司構(gòu)建和部署自己的風(fēng)險(xiǎn)評(píng)估模型,提高風(fēng)險(xiǎn)控制能力。
仁濟(jì)醫(yī)院作為騰訊此次行業(yè)大模型發(fā)布中醫(yī)療行業(yè)智能應(yīng)用的全國(guó)示范醫(yī)療機(jī)構(gòu),運(yùn)用騰訊行業(yè)大模型,以互聯(lián)網(wǎng)醫(yī)院適老化服務(wù)為著力點(diǎn),再次升級(jí)互聯(lián)網(wǎng)醫(yī)院數(shù)智人智能客服,為患者提供便捷就醫(yī)的智慧化體驗(yàn)。
4月11日,在阿里云峰會(huì)上,阿里云智能首席技術(shù)官周靖人正式宣布推出大語(yǔ)言模型“通義千問(wèn)”,阿里巴巴所有產(chǎn)品未來(lái)將接入“通義千問(wèn)”大模型,進(jìn)行全面改造,包括天貓、釘釘、高德地圖、淘寶、優(yōu)酷、盒馬等。
該模型基于阿里巴巴自主研發(fā)的StructBERT和PLUG等技術(shù)構(gòu)建,擁有270億個(gè)參數(shù),具備多輪對(duì)話、文案創(chuàng)作、邏輯推理、多模態(tài)理解、多語(yǔ)言支持等功能,可以理解和生成中文、英文、日文等多種語(yǔ)言,并且可以根據(jù)不同的任務(wù)和領(lǐng)域進(jìn)行靈活調(diào)整。
據(jù)在醫(yī)療領(lǐng)域,利用“通義千問(wèn)”模型可實(shí)現(xiàn)醫(yī)療問(wèn)答、醫(yī)療知識(shí)圖譜、醫(yī)療報(bào)告生成等功能,提供專業(yè)的醫(yī)療咨詢和輔助診斷。
4月10日,在商湯技術(shù)交流日活動(dòng)上,商湯科技董事長(zhǎng)兼首席執(zhí)行官徐立宣布推出大模型體系“日日新”大模型,體系包含自然語(yǔ)言生成、照片生成服務(wù)、感知模型預(yù)標(biāo)注、模型研發(fā)。
商湯“日日新 SenseNova”大模型體系的基礎(chǔ)算力底座是商湯 AI 大裝置 SenseCore,其背靠商湯人工智能計(jì)算中心(AIDC),目前有 27000 塊的 GPU 在運(yùn)行,能夠輸出 5000p 的總算力,500p 的國(guó)產(chǎn)化算力,可以同步支持 20 個(gè)千億參數(shù)超大模型訓(xùn)練,為商湯日日新大模型體系提供了充足的算力支持。
基于大裝置的能力,商湯目前已構(gòu)建了計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、AI 內(nèi)容生成、多模態(tài)、決策智能等多個(gè)領(lǐng)域的大模型,在醫(yī)療領(lǐng)域,推出了中文醫(yī)療語(yǔ)言大模型“商量·大醫(yī)”。
“商量·大醫(yī)”基于海量醫(yī)學(xué)知識(shí)和真實(shí)醫(yī)患互動(dòng)對(duì)話數(shù)據(jù)打造,能夠通過(guò)多輪對(duì)話輔助支持導(dǎo)診、問(wèn)診、健康咨詢、輔助決策等多場(chǎng)景,從而持續(xù)賦能醫(yī)療領(lǐng)域,提升醫(yī)院診療效率,為患者打造更好的服務(wù)體驗(yàn)。
據(jù)商湯科技展示的案例,“商量·大醫(yī)”已落地新華醫(yī)院,能夠擔(dān)任健康咨詢助手,為用戶解答熬夜會(huì)帶來(lái)身體變化的原因, 并通過(guò)引導(dǎo)給用戶提供就醫(yī)掛號(hào)建議。
據(jù)創(chuàng)業(yè)慧康官微消息,4月12日,創(chuàng)業(yè)慧康與浙江大學(xué)計(jì)算機(jī)創(chuàng)新技術(shù)研究院、浙江省智慧醫(yī)療創(chuàng)新中心正式達(dá)成戰(zhàn)略協(xié)議,共同推動(dòng)AI技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用及發(fā)展。
據(jù)介紹,此次合作的重點(diǎn)是推動(dòng)AI大模型(如GPT、ChatGLM、LLaMA、T5、Segment Anything)在臨床醫(yī)療、公共衛(wèi)生、個(gè)人健康等場(chǎng)景中的研究與開(kāi)發(fā),以重構(gòu)醫(yī)療業(yè)務(wù)場(chǎng)景,結(jié)合權(quán)威的醫(yī)學(xué)臨床知識(shí)庫(kù)、健康管理知識(shí)庫(kù),為AIGC模型提供高質(zhì)量的訓(xùn)練數(shù)據(jù)和確定性的Prompt上下文,使得人工智能模型生成結(jié)果安全可信。
6月14日與19日,創(chuàng)業(yè)慧康在互動(dòng)平臺(tái)的回復(fù)中對(duì)公司打造的AI大模型聚合產(chǎn)品——BsoftGPT進(jìn)行了介紹,產(chǎn)品將以API調(diào)用結(jié)合本地部署的方式聚合利用通用GPT模型,同時(shí)通過(guò)本地部署embedding向量數(shù)據(jù)庫(kù)以及公司自有的領(lǐng)域知識(shí)庫(kù),通過(guò)醫(yī)療垂直領(lǐng)域的語(yǔ)言模型訓(xùn)練和微調(diào)逐步實(shí)現(xiàn)產(chǎn)品力,并向公司內(nèi)外部的應(yīng)用場(chǎng)景,比如在醫(yī)療服務(wù)和個(gè)人健康等場(chǎng)景中輸出AI智能服務(wù)。
在臨床醫(yī)療服務(wù)方面,BSoftGPT可以根據(jù)醫(yī)生提供的病歷信息和臨床數(shù)據(jù),自動(dòng)化生成臨床決策建議和治療方案,從而輔助醫(yī)生進(jìn)行臨床決策,提升現(xiàn)有的臨床決策支持系統(tǒng)CDSS的智能化水平;
在面向患者服務(wù)方面,BSoftGPT可以通過(guò)與患者進(jìn)行自然語(yǔ)言交互,實(shí)現(xiàn)貫穿患者診前診中診后全流程的智能導(dǎo)診、管理。
BSoftGPT平臺(tái)將成為創(chuàng)業(yè)慧康A(chǔ)I能力的中臺(tái),是公司關(guān)鍵技術(shù)基礎(chǔ)設(shè)施之一,能夠?yàn)楣镜臉I(yè)務(wù)應(yīng)用和研究開(kāi)發(fā)提供支持和幫助。
5月12日,衛(wèi)寧健康發(fā)文公布了公司在醫(yī)療垂直領(lǐng)域的大語(yǔ)言模型上的研究進(jìn)展。
據(jù)介紹,衛(wèi)寧健康自2017年起在醫(yī)療AI領(lǐng)域進(jìn)行布局,并于2023年1月開(kāi)展了衛(wèi)寧健康醫(yī)療語(yǔ)言大模型WiNGPT的研發(fā)和訓(xùn)練工作。
今年3月,實(shí)驗(yàn)室已完成了WiNGPT可行性驗(yàn)證并開(kāi)始內(nèi)測(cè),WiNGPT采用通用GPT架構(gòu)、60億參數(shù),實(shí)現(xiàn)了從預(yù)訓(xùn)練到微調(diào)的醫(yī)療大語(yǔ)言模型全過(guò)程自有研發(fā);
5月,WiNGPT訓(xùn)練的數(shù)據(jù)量已達(dá)到9720項(xiàng)藥品知識(shí)、 7200余項(xiàng)疾病知識(shí)、 2800余項(xiàng)檢查檢驗(yàn)知識(shí)、1100余份指南文檔,總訓(xùn)練Token數(shù)達(dá)37億。共包含7大類基礎(chǔ)任務(wù)(問(wèn)答、多輪對(duì)話、信息抽取、歸一化、文本相似計(jì)算、摘要、分類、生成)與20多項(xiàng)子任務(wù)。
衛(wèi)寧健康將大模型WiNGPT以Copilot輔助診斷模式融合到WiNEX產(chǎn)品中,WiNGPT Copilot產(chǎn)品面向?qū)I(yè)醫(yī)療工作者,通過(guò)專業(yè)人士的審核和決策更好地服務(wù)最終患者,同時(shí)會(huì)使用知識(shí)庫(kù)、模板和規(guī)則來(lái)確保數(shù)據(jù)準(zhǔn)確性。
WiNEX Copilot產(chǎn)品預(yù)計(jì)將于10月Winning World2023大會(huì)上正式發(fā)布。
2月17日,東軟集團(tuán)宣布成為文心一言首批生態(tài)合作伙伴,優(yōu)先內(nèi)測(cè)試用文心一言,集成其技術(shù)能力,在產(chǎn)品研發(fā)、標(biāo)準(zhǔn)制定等多個(gè)領(lǐng)域展開(kāi)深化合作。
4月28日,據(jù)東軟集團(tuán)官微,東軟智能醫(yī)療科技研究院(以下簡(jiǎn)稱研究院)已正式發(fā)布基于醫(yī)學(xué)影像分割大模型的飛標(biāo)醫(yī)學(xué)影像標(biāo)注平臺(tái)4.0版。
為解決模型碎片化的問(wèn)題,研究院通過(guò)深入研究在醫(yī)學(xué)影像領(lǐng)域預(yù)訓(xùn)練大模型技術(shù),通過(guò)“預(yù)訓(xùn)練大模型+下游任務(wù)微調(diào)”的方式,從大量標(biāo)記和未標(biāo)記的數(shù)據(jù)中捕獲知識(shí),擴(kuò)展模型的泛化能力。
同時(shí),研究院結(jié)合東軟自身積累的帶有標(biāo)注數(shù)據(jù)的大量數(shù)據(jù)集,對(duì)預(yù)訓(xùn)練大模型進(jìn)行二次訓(xùn)練,并針對(duì)醫(yī)學(xué)影像的三維特點(diǎn)進(jìn)行優(yōu)化,推出了醫(yī)學(xué)影像分割大模型MISM。
借助醫(yī)學(xué)影像分割大模型MISM,飛標(biāo)平臺(tái)4.0版可實(shí)現(xiàn)通過(guò)一個(gè)點(diǎn)、一個(gè)邊界框,一鍵分割出病灶或解剖結(jié)構(gòu)的功能,能夠更精準(zhǔn)的連續(xù)逐層標(biāo)注。
6月20日,東與軟集團(tuán)官微再次發(fā)文,介紹了近日推出的添翼醫(yī)療領(lǐng)域大模型。
添翼醫(yī)療領(lǐng)域大模型是同時(shí)面向醫(yī)生與患者雙方的產(chǎn)品。醫(yī)生可通過(guò)自然語(yǔ)言與添翼醫(yī)療領(lǐng)域大模型交互,快速、精準(zhǔn)地完成醫(yī)療報(bào)告與病歷、醫(yī)囑開(kāi)立;
同時(shí),添翼醫(yī)療領(lǐng)域大模型還能夠?yàn)榛颊咛峁┤娴脑\后健康飲食、營(yíng)養(yǎng)與運(yùn)動(dòng)建議等服務(wù)。
其多模態(tài)數(shù)據(jù)融合能力,也將為醫(yī)院管理者提供對(duì)話式交互與數(shù)據(jù)洞察,簡(jiǎn)化數(shù)據(jù)利用,助力醫(yī)院精細(xì)化管理。
5月25日,互聯(lián)網(wǎng)醫(yī)療公司醫(yī)聯(lián)正式發(fā)布了其自主研發(fā)的醫(yī)療大語(yǔ)言模型——MedGPT。該系統(tǒng)基于Transformer模型架構(gòu)研發(fā),致?于在真實(shí)醫(yī)療場(chǎng)景中發(fā)揮實(shí)際診療價(jià)值,實(shí)現(xiàn)從疾病預(yù)防、診斷、治療、康復(fù)的全流程智能化診療能力。
據(jù)介紹,MedGPT能夠通過(guò)多輪問(wèn)診,引導(dǎo)患者收集足夠的診斷決策因?之后再進(jìn)?到診斷環(huán)節(jié),通過(guò)收集足夠信息并做出符合醫(yī)學(xué)的決策,以“治愈”為目的而進(jìn)行人機(jī)交互。
通過(guò)獨(dú)有的將?然語(yǔ)??模型AI技術(shù)與?系列?程調(diào)優(yōu)技術(shù)以及醫(yī)學(xué)?致性校驗(yàn)技術(shù)相結(jié)合,并在模型微調(diào)訓(xùn)練階段采??量真實(shí)醫(yī)?參與的RLHF(Reinforcement Learning from Human Feedback) 監(jiān)督微調(diào),有效提升模型的疾病特征判斷與模式識(shí)別能?,確保醫(yī)療準(zhǔn)確性。
此外,醫(yī)聯(lián)還建立了基于專家評(píng)議的AI診療準(zhǔn)確性與真實(shí)世界醫(yī)?對(duì)標(biāo)測(cè)試機(jī)制,不斷將AI與真實(shí)診療場(chǎng)景對(duì)齊,最終實(shí)現(xiàn)準(zhǔn)確診斷。
基于Transformer架構(gòu),MedGPT可以整合多種醫(yī)學(xué)檢驗(yàn)檢測(cè)模態(tài)能力,首次實(shí)現(xiàn)線上問(wèn)診到醫(yī)學(xué)檢查的?縫銜接。在問(wèn)診環(huán)節(jié)結(jié)束之后,MedGPT會(huì)給患者開(kāi)具必要的醫(yī)學(xué)檢查項(xiàng)目以進(jìn)一步明確病情,患者則可以通過(guò)醫(yī)聯(lián)云檢驗(yàn)等多模態(tài)能力進(jìn)行檢查。
基于有效問(wèn)診以及醫(yī)學(xué)檢查數(shù)據(jù),MedGPT得以進(jìn)行準(zhǔn)確的疾病診斷,并為患者設(shè)計(jì)疾病治療方案。患者可以通過(guò)醫(yī)聯(lián)互聯(lián)網(wǎng)醫(yī)院實(shí)現(xiàn)送藥到家,MedGPT會(huì)在患者收到藥品后主動(dòng)為患者進(jìn)行用藥指導(dǎo)與管理、智能隨訪復(fù)診、康復(fù)指導(dǎo)等智能化疾病診療動(dòng)作。
通過(guò)多模態(tài)應(yīng)用的打通,MedGPT實(shí)現(xiàn)了預(yù)防、診斷、治療、康復(fù)的全流程診療。
MedGPT目前的參數(shù)規(guī)模為100B規(guī)模,預(yù)訓(xùn)練階段使?了超過(guò)20億的醫(yī)學(xué)文本數(shù)據(jù),微調(diào)訓(xùn)練階段使?了800萬(wàn)條的高質(zhì)量結(jié)構(gòu)化臨床診療數(shù)據(jù),并投?超過(guò)100名醫(yī)?參與??反饋監(jiān)督微調(diào)訓(xùn)練。
目前,MedGPT 已經(jīng)可以覆蓋 ICD10 的60%疾病病種,并在近期將研發(fā)重心傾斜在多發(fā)疾病,以提升數(shù)字醫(yī)院的普惠率。預(yù)計(jì)在 2023 年底,可以覆蓋80%病種的就診需求。
5月24日,云知聲發(fā)布山海大模型。云知聲創(chuàng)始人、CEO黃偉在發(fā)布會(huì)上介紹,將以山海大模型為基礎(chǔ),打造MaaS 模式的AI 2.0解決方案,在通用能力基礎(chǔ)上,增強(qiáng)物聯(lián)、醫(yī)療等行業(yè)能力。
在醫(yī)療場(chǎng)景中,云知聲基于過(guò)往數(shù)據(jù)與經(jīng)驗(yàn)積累,依托山海大模型全面升級(jí)醫(yī)療業(yè)務(wù)線各產(chǎn)品智能化水平,發(fā)布手術(shù)病歷撰寫助手、門診病歷生成系統(tǒng)、商保智能理賠系統(tǒng)三大醫(yī)療產(chǎn)品應(yīng)用,實(shí)現(xiàn)從助手到專家的躍遷。
5月20日,智慧眼發(fā)布了多模態(tài)醫(yī)療大模型“砭石”?!绊臼贬t(yī)療大模型采用知識(shí)圖譜與大模型相結(jié)合的技術(shù)路線,實(shí)現(xiàn)對(duì)問(wèn)診的文本數(shù)據(jù)、醫(yī)療影像數(shù)據(jù)、用戶的面部體征視頻數(shù)據(jù)和用戶睡眠音頻數(shù)據(jù)的多模態(tài)處理,實(shí)現(xiàn)醫(yī)療輔助診斷、智能認(rèn)知、健康管理等多樣化的任務(wù)。
基于砭石的場(chǎng)景應(yīng)用能力,智慧眼發(fā)布云慢病患者服務(wù)管理系統(tǒng),包含醫(yī)院患者服務(wù)管理系統(tǒng)和藥店患者服務(wù)管理系統(tǒng),將加速醫(yī)療行業(yè)數(shù)智化,為患者提供全生命周期健康管理服務(wù)。
智慧眼研究院負(fù)責(zé)人表示,“砭石”醫(yī)療大模型將以大模型為基礎(chǔ),深入決策支持、醫(yī)??刭M(fèi)、醫(yī)藥服務(wù)、健康管理、保險(xiǎn)支付等諸多場(chǎng)景:
通過(guò)砭石大模型輔助診療技術(shù),為基層醫(yī)務(wù)人員提供病歷質(zhì)控、輔助診斷、合理用藥、醫(yī)學(xué)知識(shí)檢索等技術(shù)支持;
搭建風(fēng)險(xiǎn)控制模型,以更為常態(tài)化、高效精準(zhǔn)的方式挖掘數(shù)據(jù)之下的欺詐騙保行為,對(duì)購(gòu)藥、門診、健康理療等行為進(jìn)行自動(dòng)化的分析、監(jiān)管和預(yù)警;
開(kāi)發(fā)云慢病患者服務(wù)管理系統(tǒng),通過(guò)賦能B端服務(wù)C端,AI將聯(lián)通診前、診中、診后實(shí)現(xiàn)慢病管理的閉環(huán),通過(guò)數(shù)字療法促進(jìn)慢性病積極管理;
以砭石大模型為技術(shù)底座,打通了醫(yī)療服務(wù)的需求方、服務(wù)方、支付方和藥品提供方,提供智能導(dǎo)診、問(wèn)診購(gòu)藥、復(fù)診續(xù)方、醫(yī)生在線接診、開(kāi)方審方、處方流轉(zhuǎn)、醫(yī)保結(jié)算、藥物配送和用藥跟蹤等一站式服務(wù)等。
5月17日,上海市算力網(wǎng)絡(luò)數(shù)字醫(yī)療創(chuàng)新實(shí)驗(yàn)室全部自主研發(fā)的醫(yī)療算網(wǎng)大模型Uni-talk發(fā)布。
上海市算力網(wǎng)絡(luò)數(shù)字醫(yī)療創(chuàng)新實(shí)驗(yàn)室由上海聯(lián)通、華山醫(yī)院、上海超算中心和華為聯(lián)合組建,“Uni-talk”算力網(wǎng)絡(luò)醫(yī)療大模型是實(shí)驗(yàn)室成立以來(lái)交的“第一份答卷”。
“Uni-talk”是一款自主可控、行業(yè)定制的國(guó)產(chǎn)化大模型產(chǎn)品,在嚴(yán)格遵守國(guó)家數(shù)據(jù)安全管理要求下,實(shí)驗(yàn)室將數(shù)據(jù)信息進(jìn)行私有化部署與訓(xùn)練,基于聯(lián)通算網(wǎng)智能管控與算力統(tǒng)一調(diào)度編排能力,在通用模型基礎(chǔ)能力之上,融入垂直領(lǐng)域?qū)I(yè)知識(shí),大幅提升場(chǎng)景感知和理解能力,逐步實(shí)現(xiàn)通用人工智能到醫(yī)療人工智能領(lǐng)域的融會(huì)貫通。
Uni-talk是首個(gè)基于算力網(wǎng)絡(luò)的醫(yī)療算法模型,依托上海聯(lián)通算網(wǎng)大腦,通過(guò)多元算力實(shí)時(shí)感知、云網(wǎng)協(xié)同、智能決策等算網(wǎng)融合關(guān)鍵技術(shù),實(shí)現(xiàn)對(duì)跨區(qū)域異構(gòu)算力的智能管控與統(tǒng)一編排,助力模型高效訓(xùn)練迭代。
同時(shí),“Uni-talk”在通用大規(guī)模多語(yǔ)言語(yǔ)料知識(shí)庫(kù)基礎(chǔ)上,基于醫(yī)療知識(shí)圖譜重點(diǎn)融合學(xué)習(xí)了醫(yī)學(xué)領(lǐng)域?qū)I(yè)知識(shí),知識(shí)庫(kù)收集整理接近億條醫(yī)療專業(yè)知識(shí)資料進(jìn)行深度訓(xùn)練學(xué)習(xí),保障模型的推理質(zhì)量、準(zhǔn)確性與可靠性。華山醫(yī)院將Uni-talk應(yīng)用于專業(yè)醫(yī)學(xué)文獻(xiàn)檢索、輔助診斷等多個(gè)場(chǎng)景。
6月29日,由上海人工智能實(shí)驗(yàn)室牽頭,并聯(lián)合國(guó)內(nèi)外頂級(jí)科研機(jī)構(gòu)、高校及醫(yī)院共同發(fā)布全球首個(gè)醫(yī)療多模態(tài)基礎(chǔ)模型群“OpenMEDLab浦醫(yī)”。
“OpenMEDLab浦醫(yī)”融合了全球頂尖的AI研發(fā)能力、海量醫(yī)學(xué)數(shù)據(jù)以及醫(yī)學(xué)專家知識(shí),首批發(fā)布的基礎(chǔ)模型群中,包含基于醫(yī)學(xué)圖像、醫(yī)學(xué)文本、生物信息、蛋白質(zhì)工程等10余種數(shù)據(jù)模態(tài)訓(xùn)練而成的基礎(chǔ)模型。
據(jù)介紹,基于計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理大模型對(duì)醫(yī)療圖像和文本通用特征的學(xué)習(xí),上海人工智能實(shí)驗(yàn)室首先針對(duì)不同醫(yī)療數(shù)據(jù)模態(tài)開(kāi)發(fā)了一系列基模型,例如CT、MRI、超聲、內(nèi)鏡、病理、醫(yī)學(xué)文本等,以充分學(xué)習(xí)和利用不同數(shù)據(jù)模態(tài)獨(dú)有的特征和模式。
基于上述多層級(jí)、多場(chǎng)景的基礎(chǔ)模型群,“OpenMEDLab浦醫(yī)”可以將先前醫(yī)學(xué)數(shù)據(jù)訓(xùn)練中學(xué)習(xí)到的特征,高效應(yīng)用于海量醫(yī)療下游問(wèn)題中,從而實(shí)現(xiàn)針對(duì)不同任務(wù)的小數(shù)據(jù)、弱標(biāo)注、高效率的訓(xùn)練。同時(shí),模型群兼顧性能與落地的平衡,在醫(yī)療場(chǎng)景中的部署應(yīng)用更具便捷性,從而讓基礎(chǔ)模型在更多醫(yī)療長(zhǎng)尾問(wèn)題中得以落地應(yīng)用。
“OpenMEDLab浦醫(yī)”研發(fā)團(tuán)隊(duì)已與全國(guó)多家頭部三甲醫(yī)院及醫(yī)藥企業(yè)開(kāi)展合作,全方位賦能醫(yī)院診療及藥物研發(fā)工作。
“OpenMEDLab浦醫(yī)”將于近期逐步開(kāi)源,覆蓋醫(yī)學(xué)圖像、醫(yī)學(xué)文本、生物信息、蛋白質(zhì)工程等10余種醫(yī)療數(shù)據(jù)模態(tài),促進(jìn)基于醫(yī)療基礎(chǔ)模型的跨領(lǐng)域、跨疾病、跨模態(tài)科研突破,推動(dòng)醫(yī)療大模型的產(chǎn)業(yè)落地。
近日,香港中文大學(xué)(深圳)和深圳市大數(shù)據(jù)研究院的王本友教授團(tuán)隊(duì)訓(xùn)練并開(kāi)源了一個(gè)新的醫(yī)療大模型 ——HuatuoGPT(華佗GPT),基于醫(yī)生回復(fù)和 ChatGPT 回復(fù),讓語(yǔ)言模型成為醫(yī)生提供豐富且準(zhǔn)確的問(wèn)診。
研究團(tuán)隊(duì)利用指令微調(diào)和強(qiáng)化學(xué)習(xí)在 ChatGPT 和醫(yī)生的回復(fù)中找到結(jié)合點(diǎn),訓(xùn)練并開(kāi)源了一個(gè)新的醫(yī)療大模型 ——HuatuoGPT。
HuatuoGPT 致力于通過(guò)融合 ChatGPT 生成的 “蒸餾數(shù)據(jù)” 和真實(shí)世界醫(yī)生回復(fù)的數(shù)據(jù),以使語(yǔ)言模型具備像醫(yī)生一樣的診斷能力和提供有用信息的能力,同時(shí)保持對(duì)用戶流暢的交互和內(nèi)容的豐富性。
為了進(jìn)一步提升模型生成的質(zhì)量,HuatuoGPT 還應(yīng)用了基于 AI 反饋的強(qiáng)化學(xué)習(xí)技術(shù)(RLAIF)。
使用 ChatGPT 對(duì)模型生成的內(nèi)容進(jìn)行評(píng)分,考慮內(nèi)容的用戶友好程度,并結(jié)合醫(yī)生的回答作為參考,將醫(yī)生回復(fù)的質(zhì)量納入考量。
利用 PPO 算法將模型的生成偏好調(diào)整到醫(yī)生和用戶之間的一致性,從而增強(qiáng)模型生成豐富、詳盡且正確的診斷。
5月30日,聯(lián)影智能CTO吳迪嘉在《第二屆長(zhǎng)三角科技產(chǎn)業(yè)創(chuàng)新論壇暨AI大模型產(chǎn)業(yè)應(yīng)用高峰論壇》上介紹,聯(lián)影智能通過(guò)AI應(yīng)用賦能精準(zhǔn)醫(yī)療,目前能夠做到多場(chǎng)景、多疾?。ㄐ呐K、癌癥、大腦)、全病程療效評(píng)估與智能隨訪、一站式分析的應(yīng)用,針對(duì)卒中提供篩查與診斷一體化影像平臺(tái),落地全國(guó)首個(gè)數(shù)智化基層協(xié)同救治體系。
吳迪嘉介紹,基于多病種影像數(shù)據(jù)訓(xùn)練的醫(yī)療影像模型,以及醫(yī)療文本/知識(shí)模型的創(chuàng)新基礎(chǔ)模型,聯(lián)影智能正在構(gòu)建醫(yī)用通才大模型 ,進(jìn)一步賦能中國(guó)未來(lái)醫(yī)療開(kāi)發(fā)者,為醫(yī)療場(chǎng)景提供診療服務(wù)。
(雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))《醫(yī)健AI掘金志》后續(xù)將推出更多醫(yī)療大模型相關(guān)話題文章,如《醫(yī)療信息化廠商的「GPT焦慮癥」》等,歡迎添加作者微信qiaoyw186搶先交流。)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。