丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
醫(yī)療科技 正文
發(fā)私信給李雨晨
發(fā)送

1

思路清奇!南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊:AI將影像排版時(shí)間縮短至100秒,準(zhǔn)確率近于100%

本文作者: 李雨晨 2019-06-20 10:21
導(dǎo)語(yǔ):這是一個(gè)優(yōu)化醫(yī)學(xué)流程的獨(dú)特視角。

思路清奇!南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊:AI將影像排版時(shí)間縮短至100秒,準(zhǔn)確率近于100%

過(guò)去幾年,AI在醫(yī)學(xué)影像方面取得了諸多成果。在影像學(xué)科的臨床工作流程中,肺部病變的良、惡性鑒別診斷,已經(jīng)成為AI創(chuàng)業(yè)公司爭(zhēng)先恐后涌入的賽道。但是,多數(shù)創(chuàng)業(yè)公司基本上是停留在后端的疾病診斷層面,在此之前的圖像采集、圖像呈現(xiàn)階段,其實(shí)都有文章可做。

雷鋒網(wǎng)了解到,近日,南京鼓樓醫(yī)院醫(yī)學(xué)影像科張冰團(tuán)隊(duì),在柳葉刀子刊EBiomedicine發(fā)表了一則AI醫(yī)療的新成果,直面影像科醫(yī)生工作流程前端的痛點(diǎn)問(wèn)題。

該團(tuán)隊(duì)選擇了一個(gè)全新的切入點(diǎn)——從臨床影像工作全流程角度出發(fā),提出了一種基于深度學(xué)習(xí)的智能成像排版系統(tǒng)(IILS),系統(tǒng)包括AI肺結(jié)節(jié)檢測(cè)和分類(lèi)和自適應(yīng)排版工具,用于結(jié)節(jié)識(shí)別的成像報(bào)告標(biāo)準(zhǔn)化和工作流程優(yōu)化。

成人的典型胸部CT掃描有大約三百?gòu)垐D像。 然而,最終排版僅約為四十幅圖像。 因此,大約87.7%的圖像被忽略了。特別是當(dāng)肺結(jié)節(jié)的直徑小于1 cm時(shí),相應(yīng)報(bào)告不能與排版結(jié)果100%匹配。 

據(jù)雷鋒網(wǎng)了解,團(tuán)隊(duì)提出的胸部CT排版工具,使用來(lái)自11205名患者的CT成像數(shù)據(jù),可以適應(yīng)全自動(dòng)或者半自動(dòng)的影像學(xué)圖像的排版問(wèn)題。以往人工診斷到排版需要花費(fèi)約2小時(shí)的時(shí)間,在這個(gè)工具的幫助下,時(shí)間可以降低到約100秒。

以下為論文詳細(xì)內(nèi)容,由雷鋒網(wǎng)AI掘金志學(xué)術(shù)組編譯。關(guān)注AI掘金志公眾號(hào),在對(duì)話框回復(fù)關(guān)鍵詞“南京鼓樓”,即可獲取原文PDF。

1、引言

臨床任務(wù)的一個(gè)典型例子是,分類(lèi)并生成與肺結(jié)節(jié)的診斷密切相關(guān)的胸部CT圖像的布局。在篩查檢測(cè)和隨訪期間,目前的日常工作流程中仍存在五個(gè)問(wèn)題。

1、成像報(bào)告標(biāo)準(zhǔn)化缺乏:由于沒(méi)有標(biāo)準(zhǔn)化、科學(xué)驗(yàn)證的方法評(píng)估結(jié)節(jié),試驗(yàn)放射科醫(yī)師制定了診斷隨訪的指南,但沒(méi)有強(qiáng)制要求評(píng)估方法(圖1)。

2、缺失結(jié)節(jié):如果干激光膠片用作成像信息載體,則無(wú)法顯示與報(bào)告中的描述相對(duì)應(yīng)的結(jié)節(jié)(圖2),這是一個(gè)常見(jiàn)問(wèn)題。

3、缺少關(guān)鍵圖像:在從CT掃描儀獲取圖像之后,大量圖像不加選擇地輸入到PACS中。此外,許多臨床醫(yī)生對(duì)成像知識(shí)相對(duì)不熟悉,需要花費(fèi)大量時(shí)間和精力來(lái)瀏覽這些缺乏關(guān)鍵信息的復(fù)雜圖像,更不用說(shuō)使用智能手機(jī)或平板電腦來(lái)檢查這些圖像。而且,許多無(wú)效圖像經(jīng)常出現(xiàn)在一系列圖像中(圖2)。因此,治療過(guò)程極其低效。

4、訪問(wèn)來(lái)自其他醫(yī)院的圖像困難:如果患者需要他或她自己的圖像,圖像通常在光盤(pán)(CD)上刻錄或通過(guò)便攜式硬盤(pán)驅(qū)動(dòng)器傳輸。然而,許多現(xiàn)代計(jì)算機(jī)沒(méi)有配備CD驅(qū)動(dòng)器或醫(yī)院禁止使用計(jì)算機(jī)的通用串行總線(USB)接口。因此,患者在不同醫(yī)院都要進(jìn)行掃描成像。

5、 缺乏對(duì)臨床醫(yī)生和患者需求的考慮(圖2):作為放射科醫(yī)師,幫助他人更容易閱讀和理解成像結(jié)果的機(jī)會(huì)尚未得到充分利用。因此,迫切需要具有關(guān)鍵圖像的電子報(bào)告和可視化結(jié)構(gòu)化報(bào)告來(lái)解決這些問(wèn)題。

當(dāng)前,AI的應(yīng)用似乎忽略了兩個(gè)事實(shí)。首先,高質(zhì)量的標(biāo)準(zhǔn)化圖像是人工智能開(kāi)發(fā)的基礎(chǔ),其次,AI可以接管簡(jiǎn)單和重復(fù)的工作。

在這項(xiàng)研究中,我們尋求開(kāi)發(fā)基于人工智能技術(shù)和自適應(yīng)布局工具融合的智能成像排版系統(tǒng)(IILS),以建立日常工作的新流程,并為放射科醫(yī)生和臨床醫(yī)生提供標(biāo)準(zhǔn)化圖像和報(bào)告。同時(shí),我們從三個(gè)方面評(píng)估IILS的綜合實(shí)力,包括i)IILS與臨床專家之間結(jié)節(jié)診斷效率的比較; ii)IILS可以優(yōu)化臨床工作流程的程度;iii)IILS的交叉制造適用性(cross-manufacture applicability)。

總之,我們認(rèn)為AI技術(shù)可以通過(guò)串聯(lián)連接集成到放射學(xué)工作流中,而不是基于簡(jiǎn)單的并行關(guān)系來(lái)遵循傳統(tǒng)的工作流程。

思路清奇!南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊:AI將影像排版時(shí)間縮短至100秒,準(zhǔn)確率近于100%

圖2.當(dāng)前的手工選片過(guò)程和日常工作中的相關(guān)問(wèn)題。例如,成人的典型胸部CT掃描有大約三百?gòu)垐D像。 然而,最終排版僅約為四十幅圖像。 因此,大約87.7%的圖像被忽略了。相應(yīng)報(bào)告不能與排版結(jié)果100%匹配,特別是當(dāng)肺結(jié)節(jié)的直徑小于1cm時(shí)。 以GE的CT掃描方法為例,在日常工作中使用手動(dòng)圖像排版時(shí),通常會(huì)忽略6(層)×1·25 mm(厚度)= 7·5 mm范圍內(nèi)的肺組織。因此,當(dāng)醫(yī)生獲得最終的圖像時(shí)會(huì)遇到以下問(wèn)題:缺乏成像報(bào)告標(biāo)準(zhǔn)化、缺失結(jié)節(jié)、缺乏關(guān)鍵圖像以及缺乏對(duì)臨床醫(yī)生和患者需求的考慮。

思路清奇!南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊:AI將影像排版時(shí)間縮短至100秒,準(zhǔn)確率近于100%

圖3. IILS的組成以及如何將其整合到當(dāng)前的成像過(guò)程中。新的IILS包括以下部分:一個(gè)是AI肺結(jié)節(jié)檢測(cè)和分類(lèi),另一個(gè)是自適應(yīng)排版工具,包括我們團(tuán)隊(duì)發(fā)明的自動(dòng)排版和可視化結(jié)構(gòu)化報(bào)告生成。為了確保圖像質(zhì)量和結(jié)果,我們有一位放射科醫(yī)生,他通常負(fù)責(zé)編寫(xiě)報(bào)告,仔細(xì)檢查自動(dòng)生成的結(jié)構(gòu)化報(bào)告和圖像排版結(jié)果。成像部門(mén)日常工作的整個(gè)過(guò)程包括以下關(guān)鍵步驟:i)獲?。簭牟煌R床科室的患者收集圖像信息; ii)排版:包括日常工作的手動(dòng)排版和圖像管理; iii)診斷:放射科醫(yī)師的圖像診斷,預(yù)測(cè)和評(píng)估。新型智能系統(tǒng)的應(yīng)用通過(guò)串聯(lián)而非并聯(lián)連接集成到放射工作流中。

2、材料與方法

2.1 實(shí)驗(yàn)軟件和硬件

本文中的模型均在DGX1平臺(tái)上進(jìn)行訓(xùn)練。(NVIDIA DGX1 system, 8× Tesla V100 GPUs, 128 GB total system GPUMemory, dual 20-core Intel Xeon E5–2698 CPU v4 2.2 GHz, SantaClara, California, USA)

2.2 實(shí)驗(yàn)?zāi)P秃晚?xiàng)目細(xì)節(jié)

思路清奇!南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊:AI將影像排版時(shí)間縮短至100秒,準(zhǔn)確率近于100%

圖4:數(shù)據(jù)流圖顯示了我們檢測(cè)結(jié)節(jié)和分類(lèi)良性或惡性病例的方法。本研究采用的數(shù)據(jù)是從2016年10月到2018年11月,從五個(gè)主要的不同CT制造商處獲得的11205名患者、共3527048張胸部CT掃描圖像。

訓(xùn)練過(guò)程分為兩部分,分別由兩個(gè)訓(xùn)練隊(duì)列組成。通過(guò)卷積神經(jīng)網(wǎng)絡(luò)(CNN)獲得兩個(gè)模型,通過(guò)5折交叉驗(yàn)證進(jìn)行性能評(píng)估,然后合并形成IILS的第一層,即用于檢測(cè)結(jié)節(jié)和分類(lèi)病例的篩選部分。我們將最終的兩個(gè)模型部署到包含1965個(gè)病例的獨(dú)立隊(duì)列中,通過(guò)六位臨床專家對(duì)結(jié)節(jié)數(shù)量的一致性分析,以顯示我們IILS的可信度。

八名有3到25年胸部CT經(jīng)驗(yàn)的專家作為檢查員參加了會(huì)議。為了在臨床專家的背景下評(píng)估我們的卷積神經(jīng)網(wǎng)絡(luò),我們使用1965名患者的獨(dú)立測(cè)試集來(lái)比較我們的網(wǎng)絡(luò)決策和人類(lèi)專家的決策。隨機(jī)選擇作為受試者的1965名患者進(jìn)行讀者間和讀者間再現(xiàn)性研究。

所有肺結(jié)節(jié)的數(shù)量的確定、良性和惡性結(jié)節(jié)的判斷由六位專家檢查兩次,間隔為1個(gè)月,以最小化記憶偏差。所有決策均由六位專家做出,用于讀者間的再現(xiàn)性分析。加權(quán)誤差評(píng)分用于反映假陰性結(jié)果(未做出決定)比假陽(yáng)性結(jié)果更有害。使用這些加權(quán)懲罰點(diǎn)、計(jì)算模型和每個(gè)人類(lèi)專家的錯(cuò)誤率。

即使患者有較大的病變,我們也僅包括小于30 mm的結(jié)節(jié),其大小相當(dāng)于約30 mm的平均直徑,因?yàn)榉谓Y(jié)節(jié)的定義是直徑小于3cm的病變。我們納入了疑似轉(zhuǎn)移的結(jié)節(jié)以及可能具有良性組織學(xué)特征的結(jié)節(jié)。然而,排除了粟粒性結(jié)核、間質(zhì)病變、結(jié)節(jié)病和重癥肺炎。

以下參數(shù)用于評(píng)估結(jié)節(jié)特征和圖像質(zhì)量對(duì)觀察者一致性的影響:總結(jié)節(jié)大?。ㄗ畲笾睆?,毫米)、結(jié)節(jié)類(lèi)型、良性或惡性以及肺實(shí)質(zhì)內(nèi)結(jié)節(jié)的密度。從數(shù)據(jù)庫(kù)中提取參數(shù)結(jié)節(jié)大小、良性或惡性和類(lèi)型。結(jié)節(jié)的密度由沒(méi)有參與閱讀過(guò)程的專家(H.Y 和H.W)測(cè)量。將兩個(gè)約1cm的感興趣區(qū)域放置在結(jié)節(jié)中的兩個(gè)均勻區(qū)域中,并且兩次測(cè)量中平均的Hounsfield units標(biāo)準(zhǔn)偏差是密度的度量。

2.3 病人分類(lèi)

訓(xùn)練過(guò)程中的用例隨機(jī)分為訓(xùn)練集80%和驗(yàn)證集20%(圖4)。訓(xùn)練集用于訓(xùn)練算法,驗(yàn)證集用于模型選擇,測(cè)試集用于評(píng)估最終選擇的模型。在確定百分比分割時(shí),目標(biāo)是為算法保留足夠的數(shù)據(jù)以進(jìn)行訓(xùn)練,但是具有足夠的驗(yàn)證和測(cè)試用例以保持模型準(zhǔn)確性的合理置信區(qū)間。 該數(shù)據(jù)集代表了在參與診所提供和接受治療的最常見(jiàn)的實(shí)性、鈣化或磨玻璃結(jié)節(jié)患者。

2.4 圖像標(biāo)注

在訓(xùn)練之前,每個(gè)圖像都經(jīng)過(guò)分層分級(jí)系統(tǒng),該系統(tǒng)由多級(jí)訓(xùn)練有素的評(píng)分者組成,他們具有逐級(jí)遞增的專業(yè)知識(shí),可用于圖像標(biāo)簽的驗(yàn)證和校正。導(dǎo)入數(shù)據(jù)庫(kù)的每個(gè)圖像都與患者最近診斷的標(biāo)簽相匹配。第一級(jí)評(píng)分員包括具有呼吸系統(tǒng)和成像基礎(chǔ)知識(shí)的成員。這一級(jí)評(píng)分員進(jìn)行了初步的質(zhì)量控制,并排除了包含嚴(yán)重偽影或顯著降低圖像分辨率的胸部CT圖像。第二級(jí)評(píng)分員由兩位專家組成,他們對(duì)通過(guò)第一級(jí)的每張圖像進(jìn)行獨(dú)立評(píng)分。記錄胸部CT圖像上是否存在實(shí)性,鈣化或磨玻璃結(jié)節(jié)和其他可見(jiàn)的病變。最后,第二層由兩名高級(jí)呼吸和成像專家組成,每位專家擁有超過(guò)15年的臨床呼吸和成像經(jīng)驗(yàn),獨(dú)立驗(yàn)證每張圖像的真實(shí)標(biāo)簽。所有圖像的驗(yàn)證子集由兩名專家分別評(píng)分,不一致的臨床標(biāo)簽由由高級(jí)專家仲裁,以解釋評(píng)分中的人為錯(cuò)誤。

2.5 軟件支持

軟件系統(tǒng)的開(kāi)發(fā)在Linux Ubuntu 18.04環(huán)境下進(jìn)行。Pycharm 和 VS Code用作開(kāi)發(fā)的IDE。Chrome調(diào)試器用于測(cè)試和調(diào)試UI / UX。 軟件的實(shí)現(xiàn)細(xì)節(jié)是保密的,以下部分主要描述了實(shí)現(xiàn)的設(shè)計(jì)和邏輯。

思路清奇!南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊:AI將影像排版時(shí)間縮短至100秒,準(zhǔn)確率近于100%

圖5:排版示例加上可視化結(jié)構(gòu)報(bào)告以及與傳統(tǒng)排版和報(bào)告的比較。

(a)使用IILS選擇后的新圖像排版。新的排版圖像被分為三個(gè)部分(兩個(gè)紅框的區(qū)域,代表關(guān)鍵圖像所在的區(qū)域)。顯然,與(c)相比沒(méi)有無(wú)效圖像(標(biāo)有橙色下劃線)。排版第一部分開(kāi)頭的五個(gè)小框依次顯示:1)肺窗條件下結(jié)節(jié)的最大橫截面切片的圖像(WW:1500; WL:-500),2)具有長(zhǎng)徑和短徑測(cè)量數(shù)據(jù)的圖像,3)縱隔窗口條件下的結(jié)節(jié)圖像(WW:350,WL:50),4)結(jié)節(jié)的冠狀圖像重建,5)結(jié)節(jié)的矢狀圖像重建。第二部分是在縱隔窗口條件下每層間隔的一組圖像。最后一部分是一組薄層肺組織圖像,大約分為六層。另一個(gè)便利是,片子上任一單元格中的每個(gè)圖像都可以通過(guò)其切片ID進(jìn)行跟蹤,并通過(guò)雙擊它來(lái)重定向到圖像集中的原始位置。還自動(dòng)生成與片子相關(guān)的可視化結(jié)構(gòu)報(bào)告。有關(guān)詳細(xì)信息,請(qǐng)參見(jiàn)視頻2。

(b):如果患者沒(méi)有肺結(jié)節(jié),IILS給出的排版和報(bào)告將與傳統(tǒng)系統(tǒng)給出的相似。

(c):使用傳統(tǒng)的手工排版形式,表格分為兩部分。 前部包括縱隔組織圖像,后部是肺組織圖像。 傳統(tǒng)排版格式的主要問(wèn)題是缺少關(guān)鍵圖像,各種無(wú)效圖像(一些帶橙色下劃線的圖像),以及缺少鏈接功能。 相關(guān)報(bào)告填充了文本,沒(méi)有生成結(jié)構(gòu)化報(bào)告。

2.6 自動(dòng)排版

通過(guò)將固定輸出過(guò)程分成以下子任務(wù)來(lái)執(zhí)行自動(dòng)排版:1,驗(yàn)證; 2,輸出。在驗(yàn)證任務(wù)中,我們的程序首先處理最重要的結(jié)節(jié),生成五個(gè)放大的輸出圖像,聚焦在結(jié)節(jié)上,同時(shí)突出顯示矩形,標(biāo)明肺窗形式的結(jié)節(jié)位置,長(zhǎng)徑測(cè)量,縱隔窗 和兩個(gè)方向透視。 五個(gè)輸出圖像放置在第一行,然后是30個(gè)縱隔窗口圖像,其余的為肺窗口。 具體而言,第一部分五個(gè)網(wǎng)格是單個(gè)結(jié)節(jié)的自動(dòng)排版,具有最高的惡性概率風(fēng)險(xiǎn),這可由AI預(yù)測(cè)。 五張圖片也可以由放射科醫(yī)師驗(yàn)證和覆蓋。 自適應(yīng)排版工具的輸出包括兩個(gè)電子排片和一個(gè)由四組圖像組成的結(jié)構(gòu)化報(bào)告。

與傳統(tǒng)報(bào)告的比較,IILS提供了以下信息:i)基本信息顯示:患者信息,檢查信息,放射科醫(yī)師信息等。ii)結(jié)果(來(lái)自AI預(yù)測(cè)和放射科醫(yī)師的雙重確認(rèn)):標(biāo)準(zhǔn)化描述肺結(jié)節(jié)圖像,包括結(jié)節(jié)位置,形態(tài)和密度,圖像信息的層數(shù),結(jié)節(jié)長(zhǎng)徑,體積,平均CT值,以及結(jié)節(jié)的惡性概率。此外,我們?yōu)榉派淇漆t(yī)師預(yù)留了足夠的空間,可以為其他病變編寫(xiě)定期報(bào)告。 iii)診斷感想:由放射科醫(yī)師撰寫(xiě)的診斷建議。肺部全部范圍的適應(yīng)性是主要關(guān)注點(diǎn),其意味著五個(gè)圖像是否附在第一組,即 一組顯示結(jié)節(jié)的五種形式圖像具有最高的AI預(yù)測(cè)得分為惡性,符合我們的預(yù)設(shè)的將受到高度重視。驗(yàn)證后,可以將排片導(dǎo)出為可打印格式,以便為放射科醫(yī)師和患者提供可視化信息,同時(shí)自動(dòng)生成結(jié)構(gòu)報(bào)告。

我們還推斷一個(gè)好的排版系統(tǒng)主要包括以下三個(gè)主要內(nèi)容:1)任何可靠,客觀的測(cè)量數(shù)據(jù)的所有關(guān)鍵圖像; 2)顯示腫瘤特征的一系列圖像,包括形狀,數(shù)量,密度,大小,增強(qiáng),多角度觀察和后續(xù)比較; 3)胸部縱隔窗和肺窗圖像連續(xù)顯示(圖5a-b)。 此外,我們手工顯示當(dāng)前排版形式的圖片,這在日常工作中作為比較非常普遍(圖5c)。

2.7 結(jié)構(gòu)化報(bào)告

結(jié)構(gòu)化報(bào)告生成程序旨在完成常見(jiàn)CT掃描場(chǎng)景中的完整工作流程(補(bǔ)充圖S2)。與傳統(tǒng)報(bào)告的比較,我們計(jì)劃為放射科醫(yī)師和患者提供圖像和結(jié)果的可視化。該計(jì)劃主要通過(guò)以下三個(gè)步驟進(jìn)行:1,收集資源;2,渲染圖像;3,輸出。我們現(xiàn)在將詳細(xì)描述每個(gè)步驟。為了收集資源,我們需要在我們的程序中加載多個(gè)資源,包括DICOM圖像集、AI預(yù)測(cè)結(jié)節(jié)、患者/醫(yī)院信息,以及捕獲放射科醫(yī)師的結(jié)果和診斷感想。收集必要的資源后,我們繼續(xù)進(jìn)行渲染部分。該程序?qū)⑹紫雀鶕?jù)其重要性對(duì)結(jié)節(jié)進(jìn)行排序(由AI定義,但可以由操作員覆蓋),然后在相應(yīng)的圖像上使用矩形框渲染每個(gè)結(jié)節(jié)。該程序還放大了圖像并設(shè)置其中心,重點(diǎn)放在結(jié)節(jié)本身。渲染和轉(zhuǎn)換后,將觸發(fā)特殊事件偵聽(tīng)器以通知程序捕獲渲染數(shù)據(jù)。最后,程序生成預(yù)定義的可打印輸出。

2.8 定量和統(tǒng)計(jì)分析

ROC曲線繪制了真陽(yáng)性率(TPR,靈敏度)與假陽(yáng)性率(1- 特異度)的關(guān)系曲線。通過(guò)將正確標(biāo)記的惡性結(jié)節(jié)的總數(shù)和正確標(biāo)記的良性結(jié)節(jié)的總數(shù)分別除以測(cè)試圖像的結(jié)節(jié)總數(shù)來(lái)確定靈敏度和特異度。連續(xù)變量被描述為平均值±標(biāo)準(zhǔn)誤差(SEM),并且分類(lèi)變量被表示為諸如良性/惡性(B / M)的特征。將傳統(tǒng)圖像排版組與智能系統(tǒng)組和正常對(duì)照組之間的臨床特征通過(guò)Mann-Whitney U檢驗(yàn),卡方檢驗(yàn)或Fisher精確檢驗(yàn)進(jìn)行比較。使用雙樣本Mann-Whitney U檢驗(yàn)比較傳統(tǒng)排版組與智能布局組和正常對(duì)照組之間的差異。Kappa統(tǒng)計(jì)用于衡量?jī)蓚€(gè)評(píng)估者之間的一致性程度,即AI和人類(lèi)專家。kappa值至少為0.75表示良好的一致性。 然而,我們認(rèn)為較大的kappa值,例如0.90,是優(yōu)選的。雙尾P值<0.05被認(rèn)為具有統(tǒng)計(jì)學(xué)意義。

3、結(jié)果

3.1患者和圖像特征

具有四種不同結(jié)節(jié)大小的病例及其特征和演變表明隨訪的重要性(圖6a)。表1總結(jié)了用于訓(xùn)練、驗(yàn)證和獨(dú)立測(cè)試數(shù)據(jù)集的患者和結(jié)節(jié)的特征。根據(jù)文獻(xiàn),結(jié)節(jié)類(lèi)型分為實(shí)性結(jié)節(jié)、鈣化結(jié)節(jié)和磨砂玻璃結(jié)節(jié)。工作流程圖的總體實(shí)驗(yàn)設(shè)計(jì)如圖6b所示。

思路清奇!南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊:AI將影像排版時(shí)間縮短至100秒,準(zhǔn)確率近于100%

圖6:應(yīng)用人工智能技術(shù)對(duì)不同大小肺結(jié)節(jié)的檢測(cè)過(guò)程進(jìn)行了演示,并給出了整個(gè)實(shí)驗(yàn)設(shè)計(jì)的流程圖。

3.2 模型設(shè)計(jì)和性能評(píng)估

IILS系統(tǒng)的核心設(shè)計(jì)是深度學(xué)習(xí)模型,該模型分為兩個(gè)部分,F(xiàn)aster RCNN和ResNet。Faster RCNN主要負(fù)責(zé)肺結(jié)節(jié)的檢測(cè)和定位。Faster RCNN 還有助于將肺結(jié)節(jié)分為以下幾類(lèi):0-3 mm、3-6mm、6-0mm、10-30mm肺結(jié)節(jié),實(shí)性結(jié)節(jié)、鈣化結(jié)節(jié)和磨砂玻璃結(jié)節(jié)(GGNs)。第二部分是ResNet,主要負(fù)責(zé)肺結(jié)節(jié)良惡性的分類(lèi)。在第一部分中,關(guān)于特征提取,我們使用了ResNet-50 中的層conv4_x作為輸出。在我們的嘗試中,ResNet-50中的層conv4_x在檢測(cè)中表現(xiàn)出最佳性能。在區(qū)域建議網(wǎng)絡(luò)(RPN)中,采用二元交叉熵作為分類(lèi)損失函數(shù),選取smooth L1損失函數(shù)作為回歸損失函數(shù)。模型的訓(xùn)練過(guò)程完善,曲線均達(dá)到收斂。該模型的訓(xùn)練過(guò)程是完美的,所有曲線均達(dá)到收斂。RPN的訓(xùn)練過(guò)程如圖7a-b所示,所有曲線收斂為零。這也表明我們的模型能夠很好地區(qū)分前景和背景,并提供了一個(gè)精確的前景邊界框。圖7c曲線也收斂到零,該曲線的收斂性表明,該模型能夠很好地區(qū)分7類(lèi)肺結(jié)節(jié)。第二部分,我們用ResNet對(duì)結(jié)節(jié)良惡性進(jìn)行了分類(lèi)。為了獲得更準(zhǔn)確的模型并避免梯度分散等問(wèn)題,我們選擇了ResNet。在IILS系統(tǒng)中,ResNet顯現(xiàn)出了優(yōu)異的分類(lèi)性能。曲線的收斂代表了我們分類(lèi)工作的成功;在模型精度方面,訓(xùn)練和驗(yàn)證曲線均接近100%(訓(xùn)練過(guò)程為100%,驗(yàn)證過(guò)程為97%)。在損失函數(shù)部分,曲線也顯示該模型在良惡性結(jié)節(jié)的分類(lèi)上表現(xiàn)良好。

思路清奇!南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊:AI將影像排版時(shí)間縮短至100秒,準(zhǔn)確率近于100%

圖7:檢測(cè)結(jié)節(jié)的訓(xùn)練過(guò)程的性能。

3.3 IILS與人類(lèi)專家對(duì)結(jié)節(jié)診斷效率的比較

我們?cè)u(píng)估了我們的模型檢測(cè)和分類(lèi)最常見(jiàn)的肺結(jié)節(jié)。該模型檢測(cè)并分類(lèi)具有不同等級(jí)良性和惡性腫瘤結(jié)節(jié)的圖像作為“原發(fā)性結(jié)節(jié)”。這些情況需要相對(duì)緊急的轉(zhuǎn)診到相關(guān)的呼吸內(nèi)科醫(yī)生或胸外科醫(yī)生那里進(jìn)行最終治療。該系統(tǒng)將具有良性肺或假陽(yáng)性結(jié)節(jié)的圖像分類(lèi),其具有成為惡性腫瘤的可能性低,“僅在可視化結(jié)構(gòu)化報(bào)告中顯示”。在臨床工作中非常常見(jiàn)的微觀結(jié)節(jié)不適用于惡性腫瘤;因此,轉(zhuǎn)診給相關(guān)專家進(jìn)行治療的緊迫性較小。

在這里,我們?cè)噲D解釋人工智能與人類(lèi)專家相比在檢測(cè)肺結(jié)節(jié)方面的優(yōu)勢(shì)。在本研究中,我們采用了一種簡(jiǎn)單直觀的方法,即對(duì)檢測(cè)到的結(jié)節(jié)與金標(biāo)準(zhǔn)篩選到的結(jié)節(jié)的一致性程度進(jìn)行評(píng)估。以病理金標(biāo)準(zhǔn)為參照,分別采用Kappa一致性系數(shù)和Mann-Whitney U檢驗(yàn)進(jìn)行一致性分析。引人注目的是,除了AI之外,在所有成對(duì)比較中存在差異(AI為p=0.138,其他比較為p<0.001)。與人類(lèi)專家相比,AI也可以與金標(biāo)準(zhǔn)檢測(cè)到的肺結(jié)節(jié)顯著一致,AI由于其最高的一致性系數(shù)而脫穎而出(AI kappa=0.94,其他比較p<0.001)。我們進(jìn)一步比較了不同尺寸范圍內(nèi)檢測(cè)到的結(jié)節(jié)的一致性,并證明無(wú)論結(jié)核大小范圍如何,AI都顯示出超出人類(lèi)專家的金標(biāo)準(zhǔn)更有利的一致性。

思路清奇!南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊:AI將影像排版時(shí)間縮短至100秒,準(zhǔn)確率近于100%

圖10:應(yīng)用于五個(gè)不同制造商的成像設(shè)備時(shí),AI在肺結(jié)節(jié)診斷一致性方面的表現(xiàn)。

3.4 IILS的交叉-設(shè)備適用性

既然AI已被證實(shí)在檢測(cè)結(jié)節(jié)方面優(yōu)于人類(lèi)專家,無(wú)論大小如何,有必要從另一個(gè)角度來(lái)判斷AI的適用性?;旧希珹I的診斷取決于現(xiàn)有制造商生產(chǎn)的圖像;因此,評(píng)估不同制造商的圖像輸出對(duì)AI檢測(cè)到的結(jié)節(jié)的影響是合理的。為了在參考黃金標(biāo)準(zhǔn)的條件下探索AI對(duì)不同成像制造商的適應(yīng)性,通過(guò)Mann-Whitney U檢驗(yàn)和kappa一致性分析,進(jìn)一步評(píng)價(jià)AI與金標(biāo)準(zhǔn)診斷不同廠家不同大小結(jié)節(jié)的一致性。總體而言,AI在五家制造商上配置良好,與黃金標(biāo)準(zhǔn)相比沒(méi)有差異(通用為p=0.576,飛利浦為p=0.472,西門(mén)子為p=0.988,東芝為p=0.376,聯(lián)影(UI)為p=0.343)。此外,實(shí)現(xiàn)了高一致性,kappa系數(shù)為0.87到0.99之間(圖10)。

思路清奇!南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊:AI將影像排版時(shí)間縮短至100秒,準(zhǔn)確率近于100%

圖11 評(píng)估AI在識(shí)別良性或惡性病變中的表現(xiàn)

3.5 通過(guò)獨(dú)立數(shù)據(jù)驗(yàn)證IILS在診斷方面優(yōu)于人類(lèi)專家的表現(xiàn)

使用284例病理結(jié)果患者的獨(dú)立數(shù)據(jù)進(jìn)行比較,使用相同的數(shù)據(jù)集比較惡性肺結(jié)節(jié)和良性結(jié)節(jié),以確定模型性能的準(zhǔn)確性。我們推斷,我們最初的預(yù)測(cè)模型完全適用于臨床,因?yàn)槠銻OC下面積對(duì)于惡性肺結(jié)節(jié)相對(duì)于良性肺結(jié)節(jié)高達(dá)90.6%(圖11a)。在0.5的評(píng)分截?cái)嘞拢?24例預(yù)測(cè)為真陽(yáng)性,1479例為真陰性。約有38例被標(biāo)記為假陽(yáng)性,181例為假陰性。敏感性76.5%,特異性89.1%(圖11b)。在另一組284例病理金標(biāo)準(zhǔn)患者中,模型和人類(lèi)專家的預(yù)測(cè)性能在曲線上進(jìn)行了比較,得出結(jié)論:人工智能在敏感性和特異性方面優(yōu)于其他6名專家。此外,與人類(lèi)專家相比,人工智能顯示出最高的準(zhǔn)確性;正確預(yù)測(cè)248例(87.3%,預(yù)測(cè)為真陽(yáng)性或真陰性的人數(shù)除以284),錯(cuò)誤預(yù)測(cè)最少,36例(12.7%)。

3.6 自動(dòng)自適應(yīng)布局工具的設(shè)計(jì)與評(píng)估

根據(jù)2018年NCCN指南的要求,我們與六位專家(三位放射科醫(yī)生和三位臨床醫(yī)生)進(jìn)行了討論后,就良好的圖像布局形式達(dá)成了最終共識(shí)。為了模擬醫(yī)學(xué)成像部門(mén)胸部CT掃描后的日常工作結(jié)果,我們?cè)O(shè)計(jì)了一種自動(dòng)自適應(yīng)布局工具,可以生成“自動(dòng)膠片布局和肺結(jié)節(jié)結(jié)構(gòu)報(bào)告”,以連接到CNN網(wǎng)絡(luò)的輸出。自動(dòng)自適應(yīng)布局工具可以導(dǎo)出關(guān)鍵肺結(jié)節(jié)圖像(具有增加的惡性風(fēng)險(xiǎn)的結(jié)節(jié))的膠片布局并生成結(jié)構(gòu)化報(bào)告。兩種膠片布局都以固定格式使用(一部膠片上有5×8網(wǎng)格)。將180名患者的胸部CT圖像混合并連續(xù)輸入到IILS,以模擬來(lái)自不同制造商的圖像在日常工作中進(jìn)入工作站的情況。評(píng)估了自適應(yīng)布局工具的特性以及是否可以成功布局。這180名患者的圖像總數(shù)為60660,包括縱隔12240例窗口圖像和48420張肺窗圖像。使用5點(diǎn)量表方法來(lái)最終判斷電子膠片的布局。

思路清奇!南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊:AI將影像排版時(shí)間縮短至100秒,準(zhǔn)確率近于100%

表2:用于評(píng)估布局一致性和準(zhǔn)確性的五點(diǎn)量表。

思路清奇!南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊:AI將影像排版時(shí)間縮短至100秒,準(zhǔn)確率近于100%

圖12 五家制造商的IILS部署量化。

3.7 五點(diǎn)量表評(píng)估高質(zhì)量的IILS

我們利用五點(diǎn)量表(表2)來(lái)評(píng)估IILS的質(zhì)量。在所有類(lèi)型的制造商中,只有少數(shù)幾個(gè)分?jǐn)?shù)無(wú)法達(dá)到第四等級(jí)(圖12a)。正常布局情況下沒(méi)有發(fā)現(xiàn)遺漏,然而,與正常對(duì)照組相比(p=0.04)(圖12b),患者在第四區(qū)的幾個(gè)病例中出現(xiàn)了漏診。我們還比較了從每個(gè)量表得分中得出的總分,總的來(lái)說(shuō),西門(mén)子在使用IILS時(shí)效果最好??偡诛@示,與結(jié)節(jié)患者相比,IILS更適合無(wú)結(jié)節(jié)者(p=0.04)(圖12d)。

3.8 IILS與傳統(tǒng)工作站相比的優(yōu)點(diǎn):更少的時(shí)間,沒(méi)有無(wú)效的圖像和零遺漏

考慮到需要點(diǎn)擊時(shí)間,五個(gè)主要廠商設(shè)備布局的平均點(diǎn)擊次數(shù)為14.45±0.34次。其中GE平均點(diǎn)擊量為14.37±0.89次,飛利浦為14.70±0.86次,西門(mén)子為14.57±0.87次,東芝為15.77±0.95次,UI為13.67±0.79次,IILS為2次(p<0.04)(圖13a)。在使用傳統(tǒng)工作站時(shí),無(wú)論是患者還是無(wú)結(jié)節(jié)正常人,都需要比IILS更多的點(diǎn)擊量。IILS和傳統(tǒng)制造商在患者和正常人的圖像布局沒(méi)有顯著差異。通過(guò)不同廠家工作站的250例患者(每個(gè)廠家50例)的布局圖像,每個(gè)廠家50例患者所需時(shí)間分別為8分鐘(GE)、7.42分鐘(飛利浦)、8.87分鐘(西門(mén)子)、8.17分鐘(東芝)和8.63分鐘(UI)。傳統(tǒng)CT工作站的平均布局時(shí)間為16.87秒/患者。相比之下,IILS需要大約6.92秒/患者。與使用其他制造商工作站的患者和無(wú)結(jié)節(jié)相比,使用IILS的時(shí)間顯著減少。正如我們所料,IILS在患者和正常病例中比傳統(tǒng)工作站更有效。有趣的是,IILS在無(wú)結(jié)節(jié)病例上花費(fèi)的時(shí)間更少,而傳統(tǒng)工作站需要更長(zhǎng)的時(shí)間。

另外,對(duì)于兩種布局,我們比較了來(lái)自兩個(gè)不同布局系統(tǒng)的無(wú)效圖像。我們隨機(jī)收集了來(lái)自三個(gè)制造商工作站的50個(gè)布局結(jié)果,總共150個(gè)結(jié)果。在傳統(tǒng)的人工布局下,GE、Philips、UI患者的無(wú)效圖像分別為8.10±0·42、6.92±0·39、6.15±0·41,IILS患者為0。我們?cè)u(píng)估了膠片每個(gè)網(wǎng)格中的肺區(qū)域是否適合每個(gè)尺寸。所有的專家都主觀地認(rèn)為存在著顯著的差異。我們進(jìn)一步研究?jī)煞N布置方法和工作流程是否會(huì)導(dǎo)致肺結(jié)節(jié)檢測(cè)的遺漏。兩名放射科醫(yī)生被要求指出兩個(gè)胸部CT片和不同平臺(tái)上報(bào)告的結(jié)節(jié)的位置。根據(jù)報(bào)告的描述,我們共發(fā)現(xiàn)318個(gè)不匹配的結(jié)節(jié),46.8%的患者未發(fā)現(xiàn)結(jié)節(jié),約為0.97/例。此外,327例患者中63例漏診為GGN。

3.9 IILS完全可重現(xiàn),防止人類(lèi)測(cè)量的不穩(wěn)定性

我們從幾個(gè)方面比較了如何正確顯示結(jié)節(jié)的結(jié)果。由于金標(biāo)準(zhǔn)的缺乏,我們?cè)u(píng)估了哪種標(biāo)準(zhǔn)更穩(wěn)定或重現(xiàn)性更好。在這方面,總共選擇了8個(gè)肺結(jié)節(jié),即4個(gè)不同尺寸的2個(gè)結(jié)節(jié)(尺寸<3mm,3-6mm,6-10mm,10-3cm)。隨后,兩名放射學(xué)家被要求通過(guò)工作站,在不同時(shí)期10次反復(fù)測(cè)量這8個(gè)結(jié)節(jié)的大小和密度;IILS 的測(cè)量結(jié)果是100%可重復(fù)的,在多次測(cè)量中表現(xiàn)出完全的一致性,而由專家評(píng)估的測(cè)量則顯示出不同程度的波動(dòng)。

3.10 人機(jī)耦合操作需要適應(yīng)過(guò)程

我們模擬了放射科醫(yī)師的正常工作場(chǎng)景,其中要求兩名放射科醫(yī)師在兩小時(shí)內(nèi)對(duì)284名患者中的盡可能多的患者做出判斷,使用傳統(tǒng)診斷或基于AI判斷的重新診斷,間隔時(shí)間為一個(gè)月。在使用AI判斷作為先驗(yàn)信息后,在消耗時(shí)間、效率和絕對(duì)不匹配的結(jié)節(jié)方面有了顯著的改善(p<0.05)。具體來(lái)說(shuō),基于人工智能已有的判斷,兩位專家不僅減少了同一幅圖像的診斷時(shí)間,而且提高了單位時(shí)間內(nèi)的診斷效率。檢測(cè)誤差也明顯減小。使用AI后,兩位專家的檢測(cè)靈敏度都得到了提高,但專家2的特異性從99.2%下降到60%。

思路清奇!南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊:AI將影像排版時(shí)間縮短至100秒,準(zhǔn)確率近于100%

表3:用于評(píng)定不同類(lèi)型圖像布局組合的五點(diǎn)標(biāo)度。

3.11 專家和患者的滿意度都顯示出IILS的友好性

六位對(duì)原先結(jié)果不知情的專家評(píng)估了傳統(tǒng)系統(tǒng)和IILS的結(jié)果。我們建立了一個(gè)5點(diǎn)評(píng)分機(jī)制,用于評(píng)估由兩種不同布局系統(tǒng)生成的布局電子膠片和報(bào)告(表3)。專家對(duì)IILS進(jìn)行了明顯更好的評(píng)價(jià),所有5點(diǎn)中的3到4點(diǎn)高于傳統(tǒng)方法(p=7.674e-23)。相比之下,患者評(píng)分更加極端,表明報(bào)告的友好性非常重要(p=8.164e-25)。

3.12 IILS在LUNA16和LIDC/IDRI基準(zhǔn)上的性能評(píng)價(jià)

IILS的性能在兩個(gè)基準(zhǔn)數(shù)據(jù)庫(kù)上進(jìn)行了評(píng)估,即LUNA16和LIDC/IDRI。Luna16(https://luna16.grand-challenge.org/)共888次CT掃描,最終得分為0.696(排名18)。我們?cè)贚IDC / IDRI 數(shù)據(jù)庫(kù)上進(jìn)一步測(cè)試了我們的IILS ( https://wiki.CurraseIfgIsActuv.NET/DISPLAY/PARIS/LIDC-IDRI )有1018次CT 掃描,其包含更多的切片厚度類(lèi)型并且更類(lèi)似于真實(shí)的臨床環(huán)境。對(duì)于大于3mm的結(jié)節(jié),模型的召回率為88.75%,每例掃描的假陽(yáng)性率為5.22。

4、討論

在本研究中,通過(guò)創(chuàng)建和部署深度神經(jīng)網(wǎng)絡(luò)算法,在有限的人類(lèi)干涉下,我們的IILS模型展示了胸部CT圖像分析的競(jìng)爭(zhēng)性性能。此外,機(jī)器學(xué)習(xí)技術(shù)用于圖像分析的功效可能超出了胸部CT圖像的范圍—原則上,通過(guò)AI和布局學(xué)習(xí)的技術(shù)可能潛在地用于多個(gè)學(xué)科的各種醫(yī)學(xué)圖像。

IILS的一個(gè)主要特點(diǎn)是幾乎實(shí)時(shí)地檢測(cè)肺部結(jié)節(jié)。這種實(shí)時(shí)性能是由于系統(tǒng)中的Faster RCNN模型。IILS的性能在很大程度上取決于通過(guò)訓(xùn)練模型檢測(cè)和分類(lèi)結(jié)節(jié)的準(zhǔn)確性。雖然與金標(biāo)準(zhǔn)達(dá)成了很高的一致性,將AI應(yīng)用于UI在檢測(cè)小結(jié)節(jié)方面仍存在顯著差異,這可能是由于參加模型訓(xùn)練的樣本量?。ńY(jié)節(jié)數(shù)量,n=1119)造成的。

經(jīng)證實(shí),在檢出結(jié)節(jié)數(shù)量和判斷良惡性方面,IILS優(yōu)于6名專家。根據(jù)目前構(gòu)建的模型,獲得的ROC曲線下面積達(dá)90.6%,具有一定的臨床應(yīng)用價(jià)值。經(jīng)過(guò)嚴(yán)格的統(tǒng)計(jì)檢驗(yàn),在結(jié)節(jié)檢出量和良惡性判斷方面,IILS優(yōu)于6名人類(lèi)專家。補(bǔ)充表S6顯示了一些相關(guān)工作和比較結(jié)果。相比之下,實(shí)驗(yàn)數(shù)據(jù)和CNN結(jié)構(gòu)的結(jié)果都取得了一定的進(jìn)展,使我們對(duì)IILS的模型性能穩(wěn)定、可靠和高效充滿了希望。

IILS旨在用于日常實(shí)際工作中準(zhǔn)確檢測(cè)和分類(lèi)結(jié)節(jié),并標(biāo)準(zhǔn)化胸部CT圖像和報(bào)告。這種布局的優(yōu)點(diǎn)是簡(jiǎn)化了醫(yī)生仔細(xì)翻看圖像,找到有關(guān)鍵圖像的肺結(jié)節(jié)的過(guò)程。為優(yōu)化IILS,我們?cè)u(píng)估了其在布局部件中的性能。憑借AI接近100%的成功率,整個(gè)多平面重建程序設(shè)計(jì)可以自動(dòng)完成。多平面重建對(duì)臨床醫(yī)生從多個(gè)角度觀察肺結(jié)節(jié),做出最終診斷,評(píng)估和跟蹤肺結(jié)節(jié)至關(guān)重要。

IILS與傳統(tǒng)布局系統(tǒng)之間存在十四個(gè)差異。其中,內(nèi)容分為三個(gè)部分。第一部分側(cè)重于使運(yùn)營(yíng)商受益。IILS可能有機(jī)會(huì)降低成本,包括提高CT利用效率,替代低成本資源甚至取代某些業(yè)務(wù)。第二部分包括第四至第十一點(diǎn)的內(nèi)容,這些差異主要集中在最終產(chǎn)出的差異,兩種電子膠片加上兩種不同系統(tǒng)產(chǎn)生的一種相應(yīng)的報(bào)告。盡管IILS制作的電子膠片布局是從傳統(tǒng)方式的兩個(gè)部分演變?yōu)槿齻€(gè)部分,其中前五個(gè)小網(wǎng)格僅用于顯示在不同呈現(xiàn)形式下具有最高惡性風(fēng)險(xiǎn)的一個(gè)結(jié)節(jié),這將有助于IILS比傳統(tǒng)方法更經(jīng)常地獲得有效圖像,從而提高了效率。

此外,還出現(xiàn)了一個(gè)有趣的現(xiàn)象。驗(yàn)證在我們的自適應(yīng)工具的表現(xiàn)中,我們從臨床醫(yī)學(xué)報(bào)告的結(jié)果中隨機(jī)選擇了來(lái)自對(duì)照組的327例病例,這些病例報(bào)道沒(méi)有肺結(jié)節(jié)。然而,在重新測(cè)試的過(guò)程中,我們發(fā)現(xiàn)在153例(46.8%)中實(shí)際錯(cuò)過(guò)了318個(gè)結(jié)節(jié)。錯(cuò)過(guò)的結(jié)節(jié)主要集中在3-6毫米而不是<3毫米的,主要類(lèi)型的缺失結(jié)節(jié)是鈣化結(jié)節(jié)而不是磨砂玻璃結(jié)節(jié)。這個(gè)問(wèn)題的可能原因是,在傳統(tǒng)的母語(yǔ)中,鈣化結(jié)節(jié)可能被“舊病變”所取代,而“磨玻璃結(jié)節(jié)”則沒(méi)有同義詞。

第六點(diǎn)為多維結(jié)節(jié);根據(jù)基線和隨訪CT的結(jié)節(jié)直徑和時(shí)間間隔的差異可以觀察和估計(jì)結(jié)節(jié)的大小在這兩種掃描之間,腫瘤呈均勻的三維生長(zhǎng)。然而,由于繁重的體力勞動(dòng),無(wú)法對(duì)關(guān)鍵的肺結(jié)節(jié)進(jìn)行三維重建。因此,我們?cè)黾恿艘环N自動(dòng)多維觀察方法,以最大限度地減少誤診率。

第三部分包括第十二至第十四點(diǎn)的內(nèi)容,比較了IILS和傳統(tǒng)工作站對(duì)所有醫(yī)生和病人的影響。我們的研究結(jié)果表明,所有醫(yī)生和患者對(duì)IILS的輸出感到滿意。然而,在以經(jīng)驗(yàn)為導(dǎo)向的閱讀習(xí)慣方面,人工智能在人類(lèi)專家中的有效性仍然存在差異。在我們的研究中,一名資深放射科醫(yī)生(專家1)似乎對(duì)人工智能預(yù)測(cè)肺結(jié)節(jié)的信心較低,即使IILS做出了判斷,也會(huì)仔細(xì)遵循閱讀習(xí)慣瀏覽圖像。應(yīng)用人工智能前后,在效率、消耗時(shí)間、結(jié)節(jié)絕對(duì)不匹配等方面均有顯著差異。有趣的是,在敏感性和特異性方面沒(méi)有發(fā)現(xiàn)明顯的改善。相比之下,初級(jí)放射科醫(yī)生(專家2)似乎在很大程度上信任人工智能。我們推測(cè),人機(jī)耦合操作可能仍然需要一個(gè)適應(yīng)過(guò)程。

雖然結(jié)果很有希望,但我們的研究有一些局限性。在這項(xiàng)試驗(yàn)研究中,脊柱側(cè)凸患者、原發(fā)性或繼發(fā)性胸部畸形患者和接受胸外科手術(shù)的患者的圖像不包括在訓(xùn)練和測(cè)試集中。因此,需要進(jìn)一步的臨床收集和測(cè)試來(lái)評(píng)估各種形式的胸腔的臨床準(zhǔn)確性。由于胸廓畸形的發(fā)生率相對(duì)較低,這種影響不會(huì)影響我們的總體結(jié)論。臨床試驗(yàn)研究在兩年內(nèi)進(jìn)行,IILS正常運(yùn)作六個(gè)月。但是,需要對(duì)新系統(tǒng)進(jìn)行進(jìn)一步評(píng)估,以評(píng)估長(zhǎng)期準(zhǔn)確性和穩(wěn)定性。

此外,IILS僅限于解決成人肺結(jié)節(jié)的CT圖像問(wèn)題,而不是嬰兒,由于嬰兒很少出現(xiàn)肺結(jié)節(jié)。在各種環(huán)境條件下還需要進(jìn)行更多測(cè)試,例如,在極冷、炎熱、干燥和潮濕的環(huán)境中進(jìn)行測(cè)試。還需要測(cè)試具有一些噪聲的圖像以評(píng)估系統(tǒng)的穩(wěn)健性。事實(shí)上,圖像不完整的患者被納入系統(tǒng),最終導(dǎo)致異常。因此,在處理特殊圖像,例如不完整圖像,空白圖像或不正確圖像時(shí),當(dāng)前系統(tǒng)仍有改進(jìn)的空間,可以引入諸如完整性掃描和灰度確認(rèn)之類(lèi)的算法。另外,目前,IILS只能在胸部進(jìn)行。未來(lái)的工作可能包括將設(shè)備應(yīng)用于身體其他部位的圖像。

總之,IILS的性能優(yōu)于傳統(tǒng)系統(tǒng),并提供了一種比現(xiàn)有技術(shù)更經(jīng)濟(jì)、設(shè)計(jì)更合適的替代方法,以優(yōu)化肺部結(jié)節(jié)的CT布局,節(jié)省費(fèi)用和提高效率。由于基于自動(dòng)AI的標(biāo)準(zhǔn)化電子膠片和可視化結(jié)構(gòu)化報(bào)告生成,可能會(huì)在日常工作流程中建立一個(gè)新的標(biāo)準(zhǔn)和一個(gè)新的放射學(xué)工作流程,并且不需要一些相關(guān)的操作員。

為了提供一個(gè)可以引用的基準(zhǔn),我們?cè)趦蓚€(gè)基準(zhǔn)數(shù)據(jù)庫(kù)上評(píng)估了我們的IILS的性能。正如預(yù)期的那樣,我們得到了相對(duì)較高水平的假陽(yáng)性,特別是LUNA16,因?yàn)樵陬A(yù)測(cè)中,小尺寸的結(jié)節(jié)被視為假陽(yáng)性。我們認(rèn)為,設(shè)計(jì)的最優(yōu)診斷模型通常是針對(duì)特定群體的,因?yàn)槲覀儾捎玫乃杏?xùn)練圖像都來(lái)自中國(guó),而LUNA16數(shù)據(jù)庫(kù)收集的數(shù)據(jù)集僅從美國(guó)中收集,且沒(méi)有任何<3mm結(jié)節(jié)的標(biāo)簽。

綜合而言,IILS提供了一種簡(jiǎn)單、準(zhǔn)確的方法來(lái)檢測(cè)、分類(lèi)和布局肺結(jié)節(jié)的CT圖像,以提高對(duì)中國(guó)人群的診斷。因此,IILS為人工智能的臨床應(yīng)用打開(kāi)了新的窗口,可能是改善全球醫(yī)療質(zhì)量不平衡的有效途徑。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)