思路清奇！南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊：AI將影像排版時(shí)間縮短至100秒，準(zhǔn)確率近于100%

本文作者：李雨晨

2019-06-20 10:21

導(dǎo)語(yǔ)：這是一個(gè)優(yōu)化醫(yī)學(xué)流程的獨(dú)特視角。

過(guò)去幾年，AI在醫(yī)學(xué)影像方面取得了諸多成果。在影像學(xué)科的臨床工作流程中，肺部病變的良、惡性鑒別診斷，已經(jīng)成為AI創(chuàng)業(yè)公司爭(zhēng)先恐后涌入的賽道。但是，多數(shù)創(chuàng)業(yè)公司基本上是停留在后端的疾病診斷層面，在此之前的圖像采集、圖像呈現(xiàn)階段，其實(shí)都有文章可做。

雷鋒網(wǎng)了解到，近日，南京鼓樓醫(yī)院醫(yī)學(xué)影像科張冰團(tuán)隊(duì)，在柳葉刀子刊EBiomedicine發(fā)表了一則AI醫(yī)療的新成果，直面影像科醫(yī)生工作流程前端的痛點(diǎn)問(wèn)題。

該團(tuán)隊(duì)選擇了一個(gè)全新的切入點(diǎn)——從臨床影像工作全流程角度出發(fā)，提出了一種基于深度學(xué)習(xí)的智能成像排版系統(tǒng)（IILS），系統(tǒng)包括AI肺結(jié)節(jié)檢測(cè)和分類(lèi)和自適應(yīng)排版工具，用于結(jié)節(jié)識(shí)別的成像報(bào)告標(biāo)準(zhǔn)化和工作流程優(yōu)化。

成人的典型胸部CT掃描有大約三百?gòu)垐D像。然而，最終排版僅約為四十幅圖像。因此，大約87.7％的圖像被忽略了。特別是當(dāng)肺結(jié)節(jié)的直徑小于1 cm時(shí)，相應(yīng)報(bào)告不能與排版結(jié)果100％匹配。

據(jù)雷鋒網(wǎng)了解，團(tuán)隊(duì)提出的胸部CT排版工具，使用來(lái)自11205名患者的CT成像數(shù)據(jù)，可以適應(yīng)全自動(dòng)或者半自動(dòng)的影像學(xué)圖像的排版問(wèn)題。以往人工診斷到排版需要花費(fèi)約2小時(shí)的時(shí)間，在這個(gè)工具的幫助下，時(shí)間可以降低到約100秒。

以下為論文詳細(xì)內(nèi)容，由雷鋒網(wǎng)AI掘金志學(xué)術(shù)組編譯。關(guān)注AI掘金志公眾號(hào)，在對(duì)話框回復(fù)關(guān)鍵詞“南京鼓樓”，即可獲取原文PDF。

1、引言

臨床任務(wù)的一個(gè)典型例子是，分類(lèi)并生成與肺結(jié)節(jié)的診斷密切相關(guān)的胸部CT圖像的布局。在篩查檢測(cè)和隨訪期間，目前的日常工作流程中仍存在五個(gè)問(wèn)題。

1、成像報(bào)告標(biāo)準(zhǔn)化缺乏：由于沒(méi)有標(biāo)準(zhǔn)化、科學(xué)驗(yàn)證的方法評(píng)估結(jié)節(jié)，試驗(yàn)放射科醫(yī)師制定了診斷隨訪的指南，但沒(méi)有強(qiáng)制要求評(píng)估方法（圖1）。

2、缺失結(jié)節(jié)：如果干激光膠片用作成像信息載體，則無(wú)法顯示與報(bào)告中的描述相對(duì)應(yīng)的結(jié)節(jié)（圖2），這是一個(gè)常見(jiàn)問(wèn)題。

3、缺少關(guān)鍵圖像：在從CT掃描儀獲取圖像之后，大量圖像不加選擇地輸入到PACS中。此外，許多臨床醫(yī)生對(duì)成像知識(shí)相對(duì)不熟悉，需要花費(fèi)大量時(shí)間和精力來(lái)瀏覽這些缺乏關(guān)鍵信息的復(fù)雜圖像，更不用說(shuō)使用智能手機(jī)或平板電腦來(lái)檢查這些圖像。而且，許多無(wú)效圖像經(jīng)常出現(xiàn)在一系列圖像中（圖2）。因此，治療過(guò)程極其低效。

4、訪問(wèn)來(lái)自其他醫(yī)院的圖像困難：如果患者需要他或她自己的圖像，圖像通常在光盤(pán)（CD）上刻錄或通過(guò)便攜式硬盤(pán)驅(qū)動(dòng)器傳輸。然而，許多現(xiàn)代計(jì)算機(jī)沒(méi)有配備CD驅(qū)動(dòng)器或醫(yī)院禁止使用計(jì)算機(jī)的通用串行總線（USB）接口。因此，患者在不同醫(yī)院都要進(jìn)行掃描成像。

5、缺乏對(duì)臨床醫(yī)生和患者需求的考慮（圖2）：作為放射科醫(yī)師，幫助他人更容易閱讀和理解成像結(jié)果的機(jī)會(huì)尚未得到充分利用。因此，迫切需要具有關(guān)鍵圖像的電子報(bào)告和可視化結(jié)構(gòu)化報(bào)告來(lái)解決這些問(wèn)題。

當(dāng)前，AI的應(yīng)用似乎忽略了兩個(gè)事實(shí)。首先，高質(zhì)量的標(biāo)準(zhǔn)化圖像是人工智能開(kāi)發(fā)的基礎(chǔ)，其次，AI可以接管簡(jiǎn)單和重復(fù)的工作。

在這項(xiàng)研究中，我們尋求開(kāi)發(fā)基于人工智能技術(shù)和自適應(yīng)布局工具融合的智能成像排版系統(tǒng)（IILS），以建立日常工作的新流程，并為放射科醫(yī)生和臨床醫(yī)生提供標(biāo)準(zhǔn)化圖像和報(bào)告。同時(shí)，我們從三個(gè)方面評(píng)估IILS的綜合實(shí)力，包括i）IILS與臨床專家之間結(jié)節(jié)診斷效率的比較； ii）IILS可以優(yōu)化臨床工作流程的程度；iii）IILS的交叉制造適用性（cross-manufacture applicability）。

總之，我們認(rèn)為AI技術(shù)可以通過(guò)串聯(lián)連接集成到放射學(xué)工作流中，而不是基于簡(jiǎn)單的并行關(guān)系來(lái)遵循傳統(tǒng)的工作流程。

思路清奇！南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊：AI將影像排版時(shí)間縮短至100秒，準(zhǔn)確率近于100%

圖2.當(dāng)前的手工選片過(guò)程和日常工作中的相關(guān)問(wèn)題。例如，成人的典型胸部CT掃描有大約三百?gòu)垐D像。然而，最終排版僅約為四十幅圖像。因此，大約87.7％的圖像被忽略了。相應(yīng)報(bào)告不能與排版結(jié)果100％匹配，特別是當(dāng)肺結(jié)節(jié)的直徑小于1cm時(shí)。以GE的CT掃描方法為例，在日常工作中使用手動(dòng)圖像排版時(shí)，通常會(huì)忽略6（層）×1·25 mm（厚度）= 7·5 mm范圍內(nèi)的肺組織。因此，當(dāng)醫(yī)生獲得最終的圖像時(shí)會(huì)遇到以下問(wèn)題：缺乏成像報(bào)告標(biāo)準(zhǔn)化、缺失結(jié)節(jié)、缺乏關(guān)鍵圖像以及缺乏對(duì)臨床醫(yī)生和患者需求的考慮。

思路清奇！南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊：AI將影像排版時(shí)間縮短至100秒，準(zhǔn)確率近于100%

圖3. IILS的組成以及如何將其整合到當(dāng)前的成像過(guò)程中。新的IILS包括以下部分：一個(gè)是AI肺結(jié)節(jié)檢測(cè)和分類(lèi)，另一個(gè)是自適應(yīng)排版工具，包括我們團(tuán)隊(duì)發(fā)明的自動(dòng)排版和可視化結(jié)構(gòu)化報(bào)告生成。為了確保圖像質(zhì)量和結(jié)果，我們有一位放射科醫(yī)生，他通常負(fù)責(zé)編寫(xiě)報(bào)告，仔細(xì)檢查自動(dòng)生成的結(jié)構(gòu)化報(bào)告和圖像排版結(jié)果。成像部門(mén)日常工作的整個(gè)過(guò)程包括以下關(guān)鍵步驟：i）獲?。簭牟煌R床科室的患者收集圖像信息; ii）排版：包括日常工作的手動(dòng)排版和圖像管理; iii）診斷：放射科醫(yī)師的圖像診斷，預(yù)測(cè)和評(píng)估。新型智能系統(tǒng)的應(yīng)用通過(guò)串聯(lián)而非并聯(lián)連接集成到放射工作流中。

2、材料與方法

2.1 實(shí)驗(yàn)軟件和硬件

本文中的模型均在DGX1平臺(tái)上進(jìn)行訓(xùn)練。(NVIDIA DGX1 system, 8× Tesla V100 GPUs, 128 GB total system GPUMemory, dual 20-core Intel Xeon E5–2698 CPU v4 2.2 GHz, SantaClara, California, USA)

2.2 實(shí)驗(yàn)?zāi)Ｐ秃晚?xiàng)目細(xì)節(jié)

思路清奇！南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊：AI將影像排版時(shí)間縮短至100秒，準(zhǔn)確率近于100%

圖4：數(shù)據(jù)流圖顯示了我們檢測(cè)結(jié)節(jié)和分類(lèi)良性或惡性病例的方法。本研究采用的數(shù)據(jù)是從2016年10月到2018年11月，從五個(gè)主要的不同CT制造商處獲得的11205名患者、共3527048張胸部CT掃描圖像。

訓(xùn)練過(guò)程分為兩部分，分別由兩個(gè)訓(xùn)練隊(duì)列組成。通過(guò)卷積神經(jīng)網(wǎng)絡(luò)（CNN）獲得兩個(gè)模型，通過(guò)5折交叉驗(yàn)證進(jìn)行性能評(píng)估，然后合并形成IILS的第一層，即用于檢測(cè)結(jié)節(jié)和分類(lèi)病例的篩選部分。我們將最終的兩個(gè)模型部署到包含1965個(gè)病例的獨(dú)立隊(duì)列中，通過(guò)六位臨床專家對(duì)結(jié)節(jié)數(shù)量的一致性分析，以顯示我們IILS的可信度。

八名有3到25年胸部CT經(jīng)驗(yàn)的專家作為檢查員參加了會(huì)議。為了在臨床專家的背景下評(píng)估我們的卷積神經(jīng)網(wǎng)絡(luò)，我們使用1965名患者的獨(dú)立測(cè)試集來(lái)比較我們的網(wǎng)絡(luò)決策和人類(lèi)專家的決策。隨機(jī)選擇作為受試者的1965名患者進(jìn)行讀者間和讀者間再現(xiàn)性研究。

所有肺結(jié)節(jié)的數(shù)量的確定、良性和惡性結(jié)節(jié)的判斷由六位專家檢查兩次，間隔為1個(gè)月，以最小化記憶偏差。所有決策均由六位專家做出，用于讀者間的再現(xiàn)性分析。加權(quán)誤差評(píng)分用于反映假陰性結(jié)果（未做出決定）比假陽(yáng)性結(jié)果更有害。使用這些加權(quán)懲罰點(diǎn)、計(jì)算模型和每個(gè)人類(lèi)專家的錯(cuò)誤率。

即使患者有較大的病變，我們也僅包括小于30 mm的結(jié)節(jié)，其大小相當(dāng)于約30 mm的平均直徑，因?yàn)榉谓Y(jié)節(jié)的定義是直徑小于3cm的病變。我們納入了疑似轉(zhuǎn)移的結(jié)節(jié)以及可能具有良性組織學(xué)特征的結(jié)節(jié)。然而，排除了粟粒性結(jié)核、間質(zhì)病變、結(jié)節(jié)病和重癥肺炎。

以下參數(shù)用于評(píng)估結(jié)節(jié)特征和圖像質(zhì)量對(duì)觀察者一致性的影響：總結(jié)節(jié)大?。ㄗ畲笾睆?，毫米）、結(jié)節(jié)類(lèi)型、良性或惡性以及肺實(shí)質(zhì)內(nèi)結(jié)節(jié)的密度。從數(shù)據(jù)庫(kù)中提取參數(shù)結(jié)節(jié)大小、良性或惡性和類(lèi)型。結(jié)節(jié)的密度由沒(méi)有參與閱讀過(guò)程的專家（H.Y 和H.W）測(cè)量。將兩個(gè)約1cm的感興趣區(qū)域放置在結(jié)節(jié)中的兩個(gè)均勻區(qū)域中，并且兩次測(cè)量中平均的Hounsfield units標(biāo)準(zhǔn)偏差是密度的度量。

2.3 病人分類(lèi)

訓(xùn)練過(guò)程中的用例隨機(jī)分為訓(xùn)練集80%和驗(yàn)證集20％（圖4）。訓(xùn)練集用于訓(xùn)練算法，驗(yàn)證集用于模型選擇，測(cè)試集用于評(píng)估最終選擇的模型。在確定百分比分割時(shí)，目標(biāo)是為算法保留足夠的數(shù)據(jù)以進(jìn)行訓(xùn)練，但是具有足夠的驗(yàn)證和測(cè)試用例以保持模型準(zhǔn)確性的合理置信區(qū)間。該數(shù)據(jù)集代表了在參與診所提供和接受治療的最常見(jiàn)的實(shí)性、鈣化或磨玻璃結(jié)節(jié)患者。

2.4 圖像標(biāo)注

在訓(xùn)練之前，每個(gè)圖像都經(jīng)過(guò)分層分級(jí)系統(tǒng)，該系統(tǒng)由多級(jí)訓(xùn)練有素的評(píng)分者組成，他們具有逐級(jí)遞增的專業(yè)知識(shí)，可用于圖像標(biāo)簽的驗(yàn)證和校正。導(dǎo)入數(shù)據(jù)庫(kù)的每個(gè)圖像都與患者最近診斷的標(biāo)簽相匹配。第一級(jí)評(píng)分員包括具有呼吸系統(tǒng)和成像基礎(chǔ)知識(shí)的成員。這一級(jí)評(píng)分員進(jìn)行了初步的質(zhì)量控制，并排除了包含嚴(yán)重偽影或顯著降低圖像分辨率的胸部CT圖像。第二級(jí)評(píng)分員由兩位專家組成，他們對(duì)通過(guò)第一級(jí)的每張圖像進(jìn)行獨(dú)立評(píng)分。記錄胸部CT圖像上是否存在實(shí)性，鈣化或磨玻璃結(jié)節(jié)和其他可見(jiàn)的病變。最后，第二層由兩名高級(jí)呼吸和成像專家組成，每位專家擁有超過(guò)15年的臨床呼吸和成像經(jīng)驗(yàn)，獨(dú)立驗(yàn)證每張圖像的真實(shí)標(biāo)簽。所有圖像的驗(yàn)證子集由兩名專家分別評(píng)分，不一致的臨床標(biāo)簽由由高級(jí)專家仲裁，以解釋評(píng)分中的人為錯(cuò)誤。

2.5 軟件支持

軟件系統(tǒng)的開(kāi)發(fā)在Linux Ubuntu 18.04環(huán)境下進(jìn)行。Pycharm 和 VS Code用作開(kāi)發(fā)的IDE。Chrome調(diào)試器用于測(cè)試和調(diào)試UI / UX。軟件的實(shí)現(xiàn)細(xì)節(jié)是保密的，以下部分主要描述了實(shí)現(xiàn)的設(shè)計(jì)和邏輯。

思路清奇！南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊：AI將影像排版時(shí)間縮短至100秒，準(zhǔn)確率近于100%

圖5：排版示例加上可視化結(jié)構(gòu)報(bào)告以及與傳統(tǒng)排版和報(bào)告的比較。

（a）使用IILS選擇后的新圖像排版。新的排版圖像被分為三個(gè)部分（兩個(gè)紅框的區(qū)域，代表關(guān)鍵圖像所在的區(qū)域）。顯然，與（c）相比沒(méi)有無(wú)效圖像（標(biāo)有橙色下劃線）。排版第一部分開(kāi)頭的五個(gè)小框依次顯示：1）肺窗條件下結(jié)節(jié)的最大橫截面切片的圖像（WW：1500; WL：-500），2）具有長(zhǎng)徑和短徑測(cè)量數(shù)據(jù)的圖像，3）縱隔窗口條件下的結(jié)節(jié)圖像（WW：350，WL：50），4）結(jié)節(jié)的冠狀圖像重建，5）結(jié)節(jié)的矢狀圖像重建。第二部分是在縱隔窗口條件下每層間隔的一組圖像。最后一部分是一組薄層肺組織圖像，大約分為六層。另一個(gè)便利是，片子上任一單元格中的每個(gè)圖像都可以通過(guò)其切片ID進(jìn)行跟蹤，并通過(guò)雙擊它來(lái)重定向到圖像集中的原始位置。還自動(dòng)生成與片子相關(guān)的可視化結(jié)構(gòu)報(bào)告。有關(guān)詳細(xì)信息，請(qǐng)參見(jiàn)視頻2。

（b）：如果患者沒(méi)有肺結(jié)節(jié)，IILS給出的排版和報(bào)告將與傳統(tǒng)系統(tǒng)給出的相似。

（c）：使用傳統(tǒng)的手工排版形式，表格分為兩部分。前部包括縱隔組織圖像，后部是肺組織圖像。傳統(tǒng)排版格式的主要問(wèn)題是缺少關(guān)鍵圖像，各種無(wú)效圖像（一些帶橙色下劃線的圖像），以及缺少鏈接功能。相關(guān)報(bào)告填充了文本，沒(méi)有生成結(jié)構(gòu)化報(bào)告。

2.6 自動(dòng)排版

通過(guò)將固定輸出過(guò)程分成以下子任務(wù)來(lái)執(zhí)行自動(dòng)排版：1，驗(yàn)證; 2，輸出。在驗(yàn)證任務(wù)中，我們的程序首先處理最重要的結(jié)節(jié)，生成五個(gè)放大的輸出圖像，聚焦在結(jié)節(jié)上，同時(shí)突出顯示矩形，標(biāo)明肺窗形式的結(jié)節(jié)位置，長(zhǎng)徑測(cè)量，縱隔窗和兩個(gè)方向透視。五個(gè)輸出圖像放置在第一行，然后是30個(gè)縱隔窗口圖像，其余的為肺窗口。具體而言，第一部分五個(gè)網(wǎng)格是單個(gè)結(jié)節(jié)的自動(dòng)排版，具有最高的惡性概率風(fēng)險(xiǎn)，這可由AI預(yù)測(cè)。五張圖片也可以由放射科醫(yī)師驗(yàn)證和覆蓋。自適應(yīng)排版工具的輸出包括兩個(gè)電子排片和一個(gè)由四組圖像組成的結(jié)構(gòu)化報(bào)告。

與傳統(tǒng)報(bào)告的比較，IILS提供了以下信息：i）基本信息顯示：患者信息，檢查信息，放射科醫(yī)師信息等。ii）結(jié)果（來(lái)自AI預(yù)測(cè)和放射科醫(yī)師的雙重確認(rèn)）：標(biāo)準(zhǔn)化描述肺結(jié)節(jié)圖像，包括結(jié)節(jié)位置，形態(tài)和密度，圖像信息的層數(shù)，結(jié)節(jié)長(zhǎng)徑，體積，平均CT值，以及結(jié)節(jié)的惡性概率。此外，我們?yōu)榉派淇漆t(yī)師預(yù)留了足夠的空間，可以為其他病變編寫(xiě)定期報(bào)告。 iii）診斷感想：由放射科醫(yī)師撰寫(xiě)的診斷建議。肺部全部范圍的適應(yīng)性是主要關(guān)注點(diǎn)，其意味著五個(gè)圖像是否附在第一組，即一組顯示結(jié)節(jié)的五種形式圖像具有最高的AI預(yù)測(cè)得分為惡性，符合我們的預(yù)設(shè)的將受到高度重視。驗(yàn)證后，可以將排片導(dǎo)出為可打印格式，以便為放射科醫(yī)師和患者提供可視化信息，同時(shí)自動(dòng)生成結(jié)構(gòu)報(bào)告。

我們還推斷一個(gè)好的排版系統(tǒng)主要包括以下三個(gè)主要內(nèi)容：1）任何可靠，客觀的測(cè)量數(shù)據(jù)的所有關(guān)鍵圖像; 2）顯示腫瘤特征的一系列圖像，包括形狀，數(shù)量，密度，大小，增強(qiáng)，多角度觀察和后續(xù)比較; 3）胸部縱隔窗和肺窗圖像連續(xù)顯示（圖5a-b）。此外，我們手工顯示當(dāng)前排版形式的圖片，這在日常工作中作為比較非常普遍（圖5c）。

2.7 結(jié)構(gòu)化報(bào)告

結(jié)構(gòu)化報(bào)告生成程序旨在完成常見(jiàn)CT掃描場(chǎng)景中的完整工作流程（補(bǔ)充圖S2）。與傳統(tǒng)報(bào)告的比較，我們計(jì)劃為放射科醫(yī)師和患者提供圖像和結(jié)果的可視化。該計(jì)劃主要通過(guò)以下三個(gè)步驟進(jìn)行：1，收集資源；2，渲染圖像；3，輸出。我們現(xiàn)在將詳細(xì)描述每個(gè)步驟。為了收集資源，我們需要在我們的程序中加載多個(gè)資源，包括DICOM圖像集、AI預(yù)測(cè)結(jié)節(jié)、患者/醫(yī)院信息，以及捕獲放射科醫(yī)師的結(jié)果和診斷感想。收集必要的資源后，我們繼續(xù)進(jìn)行渲染部分。該程序?qū)⑹紫雀鶕?jù)其重要性對(duì)結(jié)節(jié)進(jìn)行排序（由AI定義，但可以由操作員覆蓋），然后在相應(yīng)的圖像上使用矩形框渲染每個(gè)結(jié)節(jié)。該程序還放大了圖像并設(shè)置其中心，重點(diǎn)放在結(jié)節(jié)本身。渲染和轉(zhuǎn)換后，將觸發(fā)特殊事件偵聽(tīng)器以通知程序捕獲渲染數(shù)據(jù)。最后，程序生成預(yù)定義的可打印輸出。

2.8 定量和統(tǒng)計(jì)分析

ROC曲線繪制了真陽(yáng)性率（TPR，靈敏度）與假陽(yáng)性率（1- 特異度）的關(guān)系曲線。通過(guò)將正確標(biāo)記的惡性結(jié)節(jié)的總數(shù)和正確標(biāo)記的良性結(jié)節(jié)的總數(shù)分別除以測(cè)試圖像的結(jié)節(jié)總數(shù)來(lái)確定靈敏度和特異度。連續(xù)變量被描述為平均值±標(biāo)準(zhǔn)誤差（SEM），并且分類(lèi)變量被表示為諸如良性/惡性（B / M）的特征。將傳統(tǒng)圖像排版組與智能系統(tǒng)組和正常對(duì)照組之間的臨床特征通過(guò)Mann-Whitney U檢驗(yàn)，卡方檢驗(yàn)或Fisher精確檢驗(yàn)進(jìn)行比較。使用雙樣本Mann-Whitney U檢驗(yàn)比較傳統(tǒng)排版組與智能布局組和正常對(duì)照組之間的差異。Kappa統(tǒng)計(jì)用于衡量?jī)蓚€(gè)評(píng)估者之間的一致性程度，即AI和人類(lèi)專家。kappa值至少為0.75表示良好的一致性。然而，我們認(rèn)為較大的kappa值，例如0.90，是優(yōu)選的。雙尾P值＜0.05被認(rèn)為具有統(tǒng)計(jì)學(xué)意義。

3、結(jié)果

3.1患者和圖像特征

具有四種不同結(jié)節(jié)大小的病例及其特征和演變表明隨訪的重要性（圖6a）。表1總結(jié)了用于訓(xùn)練、驗(yàn)證和獨(dú)立測(cè)試數(shù)據(jù)集的患者和結(jié)節(jié)的特征。根據(jù)文獻(xiàn)，結(jié)節(jié)類(lèi)型分為實(shí)性結(jié)節(jié)、鈣化結(jié)節(jié)和磨砂玻璃結(jié)節(jié)。工作流程圖的總體實(shí)驗(yàn)設(shè)計(jì)如圖6b所示。

思路清奇！南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊：AI將影像排版時(shí)間縮短至100秒，準(zhǔn)確率近于100%

圖6：應(yīng)用人工智能技術(shù)對(duì)不同大小肺結(jié)節(jié)的檢測(cè)過(guò)程進(jìn)行了演示，并給出了整個(gè)實(shí)驗(yàn)設(shè)計(jì)的流程圖。

3.2 模型設(shè)計(jì)和性能評(píng)估

IILS系統(tǒng)的核心設(shè)計(jì)是深度學(xué)習(xí)模型,該模型分為兩個(gè)部分，F(xiàn)aster RCNN和ResNet。Faster RCNN主要負(fù)責(zé)肺結(jié)節(jié)的檢測(cè)和定位。Faster RCNN 還有助于將肺結(jié)節(jié)分為以下幾類(lèi)：0-3 mm、3-6mm、6-0mm、10-30mm肺結(jié)節(jié)，實(shí)性結(jié)節(jié)、鈣化結(jié)節(jié)和磨砂玻璃結(jié)節(jié)（GGNs）。第二部分是ResNet,主要負(fù)責(zé)肺結(jié)節(jié)良惡性的分類(lèi)。在第一部分中，關(guān)于特征提取，我們使用了ResNet-50 中的層conv4_x作為輸出。在我們的嘗試中，ResNet-50中的層conv4_x在檢測(cè)中表現(xiàn)出最佳性能。在區(qū)域建議網(wǎng)絡(luò)（RPN）中，采用二元交叉熵作為分類(lèi)損失函數(shù)，選取smooth L1損失函數(shù)作為回歸損失函數(shù)。模型的訓(xùn)練過(guò)程完善,曲線均達(dá)到收斂。該模型的訓(xùn)練過(guò)程是完美的，所有曲線均達(dá)到收斂。RPN的訓(xùn)練過(guò)程如圖7a-b所示，所有曲線收斂為零。這也表明我們的模型能夠很好地區(qū)分前景和背景，并提供了一個(gè)精確的前景邊界框。圖7c曲線也收斂到零，該曲線的收斂性表明，該模型能夠很好地區(qū)分7類(lèi)肺結(jié)節(jié)。第二部分，我們用ResNet對(duì)結(jié)節(jié)良惡性進(jìn)行了分類(lèi)。為了獲得更準(zhǔn)確的模型并避免梯度分散等問(wèn)題，我們選擇了ResNet。在IILS系統(tǒng)中，ResNet顯現(xiàn)出了優(yōu)異的分類(lèi)性能。曲線的收斂代表了我們分類(lèi)工作的成功；在模型精度方面，訓(xùn)練和驗(yàn)證曲線均接近100%（訓(xùn)練過(guò)程為100%，驗(yàn)證過(guò)程為97%）。在損失函數(shù)部分，曲線也顯示該模型在良惡性結(jié)節(jié)的分類(lèi)上表現(xiàn)良好。

思路清奇！南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊：AI將影像排版時(shí)間縮短至100秒，準(zhǔn)確率近于100%

圖7：檢測(cè)結(jié)節(jié)的訓(xùn)練過(guò)程的性能。

3.3 IILS與人類(lèi)專家對(duì)結(jié)節(jié)診斷效率的比較

我們?cè)u(píng)估了我們的模型檢測(cè)和分類(lèi)最常見(jiàn)的肺結(jié)節(jié)。該模型檢測(cè)并分類(lèi)具有不同等級(jí)良性和惡性腫瘤結(jié)節(jié)的圖像作為“原發(fā)性結(jié)節(jié)”。這些情況需要相對(duì)緊急的轉(zhuǎn)診到相關(guān)的呼吸內(nèi)科醫(yī)生或胸外科醫(yī)生那里進(jìn)行最終治療。該系統(tǒng)將具有良性肺或假陽(yáng)性結(jié)節(jié)的圖像分類(lèi)，其具有成為惡性腫瘤的可能性低，“僅在可視化結(jié)構(gòu)化報(bào)告中顯示”。在臨床工作中非常常見(jiàn)的微觀結(jié)節(jié)不適用于惡性腫瘤;因此，轉(zhuǎn)診給相關(guān)專家進(jìn)行治療的緊迫性較小。

在這里，我們?cè)噲D解釋人工智能與人類(lèi)專家相比在檢測(cè)肺結(jié)節(jié)方面的優(yōu)勢(shì)。在本研究中，我們采用了一種簡(jiǎn)單直觀的方法，即對(duì)檢測(cè)到的結(jié)節(jié)與金標(biāo)準(zhǔn)篩選到的結(jié)節(jié)的一致性程度進(jìn)行評(píng)估。以病理金標(biāo)準(zhǔn)為參照，分別采用Kappa一致性系數(shù)和Mann-Whitney U檢驗(yàn)進(jìn)行一致性分析。引人注目的是，除了AI之外，在所有成對(duì)比較中存在差異（AI為p=0.138，其他比較為p<0.001）。與人類(lèi)專家相比，AI也可以與金標(biāo)準(zhǔn)檢測(cè)到的肺結(jié)節(jié)顯著一致，AI由于其最高的一致性系數(shù)而脫穎而出(AI kappa=0.94，其他比較p<0.001）。我們進(jìn)一步比較了不同尺寸范圍內(nèi)檢測(cè)到的結(jié)節(jié)的一致性，并證明無(wú)論結(jié)核大小范圍如何，AI都顯示出超出人類(lèi)專家的金標(biāo)準(zhǔn)更有利的一致性。

思路清奇！南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊：AI將影像排版時(shí)間縮短至100秒，準(zhǔn)確率近于100%

圖10：應(yīng)用于五個(gè)不同制造商的成像設(shè)備時(shí)，AI在肺結(jié)節(jié)診斷一致性方面的表現(xiàn)。

3.4 IILS的交叉-設(shè)備適用性

既然AI已被證實(shí)在檢測(cè)結(jié)節(jié)方面優(yōu)于人類(lèi)專家，無(wú)論大小如何，有必要從另一個(gè)角度來(lái)判斷AI的適用性?；旧希珹I的診斷取決于現(xiàn)有制造商生產(chǎn)的圖像；因此，評(píng)估不同制造商的圖像輸出對(duì)AI檢測(cè)到的結(jié)節(jié)的影響是合理的。為了在參考黃金標(biāo)準(zhǔn)的條件下探索AI對(duì)不同成像制造商的適應(yīng)性，通過(guò)Mann-Whitney U檢驗(yàn)和kappa一致性分析，進(jìn)一步評(píng)價(jià)AI與金標(biāo)準(zhǔn)診斷不同廠家不同大小結(jié)節(jié)的一致性。總體而言，AI在五家制造商上配置良好，與黃金標(biāo)準(zhǔn)相比沒(méi)有差異（通用為p=0.576，飛利浦為p=0.472，西門(mén)子為p=0.988，東芝為p=0.376，聯(lián)影（UI）為p=0.343）。此外，實(shí)現(xiàn)了高一致性，kappa系數(shù)為0.87到0.99之間（圖10）。

思路清奇！南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊：AI將影像排版時(shí)間縮短至100秒，準(zhǔn)確率近于100%

圖11 評(píng)估AI在識(shí)別良性或惡性病變中的表現(xiàn)

3.5 通過(guò)獨(dú)立數(shù)據(jù)驗(yàn)證IILS在診斷方面優(yōu)于人類(lèi)專家的表現(xiàn)

使用284例病理結(jié)果患者的獨(dú)立數(shù)據(jù)進(jìn)行比較，使用相同的數(shù)據(jù)集比較惡性肺結(jié)節(jié)和良性結(jié)節(jié),以確定模型性能的準(zhǔn)確性。我們推斷，我們最初的預(yù)測(cè)模型完全適用于臨床，因?yàn)槠銻OC下面積對(duì)于惡性肺結(jié)節(jié)相對(duì)于良性肺結(jié)節(jié)高達(dá)90.6%（圖11a）。在0.5的評(píng)分截?cái)嘞拢?24例預(yù)測(cè)為真陽(yáng)性，1479例為真陰性。約有38例被標(biāo)記為假陽(yáng)性，181例為假陰性。敏感性76.5%，特異性89.1%（圖11b）。在另一組284例病理金標(biāo)準(zhǔn)患者中，模型和人類(lèi)專家的預(yù)測(cè)性能在曲線上進(jìn)行了比較，得出結(jié)論：人工智能在敏感性和特異性方面優(yōu)于其他6名專家。此外，與人類(lèi)專家相比，人工智能顯示出最高的準(zhǔn)確性;正確預(yù)測(cè)248例（87.3%，預(yù)測(cè)為真陽(yáng)性或真陰性的人數(shù)除以284），錯(cuò)誤預(yù)測(cè)最少，36例（12.7%）。

3.6 自動(dòng)自適應(yīng)布局工具的設(shè)計(jì)與評(píng)估

根據(jù)2018年NCCN指南的要求，我們與六位專家（三位放射科醫(yī)生和三位臨床醫(yī)生）進(jìn)行了討論后，就良好的圖像布局形式達(dá)成了最終共識(shí)。為了模擬醫(yī)學(xué)成像部門(mén)胸部CT掃描后的日常工作結(jié)果，我們?cè)O(shè)計(jì)了一種自動(dòng)自適應(yīng)布局工具，可以生成“自動(dòng)膠片布局和肺結(jié)節(jié)結(jié)構(gòu)報(bào)告”，以連接到CNN網(wǎng)絡(luò)的輸出。自動(dòng)自適應(yīng)布局工具可以導(dǎo)出關(guān)鍵肺結(jié)節(jié)圖像（具有增加的惡性風(fēng)險(xiǎn)的結(jié)節(jié)）的膠片布局并生成結(jié)構(gòu)化報(bào)告。兩種膠片布局都以固定格式使用（一部膠片上有5×8網(wǎng)格）。將180名患者的胸部CT圖像混合并連續(xù)輸入到IILS，以模擬來(lái)自不同制造商的圖像在日常工作中進(jìn)入工作站的情況。評(píng)估了自適應(yīng)布局工具的特性以及是否可以成功布局。這180名患者的圖像總數(shù)為60660，包括縱隔12240例窗口圖像和48420張肺窗圖像。使用5點(diǎn)量表方法來(lái)最終判斷電子膠片的布局。

思路清奇！南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊：AI將影像排版時(shí)間縮短至100秒，準(zhǔn)確率近于100%

表2：用于評(píng)估布局一致性和準(zhǔn)確性的五點(diǎn)量表。

思路清奇！南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊：AI將影像排版時(shí)間縮短至100秒，準(zhǔn)確率近于100%

圖12 五家制造商的IILS部署量化。

3.7 五點(diǎn)量表評(píng)估高質(zhì)量的IILS

我們利用五點(diǎn)量表（表2）來(lái)評(píng)估IILS的質(zhì)量。在所有類(lèi)型的制造商中，只有少數(shù)幾個(gè)分?jǐn)?shù)無(wú)法達(dá)到第四等級(jí)（圖12a）。正常布局情況下沒(méi)有發(fā)現(xiàn)遺漏，然而，與正常對(duì)照組相比（p=0.04）（圖12b），患者在第四區(qū)的幾個(gè)病例中出現(xiàn)了漏診。我們還比較了從每個(gè)量表得分中得出的總分，總的來(lái)說(shuō)，西門(mén)子在使用IILS時(shí)效果最好?？偡诛@示，與結(jié)節(jié)患者相比，IILS更適合無(wú)結(jié)節(jié)者（p=0.04）（圖12d）。

3.8 IILS與傳統(tǒng)工作站相比的優(yōu)點(diǎn)：更少的時(shí)間，沒(méi)有無(wú)效的圖像和零遺漏

考慮到需要點(diǎn)擊時(shí)間，五個(gè)主要廠商設(shè)備布局的平均點(diǎn)擊次數(shù)為14.45±0.34次。其中GE平均點(diǎn)擊量為14.37±0.89次，飛利浦為14.70±0.86次，西門(mén)子為14.57±0.87次，東芝為15.77±0.95次，UI為13.67±0.79次，IILS為2次（p<0.04）（圖13a）。在使用傳統(tǒng)工作站時(shí)，無(wú)論是患者還是無(wú)結(jié)節(jié)正常人，都需要比IILS更多的點(diǎn)擊量。IILS和傳統(tǒng)制造商在患者和正常人的圖像布局沒(méi)有顯著差異。通過(guò)不同廠家工作站的250例患者(每個(gè)廠家50例)的布局圖像，每個(gè)廠家50例患者所需時(shí)間分別為8分鐘(GE)、7.42分鐘(飛利浦)、8.87分鐘(西門(mén)子)、8.17分鐘(東芝)和8.63分鐘(UI)。傳統(tǒng)CT工作站的平均布局時(shí)間為16.87秒/患者。相比之下，IILS需要大約6.92秒/患者。與使用其他制造商工作站的患者和無(wú)結(jié)節(jié)相比，使用IILS的時(shí)間顯著減少。正如我們所料，IILS在患者和正常病例中比傳統(tǒng)工作站更有效。有趣的是，IILS在無(wú)結(jié)節(jié)病例上花費(fèi)的時(shí)間更少，而傳統(tǒng)工作站需要更長(zhǎng)的時(shí)間。

另外，對(duì)于兩種布局，我們比較了來(lái)自兩個(gè)不同布局系統(tǒng)的無(wú)效圖像。我們隨機(jī)收集了來(lái)自三個(gè)制造商工作站的50個(gè)布局結(jié)果，總共150個(gè)結(jié)果。在傳統(tǒng)的人工布局下，GE、Philips、UI患者的無(wú)效圖像分別為8.10±0·42、6.92±0·39、6.15±0·41，IILS患者為0。我們?cè)u(píng)估了膠片每個(gè)網(wǎng)格中的肺區(qū)域是否適合每個(gè)尺寸。所有的專家都主觀地認(rèn)為存在著顯著的差異。我們進(jìn)一步研究?jī)煞N布置方法和工作流程是否會(huì)導(dǎo)致肺結(jié)節(jié)檢測(cè)的遺漏。兩名放射科醫(yī)生被要求指出兩個(gè)胸部CT片和不同平臺(tái)上報(bào)告的結(jié)節(jié)的位置。根據(jù)報(bào)告的描述，我們共發(fā)現(xiàn)318個(gè)不匹配的結(jié)節(jié)，46.8%的患者未發(fā)現(xiàn)結(jié)節(jié)，約為0.97/例。此外，327例患者中63例漏診為GGN。

3.9 IILS完全可重現(xiàn)，防止人類(lèi)測(cè)量的不穩(wěn)定性

我們從幾個(gè)方面比較了如何正確顯示結(jié)節(jié)的結(jié)果。由于金標(biāo)準(zhǔn)的缺乏，我們?cè)u(píng)估了哪種標(biāo)準(zhǔn)更穩(wěn)定或重現(xiàn)性更好。在這方面，總共選擇了8個(gè)肺結(jié)節(jié)，即4個(gè)不同尺寸的2個(gè)結(jié)節(jié)（尺寸<3mm，3-6mm，6-10mm，10-3cm）。隨后，兩名放射學(xué)家被要求通過(guò)工作站，在不同時(shí)期10次反復(fù)測(cè)量這8個(gè)結(jié)節(jié)的大小和密度；IILS 的測(cè)量結(jié)果是100%可重復(fù)的，在多次測(cè)量中表現(xiàn)出完全的一致性，而由專家評(píng)估的測(cè)量則顯示出不同程度的波動(dòng)。

3.10 人機(jī)耦合操作需要適應(yīng)過(guò)程

我們模擬了放射科醫(yī)師的正常工作場(chǎng)景，其中要求兩名放射科醫(yī)師在兩小時(shí)內(nèi)對(duì)284名患者中的盡可能多的患者做出判斷，使用傳統(tǒng)診斷或基于AI判斷的重新診斷，間隔時(shí)間為一個(gè)月。在使用AI判斷作為先驗(yàn)信息后，在消耗時(shí)間、效率和絕對(duì)不匹配的結(jié)節(jié)方面有了顯著的改善（p<0.05）。具體來(lái)說(shuō)，基于人工智能已有的判斷，兩位專家不僅減少了同一幅圖像的診斷時(shí)間，而且提高了單位時(shí)間內(nèi)的診斷效率。檢測(cè)誤差也明顯減小。使用AI后，兩位專家的檢測(cè)靈敏度都得到了提高，但專家2的特異性從99.2%下降到60%。

思路清奇！南京鼓樓醫(yī)院醫(yī)療AI成果登柳葉刀子刊：AI將影像排版時(shí)間縮短至100秒，準(zhǔn)確率近于100%

表3：用于評(píng)定不同類(lèi)型圖像布局組合的五點(diǎn)標(biāo)度。

3.11 專家和患者的滿意度都顯示出IILS的友好性

六位對(duì)原先結(jié)果不知情的專家評(píng)估了傳統(tǒng)系統(tǒng)和IILS的結(jié)果。我們建立了一個(gè)5點(diǎn)評(píng)分機(jī)制，用于評(píng)估由兩種不同布局系統(tǒng)生成的布局電子膠片和報(bào)告（表3）。專家對(duì)IILS進(jìn)行了明顯更好的評(píng)價(jià)，所有5點(diǎn)中的3到4點(diǎn)高于傳統(tǒng)方法（p=7.674e-23）。相比之下，患者評(píng)分更加極端，表明報(bào)告的友好性非常重要（p=8.164e-25）。

3.12 IILS在LUNA16和LIDC/IDRI基準(zhǔn)上的性能評(píng)價(jià)

IILS的性能在兩個(gè)基準(zhǔn)數(shù)據(jù)庫(kù)上進(jìn)行了評(píng)估，即LUNA16和LIDC/IDRI。Luna16（https://luna16.grand-challenge.org/）共888次CT掃描，最終得分為0.696（排名18）。我們?cè)贚IDC / IDRI 數(shù)據(jù)庫(kù)上進(jìn)一步測(cè)試了我們的IILS （ https://wiki.CurraseIfgIsActuv.NET/DISPLAY/PARIS/LIDC-IDRI ）有1018次CT 掃描，其包含更多的切片厚度類(lèi)型并且更類(lèi)似于真實(shí)的臨床環(huán)境。對(duì)于大于3mm的結(jié)節(jié)，模型的召回率為88.75％，每例掃描的假陽(yáng)性率為5.22。

4、討論

在本研究中，通過(guò)創(chuàng)建和部署深度神經(jīng)網(wǎng)絡(luò)算法，在有限的人類(lèi)干涉下，我們的IILS模型展示了胸部CT圖像分析的競(jìng)爭(zhēng)性性能。此外，機(jī)器學(xué)習(xí)技術(shù)用于圖像分析的功效可能超出了胸部CT圖像的范圍—原則上，通過(guò)AI和布局學(xué)習(xí)的技術(shù)可能潛在地用于多個(gè)學(xué)科的各種醫(yī)學(xué)圖像。

IILS的一個(gè)主要特點(diǎn)是幾乎實(shí)時(shí)地檢測(cè)肺部結(jié)節(jié)。這種實(shí)時(shí)性能是由于系統(tǒng)中的Faster RCNN模型。IILS的性能在很大程度上取決于通過(guò)訓(xùn)練模型檢測(cè)和分類(lèi)結(jié)節(jié)的準(zhǔn)確性。雖然與金標(biāo)準(zhǔn)達(dá)成了很高的一致性，將AI應(yīng)用于UI在檢測(cè)小結(jié)節(jié)方面仍存在顯著差異，這可能是由于參加模型訓(xùn)練的樣本量?。ńY(jié)節(jié)數(shù)量，n=1119）造成的。

經(jīng)證實(shí)，在檢出結(jié)節(jié)數(shù)量和判斷良惡性方面，IILS優(yōu)于6名專家。根據(jù)目前構(gòu)建的模型，獲得的ROC曲線下面積達(dá)90.6%，具有一定的臨床應(yīng)用價(jià)值。經(jīng)過(guò)嚴(yán)格的統(tǒng)計(jì)檢驗(yàn)，在結(jié)節(jié)檢出量和良惡性判斷方面，IILS優(yōu)于6名人類(lèi)專家。補(bǔ)充表S6顯示了一些相關(guān)工作和比較結(jié)果。相比之下，實(shí)驗(yàn)數(shù)據(jù)和CNN結(jié)構(gòu)的結(jié)果都取得了一定的進(jìn)展，使我們對(duì)IILS的模型性能穩(wěn)定、可靠和高效充滿了希望。

IILS旨在用于日常實(shí)際工作中準(zhǔn)確檢測(cè)和分類(lèi)結(jié)節(jié)，并標(biāo)準(zhǔn)化胸部CT圖像和報(bào)告。這種布局的優(yōu)點(diǎn)是簡(jiǎn)化了醫(yī)生仔細(xì)翻看圖像，找到有關(guān)鍵圖像的肺結(jié)節(jié)的過(guò)程。為優(yōu)化IILS，我們?cè)u(píng)估了其在布局部件中的性能。憑借AI接近100％的成功率，整個(gè)多平面重建程序設(shè)計(jì)可以自動(dòng)完成。多平面重建對(duì)臨床醫(yī)生從多個(gè)角度觀察肺結(jié)節(jié)，做出最終診斷，評(píng)估和跟蹤肺結(jié)節(jié)至關(guān)重要。

IILS與傳統(tǒng)布局系統(tǒng)之間存在十四個(gè)差異。其中，內(nèi)容分為三個(gè)部分。第一部分側(cè)重于使運(yùn)營(yíng)商受益。IILS可能有機(jī)會(huì)降低成本，包括提高CT利用效率，替代低成本資源甚至取代某些業(yè)務(wù)。第二部分包括第四至第十一點(diǎn)的內(nèi)容，這些差異主要集中在最終產(chǎn)出的差異，兩種電子膠片加上兩種不同系統(tǒng)產(chǎn)生的一種相應(yīng)的報(bào)告。盡管IILS制作的電子膠片布局是從傳統(tǒng)方式的兩個(gè)部分演變?yōu)槿齻€(gè)部分，其中前五個(gè)小網(wǎng)格僅用于顯示在不同呈現(xiàn)形式下具有最高惡性風(fēng)險(xiǎn)的一個(gè)結(jié)節(jié)，這將有助于IILS比傳統(tǒng)方法更經(jīng)常地獲得有效圖像，從而提高了效率。

此外，還出現(xiàn)了一個(gè)有趣的現(xiàn)象。驗(yàn)證在我們的自適應(yīng)工具的表現(xiàn)中，我們從臨床醫(yī)學(xué)報(bào)告的結(jié)果中隨機(jī)選擇了來(lái)自對(duì)照組的327例病例，這些病例報(bào)道沒(méi)有肺結(jié)節(jié)。然而，在重新測(cè)試的過(guò)程中，我們發(fā)現(xiàn)在153例（46.8％）中實(shí)際錯(cuò)過(guò)了318個(gè)結(jié)節(jié)。錯(cuò)過(guò)的結(jié)節(jié)主要集中在3-6毫米而不是<3毫米的，主要類(lèi)型的缺失結(jié)節(jié)是鈣化結(jié)節(jié)而不是磨砂玻璃結(jié)節(jié)。這個(gè)問(wèn)題的可能原因是，在傳統(tǒng)的母語(yǔ)中，鈣化結(jié)節(jié)可能被“舊病變”所取代，而“磨玻璃結(jié)節(jié)”則沒(méi)有同義詞。

第六點(diǎn)為多維結(jié)節(jié)；根據(jù)基線和隨訪CT的結(jié)節(jié)直徑和時(shí)間間隔的差異可以觀察和估計(jì)結(jié)節(jié)的大小在這兩種掃描之間，腫瘤呈均勻的三維生長(zhǎng)。然而，由于繁重的體力勞動(dòng)，無(wú)法對(duì)關(guān)鍵的肺結(jié)節(jié)進(jìn)行三維重建。因此，我們?cè)黾恿艘环N自動(dòng)多維觀察方法，以最大限度地減少誤診率。

第三部分包括第十二至第十四點(diǎn)的內(nèi)容，比較了IILS和傳統(tǒng)工作站對(duì)所有醫(yī)生和病人的影響。我們的研究結(jié)果表明，所有醫(yī)生和患者對(duì)IILS的輸出感到滿意。然而，在以經(jīng)驗(yàn)為導(dǎo)向的閱讀習(xí)慣方面，人工智能在人類(lèi)專家中的有效性仍然存在差異。在我們的研究中，一名資深放射科醫(yī)生(專家1)似乎對(duì)人工智能預(yù)測(cè)肺結(jié)節(jié)的信心較低，即使IILS做出了判斷，也會(huì)仔細(xì)遵循閱讀習(xí)慣瀏覽圖像。應(yīng)用人工智能前后，在效率、消耗時(shí)間、結(jié)節(jié)絕對(duì)不匹配等方面均有顯著差異。有趣的是，在敏感性和特異性方面沒(méi)有發(fā)現(xiàn)明顯的改善。相比之下，初級(jí)放射科醫(yī)生(專家2)似乎在很大程度上信任人工智能。我們推測(cè)，人機(jī)耦合操作可能仍然需要一個(gè)適應(yīng)過(guò)程。

雖然結(jié)果很有希望，但我們的研究有一些局限性。在這項(xiàng)試驗(yàn)研究中，脊柱側(cè)凸患者、原發(fā)性或繼發(fā)性胸部畸形患者和接受胸外科手術(shù)的患者的圖像不包括在訓(xùn)練和測(cè)試集中。因此，需要進(jìn)一步的臨床收集和測(cè)試來(lái)評(píng)估各種形式的胸腔的臨床準(zhǔn)確性。由于胸廓畸形的發(fā)生率相對(duì)較低，這種影響不會(huì)影響我們的總體結(jié)論。臨床試驗(yàn)研究在兩年內(nèi)進(jìn)行，IILS正常運(yùn)作六個(gè)月。但是，需要對(duì)新系統(tǒng)進(jìn)行進(jìn)一步評(píng)估，以評(píng)估長(zhǎng)期準(zhǔn)確性和穩(wěn)定性。

此外，IILS僅限于解決成人肺結(jié)節(jié)的CT圖像問(wèn)題，而不是嬰兒，由于嬰兒很少出現(xiàn)肺結(jié)節(jié)。在各種環(huán)境條件下還需要進(jìn)行更多測(cè)試，例如，在極冷、炎熱、干燥和潮濕的環(huán)境中進(jìn)行測(cè)試。還需要測(cè)試具有一些噪聲的圖像以評(píng)估系統(tǒng)的穩(wěn)健性。事實(shí)上，圖像不完整的患者被納入系統(tǒng)，最終導(dǎo)致異常。因此，在處理特殊圖像，例如不完整圖像，空白圖像或不正確圖像時(shí)，當(dāng)前系統(tǒng)仍有改進(jìn)的空間，可以引入諸如完整性掃描和灰度確認(rèn)之類(lèi)的算法。另外，目前，IILS只能在胸部進(jìn)行。未來(lái)的工作可能包括將設(shè)備應(yīng)用于身體其他部位的圖像。

總之，IILS的性能優(yōu)于傳統(tǒng)系統(tǒng)，并提供了一種比現(xiàn)有技術(shù)更經(jīng)濟(jì)、設(shè)計(jì)更合適的替代方法，以優(yōu)化肺部結(jié)節(jié)的CT布局，節(jié)省費(fèi)用和提高效率。由于基于自動(dòng)AI的標(biāo)準(zhǔn)化電子膠片和可視化結(jié)構(gòu)化報(bào)告生成，可能會(huì)在日常工作流程中建立一個(gè)新的標(biāo)準(zhǔn)和一個(gè)新的放射學(xué)工作流程，并且不需要一些相關(guān)的操作員。

為了提供一個(gè)可以引用的基準(zhǔn)，我們?cè)趦蓚€(gè)基準(zhǔn)數(shù)據(jù)庫(kù)上評(píng)估了我們的IILS的性能。正如預(yù)期的那樣，我們得到了相對(duì)較高水平的假陽(yáng)性，特別是LUNA16，因?yàn)樵陬A(yù)測(cè)中，小尺寸的結(jié)節(jié)被視為假陽(yáng)性。我們認(rèn)為，設(shè)計(jì)的最優(yōu)診斷模型通常是針對(duì)特定群體的，因?yàn)槲覀儾捎玫乃杏?xùn)練圖像都來(lái)自中國(guó)，而LUNA16數(shù)據(jù)庫(kù)收集的數(shù)據(jù)集僅從美國(guó)中收集，且沒(méi)有任何<3mm結(jié)節(jié)的標(biāo)簽。

綜合而言，IILS提供了一種簡(jiǎn)單、準(zhǔn)確的方法來(lái)檢測(cè)、分類(lèi)和布局肺結(jié)節(jié)的CT圖像，以提高對(duì)中國(guó)人群的診斷。因此，IILS為人工智能的臨床應(yīng)用打開(kāi)了新的窗口，可能是改善全球醫(yī)療質(zhì)量不平衡的有效途徑。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

8人收藏

相關(guān)文章