0
雷鋒網(wǎng)消息,大量、高質(zhì)量的數(shù)據(jù)集推動了深度學(xué)習(xí)領(lǐng)域的發(fā)展。近日,斯坦福吳恩達(dá)團(tuán)隊開源了 MURA 數(shù)據(jù)庫,包含 14982 個病例的上肢肌肉骨骼X光片。每個病例包含一個或多個圖像,均由放射科醫(yī)師手動標(biāo)記。團(tuán)隊表示,為鼓勵醫(yī)學(xué)影像診斷模型的進(jìn)步,MURA 數(shù)據(jù)庫可以免費使用。數(shù)據(jù)集地址為https://stanfordmlgroup.github. io/projects/mura(數(shù)據(jù)集要2月才會公布)
異常檢測任務(wù),也就是通過組織器官的 X 光片來確定機(jī)體的健康狀況,對患病情況進(jìn)行直接診斷。全球超過 17 億人都有肌肉骨骼性的疾病,這也是導(dǎo)致長期疼痛和殘疾最常見的病因。據(jù)雷鋒網(wǎng)了解,每年有 3000 萬左右的急診病例,這個數(shù)字還在不斷上漲。
MURA 是目前最大的 X 光片數(shù)據(jù)庫之一,包含源自 14982 項病例的 40895 張肌肉骨骼X光片。1萬多項病例里有 9067 例正常的上級肌肉骨骼和 5915 例上肢異常肌肉骨骼的 X 光片,部位包括肩部、肱骨、手肘、前臂、手腕、手掌和手指。
表一:MURA 數(shù)據(jù)庫包含 9067 例正常和 5915 例異常肌肉骨骼影像學(xué)研究,包括肩部,肱骨,手肘,前臂,手腕,手掌和手指等上肢。MURA 是最大的公共影像數(shù)據(jù)集之一。
基于 MURA,我們開發(fā)了一個有效的異常檢測模型。將一個或多個 X 光片輸入該模型來研究上肢部分。通過 169 層的卷積神經(jīng)網(wǎng)絡(luò)預(yù)測每個 X 光片的異常概率,然后得出同一病例所有 X 光片異常概率的平均值,作為 X 光片的異常概率輸出。
圖2.該模型輸入一個或多個 X 光片,通過 169 層的卷積神經(jīng)網(wǎng)絡(luò)預(yù)測異常的概率,然后輸出異常概率的平均值。
為了有效地評估模型并獲得放射科醫(yī)生對于模型的評價,我們從 209 項持續(xù)跟蹤的病例中挑選了 6 個病例,收集專業(yè)放射科醫(yī)生給出的診斷結(jié)果。將模型和醫(yī)生給出的診斷結(jié)果進(jìn)行比較,發(fā)現(xiàn)模型的診斷能力達(dá)到了放射科醫(yī)生相當(dāng)?shù)乃健?strong>在診斷手指和手腕異常時,模型檢測異常的能力強(qiáng)于最好的醫(yī)生。然而,在診斷膝、前臂、肱骨和肩部異常時,模型的表現(xiàn)不如醫(yī)生的表現(xiàn)。
機(jī)構(gòu)審查委員會的批準(zhǔn)之后,我們通過斯坦福醫(yī)院的PACS系統(tǒng)收集了被識別的、符合HIPPA的圖像。我們收集了來自12251名患者、14982項研究的肌肉骨骼放射學(xué)數(shù)據(jù)集,共有40895個多視圖的影像。每一個都屬于七個標(biāo)準(zhǔn)的上肢放射學(xué)研究類型之一:肘部、手指、前臂、手、肱骨、肩膀和手腕。表1總結(jié)了正常和異常研究的分布情況。
斯坦福醫(yī)院的放射科醫(yī)生將2001年到2012年的每項研究手工標(biāo)記為正?;虍惓!T趯ICOM圖像進(jìn)行解釋時,對至少300萬像素的PACS醫(yī)用級顯示器進(jìn)行了解釋,其中最大亮度為400 cd/m2,最小亮度 1 cd/m2,像素尺寸為0.2,本機(jī)分辨率為1500 x 2000像素。臨床圖像在分辨率和縱橫比上有所不同。我們將數(shù)據(jù)集拆分為訓(xùn)練(11255名患者,13565個研究,37111個圖像)、驗證(788例,1208項研究,3225張圖片)、測試(208個病人,209個研究,559個圖像)。數(shù)據(jù)集在任何一組患者之間沒有重疊。
為了評估模型并得到放射科醫(yī)生的可靠驗證,我們從斯坦福大學(xué)那里收集了一些額外的標(biāo)簽,這些標(biāo)簽包括209個肌肉骨骼研究。放射科醫(yī)生在使用PACS系統(tǒng)的臨床閱覽室環(huán)境中,對每項研究進(jìn)行了回顧和標(biāo)記,并將其標(biāo)記為DICOM文件。放射科醫(yī)生平均有8.83年的經(jīng)驗,從2年到25年不等。放射科醫(yī)生沒有獲得任何臨床資料。標(biāo)簽被輸入到一個標(biāo)準(zhǔn)化的數(shù)據(jù)錄入系統(tǒng)中。
我們評估了放射科醫(yī)生和模型在測試集上的表現(xiàn)。研究中,我們從6名認(rèn)證的放射科醫(yī)生那里收集了額外的正常/異常的標(biāo)簽,選擇了其中三位來創(chuàng)建一個金標(biāo)準(zhǔn),利用其他三位來評估人類在這項任務(wù)上的表現(xiàn)。
表二總結(jié)了放射科醫(yī)生和模型在不同研究類型和總體上的表現(xiàn)。放射科醫(yī)生在腕部研究(醫(yī)生2)或肱骨研究(醫(yī)生1和3)上取得了最高的成績,他們在手指研究上的表現(xiàn)最差。該模型在腕部研究中也達(dá)到了最高的表現(xiàn)。在腕部研究中,模型表現(xiàn)與最好的放射科醫(yī)生表現(xiàn)相當(dāng)。在所有其他研究類型中,模型的表現(xiàn)明顯低于人類的表現(xiàn)。
表二:每個研究類型和總體上突出表現(xiàn)最佳(綠色)和最差(紅色)表現(xiàn)
大型數(shù)據(jù)集使得深度學(xué)習(xí)算法在圖像識別、語音識別和問答等任務(wù)中實現(xiàn)或接近人類水平的性能。醫(yī)學(xué)方面的數(shù)據(jù)集也幫助科學(xué)家在糖尿病視網(wǎng)膜病變、皮膚癌、心律失常、腦出血、肺炎和髖部骨折方面成為小半個“專家”。
表三:公開可用醫(yī)學(xué)放射影像數(shù)據(jù)集(第二大的數(shù)據(jù)集是Pediatric Bone(預(yù)測骨齡);0.E.1是關(guān)于膝關(guān)節(jié)的數(shù)據(jù)集)
表3提供了公共可用數(shù)據(jù)集的摘要。之前的數(shù)據(jù)集比MURA要小,但最近發(fā)布的ChestX-ray14除外,它是112120個正面的胸片、包含14個胸科病理標(biāo)簽。然而,標(biāo)簽并不是直接由放射科醫(yī)生提供的,而是由他們的文本報告自動生成。
很少有公開可用的肌肉骨骼X光數(shù)據(jù)集。斯坦福大學(xué)的醫(yī)學(xué)和成像人工智能項目提供了一個數(shù)據(jù)集,包含了帶有骨骼年齡(AIMI)的兒童手部X光片。據(jù)雷鋒網(wǎng)了解,數(shù)據(jù)集是由不同年齡的兒童的左手影像組成,上面標(biāo)有放射科醫(yī)生的骨齡讀數(shù)。骨關(guān)節(jié)炎方面就得看0. E.1數(shù)據(jù)集了,其中包含標(biāo)有K&L等級的骨關(guān)節(jié)炎(OAI)的膝部放射照片。上述的幾個數(shù)據(jù)集都包含不到15000個圖像。
骨骼肌x光片的異常檢測具有重要的臨床應(yīng)用價值。首先,將異常檢測模型用于工作列表的優(yōu)先級排序。在這種情況下,檢測到的異??梢栽趫D像解釋工作流程中前置,讓最嚴(yán)重的患者得到更快的診斷和治療:
正常的檢查可以被適當(dāng)?shù)貏澐譃楣ぷ髁斜淼妮^低優(yōu)先級;
可以將更快速的結(jié)果傳達(dá)給醫(yī)患雙方,從而優(yōu)化醫(yī)療系統(tǒng)其他領(lǐng)域的配置;
放射學(xué)報告模板用于正常研究,可用于檢驗放射科醫(yī)生,以便進(jìn)行更快速的審查和批準(zhǔn)。
此外,自動異常定位可以幫助緩解放射科醫(yī)生的疲勞。醫(yī)療資源的分布不均加劇了這個問題,尤其是在醫(yī)療資源集中的城市地區(qū)。雖然疲勞是所有醫(yī)護(hù)專業(yè)人員經(jīng)常面對的一個問題,但放射科醫(yī)生非常容易受到影響,進(jìn)而可能會影響診斷的準(zhǔn)確性。有一項研究表明,放射科醫(yī)生在當(dāng)天工作結(jié)束時,骨折檢測的效率與工作開始時相比有顯著的下降。
一個可以進(jìn)行自動異常定位的模型可以突出顯示模型中被識別為異常的部分,引起臨床醫(yī)生的注意。如果有效的話,這將有助于更有效地幫助醫(yī)生進(jìn)行閱片,減少錯誤,并幫助提高標(biāo)準(zhǔn)化質(zhì)量。當(dāng)然了,該模型還需要更多的研究來進(jìn)行評估,并且思考如何與其他深度學(xué)習(xí)模型在臨床環(huán)境中進(jìn)行最優(yōu)化的整合。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。