0
本文作者: 奕欣 | 2017-11-06 12:51 |
雷鋒網 AI 科技評論按: 北京大學 LAB2112 團隊在今年的阿里天池醫(yī)療 AI 大賽中又奪冠了。這支來自北京大學信息科學技術學院機器感知與智能教育部重點實驗室的研究團隊,包括四名碩士研究生王東、胡志強、羅天歌、楊澤,與博士研究生李傲雪,團隊的指導教師為王立威教授。
王立威老師團隊在醫(yī)療影像分析,尤其是肺部 CT 圖像分析上有著深厚的研究基礎和豐富的研究經驗,曾參與 Kaggle Data Science Bowl 2017 肺癌預測大賽,于全球 1972 支隊伍中獲得第 4 名; 曾參與 LUNA 肺結節(jié)檢測挑戰(zhàn)賽,在肺結節(jié)檢測和假陽性削減兩項任務中均取得第 1 名并保持到 2017 年 7 月,相關文章發(fā)表在醫(yī)療圖像計算頂級會議 MICCAI 2017。
在本次阿里天池醫(yī)療 AI 大賽中,王立威老師又再次帶領團隊獲得了冠軍。在比賽結束后,雷鋒網 AI 科技評論第一時間聯系了王立威教授,針對他在醫(yī)學影像領域的研究做了細致的交流。
王立威,北京大學信息科學技術學院教授。長期從事機器學習研究。在機器學習領域發(fā)表論文 100 余篇。2011 年入選人工智能重要國際獎項 AI's 10 to Watch,是亞洲首位獲得該獎項的學者。2012 年獲得首屆國家自然科學基金優(yōu)秀青年基金。擔任國際人工智能權威會議 NIPS,IJCAI 領域主席。中國計算機學會人工智能與模式識別專委會常委。
2012 年以來,不論是深度網絡層數的不斷拓展,還是系統在數據集上的優(yōu)異表現,都讓學術界對機器學習有了重新的認識。對于王立威教授而言,彼時的他已經在機器學習領域做了大量的研究,并憑借突出的表現在 2011 年成為首位入選 AI' s 10 to Watch 的亞洲學者。
但王立威教授認為,這一切只是個開始?!笝C器學習在近年來取得了顯著的突破與發(fā)展,除了理論的研究外,更重要的是,學者們需要看清技術對生活產生的重大影響?!雇趿⑼淌谥蒙砣斯ぶ悄芾顺钡那把兀匀灰蚕M茉跈C器學習的應用領域有所作為。
經過王立威教授的觀察和思考,他認為有三個領域會與深度學習進行緊密的結合,并希望能夠選擇其中一個方面來進行深入研究:一個是無人駕駛;一個是金融領域;再一個則是醫(yī)療領域。
王立威教授認為,無人駕駛在計算機視覺的識別技術已經趨于成熟,具備可以與機器學習進行深入結合的條件,但作為一個與汽車實體緊密相關的應用方向,在高校內做研究的空間相對受限;此外,駕駛作為一種動態(tài)活動,相對于靜態(tài)圖像識別的難度與復雜性要高得多。
而金融領域盡管積累了非常多高質量的封閉數據,但它屬于噪聲非常大的信號,受突發(fā)政策、人為操作的影響較大,并非總是嚴格遵循客觀規(guī)律。
在這個應用研究的三岔路口上,王立威教授最終選擇了醫(yī)學影像領域。一方面,醫(yī)學影像屬于靜態(tài)圖像識別,相對于視頻技術的處理技術要更加成熟;另一方面,依托北京大學的一系列附屬醫(yī)院,不論是從數據的獲取或是系統的測試落地上,王立威教授所在的北京大學研究團隊都有著得天獨厚的優(yōu)勢。
既然選擇了遠方,便只顧風雨兼程。從 2014 年開始,王立威教授及其團隊便開始了一段與醫(yī)學影像的不解之緣。
當時,醫(yī)學界所采用的醫(yī)學影像技術已經沿用了十年之久。在深度學習流行起來的一段時間內,也一直是以兩種方法并行的模式同時發(fā)展。王立威教授前期采用了調研與探索的方式,利用機器學習在性能上的優(yōu)勢嘗試原有的傳統技術,一開始也取得了不錯的效果。
但技術的落地并不總是一帆風順。只滿足于把自己定位于一個機器學習的研究人員來看待醫(yī)學影像問題,將機器學習技術單純地「嫁接」到醫(yī)學影像原有的系統上,結果也還不錯,但距離優(yōu)秀、滿意的系統依然還很遠。王立威教授在經過反思和研究后終于意識到,問題的本質在于研究人員對醫(yī)學影像缺乏真正深入的認識。
「計算機學科與醫(yī)學畢竟還是兩個完全獨立的學科,不論是從知識體系或是根本性的思維方式都有很大差異。如果一位機器學習的科研人員要潛心做醫(yī)學影像的研究,首先要從心理上克服畏難的心理,要有積極的心態(tài)去學習非?;A的醫(yī)療知識?!雇趿⑼淌诟嬖V雷鋒網 AI 科技評論,作為機器學習或是計算機學科的研究人員,更希望能比較精確、定量化地進行描述,如果是醫(yī)學領域,在很多研究內容上往往更傾向于做定性的描述。
以醫(yī)學影像的診斷為例,如果呈現某些特征,醫(yī)學人員可能會認為這就是可能出現某種疾病的判斷依據;但在同樣的情況下,計算機學科的研究人員可能需要一個精確的定義,「需要滿足哪些定量條件才能被視為符合的特征?」這種基于學科的思維差異容易在溝通和交流上產生障礙,繼而影響機器學習在醫(yī)學影像上的應用。
此外,機器學習領域目前在識別、檢測、分割所處理的圖像很多都是自然景象,與以 X 光、CT 或是核磁共振為代表的醫(yī)學影像所處理的人體器官圖像存在巨大的差異。而與機器學習所處理的單張圖像相比,醫(yī)學影像所處理的圖像是逐層的掃描,在某種意義上是一系列的連續(xù)圖像,又存在著不同的地方。「如果僅僅是將機器學習領域的現有算法直接套用在醫(yī)學影像領域,我認為是很難取得什么好的成果的,」王立威教授表示,「我們得針對醫(yī)學影像自身的獨有特點,有的放矢地設計或大幅度地改進現有的算法才行。」
因此,王立威教授決定帶領團隊先對醫(yī)療知識進行系統性的了解,圍繞特定病種的診斷基準進行整體的學習。其次,醫(yī)生在對醫(yī)學影像進行判斷的過程叫做「閱片」,王立威教授也一同與學生們花了大量的時間學習如何掌握這一技能。
在醫(yī)學知識有了質的提升后,以此為基礎再做涉及細節(jié)的算法設計時,王立威教授發(fā)現系統的水平又上升了一個臺階。為了做好一個機器學習應用問題,這支高校團隊花了很大的精力與時間去掌握基礎的醫(yī)療知識。而王立威教授也表示,這也為系統的進一步提升、為與醫(yī)生的溝通交流起到了關鍵性的作用。
秉承著這樣的理念,王立威教授在醫(yī)學影像應用領域做出了很多突破性的嘗試,包括提出針對醫(yī)療影像檢測的深度學習方法 ContextNet,以及將多個機器學習算法首次引入肺結節(jié)的檢測系統。
從算法層面,王立威教授及團隊已經做出了不少的創(chuàng)新性嘗試。而在王立威教授看來,如何提升病種檢測的復現性或者說遷移性,同樣是一個亟待解決的難題?!负歪t(yī)學影像相關的病種可能多達 2000 種,即便是常見的可能也有幾百種。那么,解決了某一病種的醫(yī)學影像問題后,同一方法是否能遷移到新的病種上?假設這些病種都是相對獨立的關系,那么每次都需要從頭做新的研究?!勾送猓紤]到不同病種包括了 X 光、CT、核磁共振等多種不同的成像方式,這一問題就顯得更加復雜。
基于病種的數量龐大,病種的選擇標準就成為了一個非常重要的問題。Google 早在 2016 年就開始著手用機器學習算法增強糖尿病視網膜病變的檢測過程,而騰訊優(yōu)圖實驗室也于今年分享過它們在糖尿病視網膜篩查的一些工作。在病種的選擇上,王立威教授告訴雷鋒網 AI 科技評論,從他個人的角度來看有三個需要考慮的地方。
首先是需求問題。從根本上,醫(yī)療影像依然是一個與實際應用的需求緊密結合的問題,因此疾病的發(fā)病率、死亡率自然是首要考慮的因素;此外,該病種的受眾面越大,攻克這一病種所惠及的人數就越多。
其次是從技術上考慮。也就是說,根據目前的技術水平來看,是否能借助機器學習提升系統水平,通過醫(yī)學影像的方式成功進行診斷?對于從業(yè)數十年的醫(yī)生來說,不同的病種的判斷難度實際上有著天壤之別。有的病種不需要一秒就可根據醫(yī)學影像進行診斷,但有的病種即使花費大量時間,也難以得到一個很有置信力的結論?!杆裕覀円獜募夹g上對不同病種做嘗試與判斷,看看是否能從技術上幫助醫(yī)生解決這樣的問題?!?/p>
第三點則是對醫(yī)生的幫助程度。一方面自然是從提升效率的角度來看。以肺結節(jié)檢測為例子,一位資深醫(yī)生依然需要 6-8 分鐘才能閱一張 CT 片子,但對于系統而言可能就是一個秒級的概念,更不要說它可以 24/7 地工作了。
王立威教授提及的另一個方面則是反過來,利用機器學習的技術推進醫(yī)生在診斷上的新發(fā)現。比如發(fā)現了以往傳統閱片沒有察覺到的診斷依據,讓這一病種的診斷在醫(yī)學上有所突破。盡管這一點目前還沒有實現,但王立威教授依然懷有這樣的期待。
在王立威教授的領導下,北京大學 LAB2112 團隊曾參與 Kaggle Data Science Bowl 2017 肺癌預測大賽,于全球 1972 支隊伍中獲得第 4 名; 曾參與 LUNA 肺結節(jié)檢測挑戰(zhàn)賽,在肺結節(jié)檢測和假陽性削減兩項任務中均取得第 1 名并保持到 2017 年 7 月,相關文章發(fā)表在醫(yī)療圖像計算頂級會議 MICCAI 2017。在本次天池醫(yī)療 AI 大賽中,王立威老師又再次帶領團隊獲得了冠軍。
如果是普通的開發(fā)類比賽,數據集與數據來源都是賽事組織方給定的,而且質量也非常高。但在現實生活中,考慮到標記數據的成本及數據量的限制,如何在減少對數據的依賴下提升模型的魯棒性?王立威教授表示,一種較為容易實現且簡單直接的辦法就是采用預訓練的方法,選擇一些具有相關性且較易獲取圖像的領域,利用圖像做網絡的訓練,再應用到具體的醫(yī)學影像領域上來。這樣一來,對數據的需求也會有相應的減少。
機器學習的可解釋性一直是一個頗受重視的問題,而在本次天池比賽里,北京大學 LAB2112 團隊在決賽答辯時也展示了它們在這一領域的相關探索?!敢苑谓Y節(jié)比賽為例,醫(yī)生的判斷其實也是看這個級別形態(tài)上的一些特征,比如毛刺或是空洞出現的頻率較高,那么判斷為惡性的可能性就比較高,我們通過分析神經網絡,發(fā)現它確實對提及的特征關注得比較多。也就是說,可解釋性會在節(jié)點附近的區(qū)域使得神經網絡的響應呈現最大化,那么反過來,這也與醫(yī)生的經驗判斷是吻合的。」
參加了如此多的比賽并取得了突出的成績,王立威教授對此則以一種謙虛樂觀的態(tài)度對待。他認為,參加比賽的目的只是鍛煉隊伍、檢驗水平,與其它的團隊進行切磋和交流,在未來最重要的事情,還是要解決實際問題?!冈谡鎸嵉尼t(yī)學場景中廣泛地應用機器學習,才是我們最希望看到的結果?!?/p>
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。