0
本文作者: 劉海濤 | 2021-05-25 11:03 |
近日,由百圖生科與播禾創(chuàng)新主辦,《醫(yī)健AI掘金志》協(xié)辦的 “首屆中國生物計算大會” 在蘇州閉幕。
作為主論壇的報告嘉賓,中國科學院院士、發(fā)展中國家科學院院士、中國科學院腫瘤與基礎醫(yī)學研究所所長譚蔚泓,以《基于AI的智能診斷以及多參數細胞、疾病分型》為題,進行了演講。
譚蔚泓院士表示, 生命科學由點及面,有海量的數據,同時人類的疾病復雜性、多樣性,要實現高效疾病診療,必須基于海量數據和多參數的表征。
他提出,要利用高通量測量技術,結合多個識別疾病標志物的分子探針,對病人樣本進行多達300個疾病標志物分子特征的甄別和定量測定;利用人工智能和大數據科學進行解析,從而為疾病診斷提供精準圖譜,判斷各種亞型特征。
接下來,譚蔚泓院士圍繞“分子計算”進行了講解。
他提出“分子大腦”的概念——人腦強于思維,電腦強于計算。但電腦計算沒有考慮分子層面信息,分子層面理解才是對事物最徹底的理解,尤其是疾病或生物領域。
分子計算,是將傳統(tǒng)方法的“關鍵疾病分子信息提取”、“數據計算與分析”、“解讀報告”等進行高效整合,像一個集成電路一樣進行相關分子識別。
其優(yōu)勢就在于可以減少誤差,無需人工輔助就可以直接出報告。
因此,分子大腦DNA邏輯回路就像是做一個多功能“分子醫(yī)生”,將分子層面識別與信息聯系起來,甚至模擬人類獲得性免疫系統(tǒng)。
以下為譚蔚泓院士的演講內容,雷鋒網《醫(yī)健AI掘金志》做了不改變原意的編輯和整理:
中國科學院早在2017年,就在仁濟醫(yī)院附近建立了分子醫(yī)學研究院,目前也開始著手建設中科院醫(yī)學所。
這些研究始終以臨床為目標,尤其是以醫(yī)院為中心,讓醫(yī)院掏錢,使病人和科研相結合,變成患者福音。
目前,人類對非生命體系認知已變得越來越清晰。
有人說方法學里只有物理和數學,方法學是創(chuàng)造一切物質學科的基礎。
但同時化學方法也非常重要,從人類生命體系,到鐵礦石、鐵單晶、鐵原子等等,還有很多未解之謎。
而且,人類最沒有認知的就是人體自身,根據Science數據顯示,全世界最前沿的125個科學問題中,生命科學就占據了46%。
例如人類是怎么思維和怎樣進行記憶。
原來我曾做過一段時間“如何把記憶與某一基因聯結在一起”的研究,發(fā)現這件事需要依靠很多參數。
生物的復雜性決定了生物學大數據的必然性,籍于此,各種組學應運而生,包括基因組學、蛋白組學、細胞組學、時空組學等等。
同樣,疾病的復雜性、多樣性等使得診療必須基于海量數據和多參數表征。
我覺得這樣一個新時代已經到來,僅靠一個疾病標志物,實現疾病診斷已不太可能,必須要用到多個,所以海量數據的處理就成為了必須。
所以,疾病多參數的分子分型成為了精準醫(yī)療的核心。怎樣獲取多參數的生物計算海量數據,并從大量數據里,得到有用信息,也成為了我們要解決的問題。
關于疾病多參數、多分子分型,我給大家舉個例子。
兩年前,想要打開手機一定要輸入密碼,但今天面部識別,在全世界75億人口,只有我一個人可以打開自己的手機。
其中所涉及的參數和檢測就是實現眼睛、鼻子、耳朵相互關聯,用這些信息來檢測差異。
生物學也是同樣,需要通過多參數進行同時檢測,對數據進行有效分析,才能把疾病分成不同亞型,對癥下藥。
疾病的分子分型診斷,也需要依靠高通量測量技術,結合多個識別疾病標志物的分子探針,對病人樣本進行多到300個疾病標志物分子分子特征,進行甄別和定量測定。
再利用人工智能和大數據科學解析,從而為疾病診斷提供精準圖譜,判斷各種亞型特征,為下一代疾病精準診斷提供變革性技術。
所以接下來,人工智能將推動疾病診斷+治療的新范式。
可以訓練AI理解130萬個電子病歷中的臨床特征,自動分析患者病情,智能給出推薦診斷。
其中的第一個工作就是怎樣獲取300個參數所需的數據量。
對于技術的人而言,300個參數可能是一批小數據,但如果這些數據與人類疾病密切相關,怎樣找到模式識別就非常艱難。
這樣的數據和技術建立完成以后,就可以使各種疾病診斷變的容易。
以腫瘤診斷為例,過去的異質性問題給癌癥診斷帶來了極大的困難。而通過結合AI的精準診療,就可以對其進行甄別,發(fā)現其中不同的亞型。
特別是肺癌治療,存在的多種亞型,每一種亞型的治療方案都完全不同,而且分類靶向治療具有更好的治療效果。
那么我們應該怎樣進行疾病的分子分型?
其中最重要的就是獲取疾病多參數表征,和對獲取的多參數數據進行有效解析。
既然已經了解疾病精準診療需要分子分型,具體操作就需要獲取到這些多參數表征,開發(fā)專門的分子識別工具,發(fā)展新型數據算法,對蛋白、核酸等多組學信息進行有效分析。
目前的人工智能,雖然已經有很多開源數據分析方法,但這些算法依然還無法滿足醫(yī)療的數據歸納。
除了數據工具,還有分子識別問題,這些分子包括抗體、多肽、核酸、小分子等等。
今天以核酸適體為例,核酸適體被稱為“科學家的抗體”,由15-60個堿基組成,能識別靶標的單鏈DNA/RNA、具有高親和力,高特異性、靶標范圍廣等特點,是精準藥物治療和臨床診斷的新工具。
在實驗中,我們主要使用以活細胞為篩選靶標的核酸適體細胞篩選新方法(Cell-SELEX),這種方法可在標志物未知條件下為靶細胞的分子識別提供全新的化學途徑。
而且可實現活體細胞的多個靶分子探針的原位篩選,讓每一次篩選都得到多個分子探針。
通過這種技術,我們已經創(chuàng)造了大量的核酸適體,基本相當于人工產生了300多個能識別特異細胞靶體的“抗體”
未來疾病的診斷一定需要從多個探針對生物體進行表征,這樣一次產生100、200個探針,對細胞表面所有蛋白進行判斷。
目前這些核酸適體也已經被廣泛生物醫(yī)學研究。
以應用于白血病病人樣品的分子分型為例。
我們通過與八家醫(yī)院合作,使用18個核酸適體對大約2000個病人進行了測試,并從中找出了核酸適體識別白血病的分子圖譜識別新模式。
除了這些,我們還將核酸適體應用于外泌體的分子分型當中,由國家納米科學中心孫佳姝研究員跟我們一同操作完成。
通過熱泳技術輔助的外泌體分型,可以用于早期診斷和腫瘤分類,其中對六類癌癥(1-4期)的分類準確率達到了71%
除了核酸探針,高通量方法還有很多。
例如流式質譜,通過流式細胞儀高速分析+質譜檢測的高分辨能力,一次實驗就可以得到100多個參數。在同一次實驗中,完成多個參數獲取。
除了流式質譜,核酸探針也可以做核酸影像,把核酸探針和核素連在一起,對人體進行全身影像進行掃描。
接下來講一下分子計算。
今天,電腦徹底改變了生活模式,除此之外,還有分子大腦,人腦思維無法超越電腦計算,但電腦計算沒有考慮分子層面信息。
而事實上,分子層面才是對事物最徹底的理解,尤其是疾病或生物領域。
過去分子計算,只是把病人樣本拿過來,對一些關鍵疾病分子進行提取,之后由醫(yī)生解讀。
這種方法最大特點就是體量小,而且需要有經驗的醫(yī)生。
分子計算是將傳統(tǒng)方法里的“關鍵疾病分子信息提取”、“數據計算與分析”、“解讀報告”等進行高效整合。
像一個集成電路一樣進行相關的分子識別,其優(yōu)勢就在于可以減少誤差,無需人工輔助就可以直接出報告。
因此,分子大腦DNA邏輯回路就像一個多功能“分子醫(yī)生”,將分子層面識別與信息聯系起來,甚至可以模擬人類的獲得性免疫系統(tǒng)。
以腫瘤的早期診斷為例,高特異性的標志物miRNA智能核酸系統(tǒng),就可以實現外周血中腫瘤(肺癌)的早期診斷。
過去一個探針就是一個結果,多次檢測才能產生多個數據,如今miRNA可以將探針聯合起來,統(tǒng)一作為分子回路。
這些分子回路每一段都可以與mRNA進行識別,只要讀到相關信息,就可以做疾病診斷。
這個工作最高由上交仁濟醫(yī)院韓達研究員完成。
將來的疾病診斷,一定是對多參數的同時獲取,對大量信息進行解讀,從而形成模型識別式診療,這必將是醫(yī)療的未來。
目前,我們已在中國科學院基礎研究所建立了篩選中心,前年5月,浙江省人民政府也和中國科學院正式簽署醫(yī)學合作協(xié)議,共建中國科學院腫瘤與基礎醫(yī)學研究所。雷鋒網雷鋒網
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。