丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
醫(yī)療AI 正文
發(fā)私信給劉海濤
發(fā)送

0

英矽智能首席科學(xué)官任峰:18個(gè)月找出新藥分子的最全細(xì)節(jié)回顧丨附18個(gè)現(xiàn)場(chǎng)問(wèn)答

導(dǎo)語(yǔ):依托首個(gè)AI新藥分子,英矽智能已成為AI制藥新勢(shì)力中的佼佼者。

如果對(duì)AI制藥新勢(shì)力的技術(shù)實(shí)力進(jìn)行評(píng)比,英矽智能絕對(duì)可以稱得上其中的佼佼者。

今年2月,英矽智能用18個(gè)月、投入僅260萬(wàn)美元,就通過(guò)新藥靶點(diǎn)發(fā)現(xiàn)平臺(tái) PandaOmics 和AI分子生成和設(shè)計(jì)平臺(tái)Chemistry42平臺(tái),研發(fā)出特發(fā)性肺纖維化(IPF)疾病新靶點(diǎn)。

以及全球首例完全由AI驅(qū)動(dòng)發(fā)現(xiàn)的藥物分子,一舉成為AI制藥全球范圍內(nèi)的一個(gè)標(biāo)志性里程碑事件。

對(duì)外合作上,英矽智能也相繼拿下多個(gè)大藥企訂單,包括默克、輝瑞、勃林格殷格翰、安斯泰來(lái)、強(qiáng)生制藥子公司楊森制藥等。

近日,雷鋒網(wǎng)《醫(yī)健AI掘金志》以“AI制藥·下一個(gè)現(xiàn)象級(jí)賽道”為主題,邀請(qǐng)百圖生科、劑泰醫(yī)藥、未知君、望石智慧、英矽智能、星藥科技六家先鋒企業(yè),舉辦了一場(chǎng)線上云峰會(huì)。

作為此次活動(dòng)的演講嘉賓,英矽智能首席科學(xué)官、藥物研發(fā)負(fù)責(zé)人任峰,就以《人工智能加速新藥研發(fā)》為題,對(duì)英矽智能的AI新藥平臺(tái)做了介紹。

英矽智能首席科學(xué)官任峰:18個(gè)月找出新藥分子的最全細(xì)節(jié)回顧丨附18個(gè)現(xiàn)場(chǎng)問(wèn)答

任峰表示,大家看到我們貌似很容易,就利用AI在短時(shí)間找出新靶點(diǎn)和藥物分子,但18個(gè)月研發(fā)背后是我們用7年時(shí)間對(duì)底層技術(shù)的默默研發(fā)。

在找出肺纖維化(IPF)藥物分子之前,英矽智能就根據(jù)新藥研發(fā)周期特點(diǎn),用大量精力研發(fā)了三款人工智能軟件“ PandaOmics、Chemistry42和InClinico?!?/p>

這三個(gè)軟件,針對(duì)藥物研發(fā)靶點(diǎn)發(fā)現(xiàn)、藥物分子篩選和臨床試驗(yàn)三個(gè)重要周期,可以分別提供:根據(jù)組學(xué)數(shù)據(jù)自動(dòng)尋找新靶點(diǎn);利用生成式對(duì)抗神經(jīng)網(wǎng)絡(luò)生成新的分子化合物;為新靶點(diǎn)和新化合物提供臨床結(jié)果預(yù)測(cè),三個(gè)重要輔助功能。

這次英矽智能拿出的肺纖維化(IPF)藥物分子成果,也正是在三個(gè)系統(tǒng)的前后配合之下,才得以快速完成。

以下是演講全部?jī)?nèi)容,《醫(yī)健AI掘金志》做了不改變?cè)獾恼砗途庉嫞?/strong>

首先感謝線上朋友和各位同仁,一起來(lái)討論人工智能對(duì)新藥研發(fā)的作用,以及AI新藥研發(fā)的未來(lái)前景。

我叫任峰,是Insilico Medicine(英矽智能)首席科學(xué)官,于今年2月份加入英矽智能,主要負(fù)責(zé)公司內(nèi)部產(chǎn)品管線以及對(duì)外合作。

加入英矽智能之前,我在上海美迪西任高級(jí)副總裁,負(fù)責(zé)生物和化學(xué)部?jī)蓚€(gè)部門業(yè)務(wù)。

今天我想給大家分享的內(nèi)容是,用人工智能加速新藥研發(fā),也就是AI-accelerated Drug Discovery。

英矽智能首席科學(xué)官任峰:18個(gè)月找出新藥分子的最全細(xì)節(jié)回顧丨附18個(gè)現(xiàn)場(chǎng)問(wèn)答

眾所周知,新藥研發(fā)具有費(fèi)用高、成功率低、耗時(shí)長(zhǎng)的特點(diǎn),也即是一高一低一長(zhǎng)。

一個(gè)新藥平均下來(lái),從開(kāi)始研發(fā)到上市,大概需要10~15年時(shí)間,花費(fèi)超過(guò)20億美金;成功率也非常低,從臨床一期到臨床三期大概10%左右。

這是所有新藥研發(fā)企業(yè)共同面臨的困境,突破困境就需要人工智能等其他輔助手段幫忙。

英矽智能首席科學(xué)官任峰:18個(gè)月找出新藥分子的最全細(xì)節(jié)回顧丨附18個(gè)現(xiàn)場(chǎng)問(wèn)答 

新藥研發(fā)主要是分成三個(gè)部分:

第一靶點(diǎn)發(fā)現(xiàn),包括疾病假設(shè)以及靶點(diǎn)發(fā)現(xiàn)和驗(yàn)證,以生物學(xué)和IRS為主;

第二臨床候選化合物確定以及臨床前研究,以化學(xué)為主;

第三是臨床研究。

傳統(tǒng)藥企里面,這三個(gè)部分都是由不同部門完成,或者由不同企業(yè)完成。

英矽智能首席科學(xué)官任峰:18個(gè)月找出新藥分子的最全細(xì)節(jié)回顧丨附18個(gè)現(xiàn)場(chǎng)問(wèn)答

英矽智能要做的就是通過(guò)人工智能技術(shù),把三個(gè)方面結(jié)合起來(lái)。

首先靶點(diǎn)發(fā)現(xiàn)方面,我們希望通過(guò)組學(xué)數(shù)據(jù)幫助找新靶點(diǎn),在這里面,通過(guò)找到病人和健康人組學(xué)數(shù)據(jù)之間區(qū)別,找到新靶點(diǎn)。

同時(shí),我們還會(huì)利用Text-based(文獻(xiàn)和專利)、Financial scores(包括政府支持的科研經(jīng)費(fèi)),以及Key Opinion Leaders等數(shù)據(jù),對(duì)靶點(diǎn)進(jìn)行評(píng)估,包括新穎性、成藥性和安全性。通過(guò)這種方式找到想做的靶點(diǎn),以及新靶點(diǎn)。

找到靶點(diǎn)之后,通過(guò)小分子化合物生成系統(tǒng)來(lái)產(chǎn)生新化合物,然后可以把化合物推進(jìn)至臨床研究。

這部分也有人工智能系統(tǒng)來(lái)幫助預(yù)測(cè)臨床實(shí)驗(yàn)成功和失敗,最主要還是優(yōu)化臨床實(shí)驗(yàn)方案。

英矽智能首席科學(xué)官任峰:18個(gè)月找出新藥分子的最全細(xì)節(jié)回顧丨附18個(gè)現(xiàn)場(chǎng)問(wèn)答 

Insilico Medicine也就是通過(guò)人工智能把靶點(diǎn)發(fā)現(xiàn),化后生成,臨床實(shí)驗(yàn)三個(gè)方面結(jié)合起來(lái)。

首先,先用一個(gè)案例跟大家分享如何把這三方面結(jié)合。

英矽智能首席科學(xué)官任峰:18個(gè)月找出新藥分子的最全細(xì)節(jié)回顧丨附18個(gè)現(xiàn)場(chǎng)問(wèn)答

這是我們的特發(fā)性肺纖維化項(xiàng)目,是今年2月份對(duì)外做了里程碑式進(jìn)展發(fā)布。這個(gè)項(xiàng)目成功實(shí)現(xiàn)利用AI完成從早期靶點(diǎn)發(fā)現(xiàn),到臨床候選化合物發(fā)現(xiàn)工作。

特發(fā)性肺纖維化長(zhǎng)期被定義為一個(gè)罕見(jiàn)病,也即是rare disease,雖然是罕見(jiàn)病,但全球病人有71萬(wàn)多人,是非常龐大的病人數(shù)量,僅亞洲就有30多萬(wàn)。

這種疾病如果得不到很好的治療,確診后平均壽命也就4年左右,非常致命。

針對(duì)該病的治療,目前市場(chǎng)上批準(zhǔn)藥有兩款:吡非尼酮和尼達(dá)尼布,這兩款藥在2019年總銷售額在30億美金左右,是一個(gè)非常龐大的市場(chǎng)。

但兩款藥有一個(gè)共同問(wèn)題,就是安全窗口非常小,用藥過(guò)程經(jīng)常伴隨嚴(yán)重副作用。

基于這種情況,大概10%~40%病人由于無(wú)法耐受這種副作用,以至于半途停藥,或者病人耐受劑量范圍之內(nèi)沒(méi)有藥效,所以這是一個(gè)未滿足的臨床需求。

所以 在這種情況下,我們希望通過(guò)前期靶點(diǎn)發(fā)現(xiàn)人工智能和化合物生成平臺(tái),來(lái)找到全新機(jī)制治療特發(fā)性肺纖維化藥物。

靶點(diǎn)發(fā)現(xiàn)主要是通過(guò)組學(xué)數(shù)據(jù),利用纖維化病人組學(xué)數(shù)據(jù)和健康人組學(xué)數(shù)據(jù)進(jìn)行對(duì)比,找到兩者之間顯著差異,同時(shí)用iPANDA技術(shù),在信號(hào)通路上找到能夠影響這些信號(hào)通路的組學(xué)數(shù)據(jù),進(jìn)而找到新靶點(diǎn)。

整個(gè)過(guò)程我們共發(fā)現(xiàn)了20多個(gè)靶點(diǎn),隨后對(duì)其進(jìn)行優(yōu)先級(jí)排序,如果靶點(diǎn)是一種激酶或者GPCR,那么它的成藥性就會(huì)比蛋白-蛋白之間相互作用好很多;

在優(yōu)先級(jí)排序中,主要從靶點(diǎn)安全性和未來(lái)價(jià)值進(jìn)行篩選,一方需要看有沒(méi)有靶點(diǎn)敲除數(shù)據(jù),被敲除之后,會(huì)不會(huì)導(dǎo)致非常嚴(yán)重的毒副作用,另一方面,還需要看靶點(diǎn)晶體結(jié)構(gòu)是不是已經(jīng)報(bào)道出來(lái)。

通過(guò)這一系列流程之后,我們找到了治療特發(fā)性肺纖維化表現(xiàn)效果最好的一個(gè)全新靶點(diǎn)。

英矽智能首席科學(xué)官任峰:18個(gè)月找出新藥分子的最全細(xì)節(jié)回顧丨附18個(gè)現(xiàn)場(chǎng)問(wèn)答

找到靶點(diǎn)之后,我們又利用Chemistry42平臺(tái)(另一款人工智能軟件,主要作用是小分子化后生成)來(lái)生成和篩選小分子化合物。

通過(guò)這個(gè)平臺(tái)大概合成了80種化合物,其中13個(gè)化合物活性小于10nM,絕大多數(shù)(35個(gè))活性在10~10nM,有15個(gè)活性在100~1000nM,還有十多個(gè)化合物沒(méi)有活性。

最終,我們選擇出055化合物,它的活性雖并不是最高,但總體最好,我們?cè)谄渲兄饕P(guān)注成藥性和活性。

隨后,我們就把055化合物用到小鼠肺纖維化模型上,進(jìn)行實(shí)驗(yàn)驗(yàn)證,結(jié)果效果是不錯(cuò)的,可以在低劑量下達(dá)到同樣的治療效果。

我們又進(jìn)一步用肺纖維化病人細(xì)胞來(lái)進(jìn)行兩個(gè)實(shí)驗(yàn),首先是肺纖維化病人細(xì)胞體外實(shí)驗(yàn),從纖維化細(xì)胞到肌纖維化細(xì)胞之間轉(zhuǎn)化,看到化合物比尼達(dá)尼布活性高5倍左右。

另外是EMT實(shí)驗(yàn),從上皮細(xì)胞到間質(zhì)細(xì)胞轉(zhuǎn)換,活性同樣比尼達(dá)尼布高十幾倍左右。

FMT和EMT這兩個(gè)過(guò)程是特發(fā)性肺纖維化發(fā)病比較明顯的病理特征,最終證明在肺纖維化病人外細(xì)胞上,055比尼達(dá)尼具有更強(qiáng)活性,這跟前面的動(dòng)物實(shí)驗(yàn)結(jié)果互為印證。

14天DRF實(shí)驗(yàn)結(jié)果也表明,安全窗口大概是尼達(dá)尼的60倍左右,現(xiàn)在這個(gè)化合物還在做臨床研究,估計(jì)今年年底或明年初能就能進(jìn)入臨床實(shí)驗(yàn)。

總結(jié)一下,這個(gè)項(xiàng)目總共花了18個(gè)月時(shí)間,費(fèi)用是270萬(wàn)美金,傳統(tǒng)靶點(diǎn)藥物研發(fā)一般需要4年半時(shí)間,我們只用了一年半,費(fèi)用也大大降低。

這個(gè)案例證明人工智能可以在新藥研發(fā),尤其是原創(chuàng)性新藥研發(fā)工作中可以大大縮短研發(fā)時(shí)間、降低研發(fā)成本,提高研發(fā)效率。

英矽智能首席科學(xué)官任峰:18個(gè)月找出新藥分子的最全細(xì)節(jié)回顧丨附18個(gè)現(xiàn)場(chǎng)問(wèn)答

我再介紹一下Insilico Medicine,我們現(xiàn)在全球有130多位員工,80多位人工智能科學(xué)家;主要強(qiáng)項(xiàng)在靶點(diǎn)發(fā)現(xiàn)以及小分子化合物生成;

目前為止,在全球雜志或?qū)@习l(fā)表100多篇文章或?qū)@?/p>

英矽智能首席科學(xué)官任峰:18個(gè)月找出新藥分子的最全細(xì)節(jié)回顧丨附18個(gè)現(xiàn)場(chǎng)問(wèn)答

像剛才的介紹,大家看到好像很容易就找出新靶點(diǎn)和藥物分子,但這背后我們歷時(shí)7年,在藥物研發(fā)三個(gè)方面,分別開(kāi)發(fā)了三個(gè)人工智能軟件:

第一、PandaOmics,利用組學(xué)數(shù)據(jù)幫助尋找新靶點(diǎn);

第二、Chemistry42,利用生成式對(duì)抗神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行深度學(xué)習(xí),幫助生成新小分子化合物;

第三、InClinico,進(jìn)行臨床實(shí)驗(yàn)結(jié)果預(yù)測(cè),同時(shí)幫助更好設(shè)計(jì)臨床實(shí)驗(yàn)方案。

首先介紹第一個(gè)方案PandaOmics,它的主要流程,首先是在里面選擇感興趣的數(shù)據(jù)庫(kù),包括TCGA、GEO、ArrayExpress等等。

之后在數(shù)據(jù)里做一些Correlations,也就是找到關(guān)聯(lián),發(fā)現(xiàn)數(shù)據(jù)之間區(qū)別,它們的差異表達(dá)以及功能分析,以此來(lái)發(fā)現(xiàn)新靶標(biāo)蛋白,找到新靶點(diǎn)。

第二個(gè)方案Chemistry42,這個(gè)軟件主要幫助生成小分子化合物。主要包括兩個(gè)模型,一個(gè)是 Structure-based(基于結(jié)構(gòu)),另外一個(gè)是ligand-basis(基于配體)。

把想要設(shè)計(jì)化合物的蛋白(例如晶體結(jié)構(gòu)或者小分子結(jié)構(gòu)等)輸?shù)紺hemistry42系統(tǒng)里,大概需要2~3天時(shí)間,就可以產(chǎn)生針對(duì)這些蛋白的小分子化合物,數(shù)量大概是幾百個(gè)到幾千個(gè)之間,然后通過(guò)virtual screening排序,挑選效果好的進(jìn)行合成。

所以,Chemistry42系統(tǒng)最大特點(diǎn)就是能針對(duì)所給出的靶點(diǎn),從無(wú)到有產(chǎn)生小分子化合物庫(kù),而且命中率非常高。

基于這些AI制藥工具,我們不僅自己內(nèi)部開(kāi)發(fā)管線,同時(shí)也將AI作為工具和藥企或科研院校合作,幫助他們進(jìn)行新藥研發(fā),例如Pfizer、Janssen、Merck等,大體可分為六點(diǎn):

第一,幫助尋找新靶點(diǎn),主要使用PandaOmics的能力。

第二,用PandaOmics幫助做再利用,例如根據(jù)已知靶點(diǎn),找到最好的indication;

第三,用Chemistry42做Fast follow(快速跟隨),也就是破專利項(xiàng)目,這其實(shí)非常容易;

第四,用Chemistry42幫助產(chǎn)生和選擇化合物,例如激酶選擇性,或者針對(duì)特殊突變,來(lái)對(duì)抗resistance靶點(diǎn),這有可能成為best-in-class(同類最優(yōu))或first-in-class(同類第一)的項(xiàng)目;

第五,Chemistry42還可以針對(duì)全新靶點(diǎn),從無(wú)到有生成hits(具有活性的藥品分子),同時(shí)也可以針對(duì)undruggable(無(wú)成藥性)或challenging target的目標(biāo),來(lái)生成hits;

第六,通過(guò)人工智能系統(tǒng)幫助更好設(shè)計(jì)PROTAC分子;

演講最后我分享一下人工智能對(duì) Farce Follow Program的影響。

英矽智能首席科學(xué)官任峰:18個(gè)月找出新藥分子的最全細(xì)節(jié)回顧丨附18個(gè)現(xiàn)場(chǎng)問(wèn)答

這是2018年到2019年我們做的一個(gè)項(xiàng)目,靶點(diǎn)是DDR1的kinase(激酶)靶點(diǎn),是一個(gè)全新結(jié)構(gòu)骨架化合物。

拿到這個(gè)任務(wù)之后,我們首先建數(shù)據(jù)庫(kù),用了7天時(shí)間找到跟靶點(diǎn)相關(guān)或無(wú)關(guān)的kinase數(shù)據(jù)庫(kù)。

然后針對(duì)這些數(shù)據(jù)庫(kù),用12天時(shí)間進(jìn)行深度學(xué)習(xí),對(duì)模型建模和深度學(xué)習(xí),產(chǎn)生3萬(wàn)個(gè)左右化合物。

又用兩天時(shí)間對(duì)這些化合物進(jìn)行排序,最后縮小40個(gè)化合物范圍,然后從里面選擇6個(gè)化合物進(jìn)行合成,其中有兩個(gè)活性在10-100nM之間,兩個(gè)活性在100-1000nM之間,另外兩個(gè)沒(méi)有活性。

最終選出了最好化合物1,這是一個(gè)全新骨架,我們把它拿去做DMPK,最終證明其具有很好的PK性質(zhì)。

英矽智能首席科學(xué)官任峰:18個(gè)月找出新藥分子的最全細(xì)節(jié)回顧丨附18個(gè)現(xiàn)場(chǎng)問(wèn)答

從拿到靶點(diǎn),到找到最合適化合物,完成合成測(cè)試,我們這個(gè)試驗(yàn)性項(xiàng)目總共用了46天時(shí)間,結(jié)果發(fā)表在2019年Nature Biotechnology上,進(jìn)一步證明人工智能可以大大縮減研發(fā)周期。

而且,我們也一致認(rèn)為人工智能需要跟整個(gè)藥物研發(fā)團(tuán)隊(duì)結(jié)合起來(lái)才能更有效找到化合物。

在線問(wèn)答

Q1:靶點(diǎn)發(fā)現(xiàn)的AI貢獻(xiàn)是什么?

任峰:在靶點(diǎn)發(fā)現(xiàn)階段,AI主要貢獻(xiàn)首先是縮短研究時(shí)間,用組學(xué)數(shù)據(jù)比較正常人和病人之間差異,幫助找到新靶點(diǎn),同時(shí)分析這些差異組學(xué)在不同信號(hào)通路的影響,相較于傳統(tǒng)方式這大大縮短了時(shí)間。

另外我們?cè)谒幒Y選中還引入了時(shí)間機(jī)器學(xué)習(xí)模型。

這個(gè)模型建好之后,可以用2010年之前組學(xué)數(shù)據(jù)發(fā)現(xiàn)或?qū)ふ裔槍?duì)某些疾病領(lǐng)域的靶點(diǎn),因?yàn)檫@些靶點(diǎn)在十年間就已經(jīng)被臨床驗(yàn)證,系統(tǒng)可以尋找到靶點(diǎn)通過(guò)與現(xiàn)實(shí)結(jié)果比對(duì),來(lái)驗(yàn)證系統(tǒng)結(jié)果真實(shí)可靠性,并把這些驗(yàn)證結(jié)果再反饋給Panda Omics系統(tǒng),進(jìn)行下一輪機(jī)械學(xué)習(xí)。

經(jīng)過(guò)幾輪學(xué)習(xí)過(guò)程之后,就可以讓它用2010年到2020年之間預(yù)測(cè)靶點(diǎn)驗(yàn)證算法,增加系統(tǒng)靶點(diǎn)預(yù)測(cè)準(zhǔn)確率。

Q2:你們與傳統(tǒng)利用生物信息學(xué)分析多組學(xué)數(shù)據(jù)+文獻(xiàn)挖掘相比特別之處在哪里?

任峰:特別之處就是用了一個(gè)時(shí)間機(jī)器學(xué)習(xí)模型,有training過(guò)程,傳統(tǒng)方式?jīng)]有training過(guò)程,這可能是它們之間最大區(qū)別。

Q3:找出靶點(diǎn)是針對(duì)IPF的新靶點(diǎn),還是完全沒(méi)人做過(guò)靶點(diǎn)(針對(duì)所有適應(yīng)癥)?

任峰:我們找到的靶點(diǎn)是針對(duì)IPF的新靶點(diǎn),是包括臨床和臨床前都沒(méi)有人做過(guò)的。

這個(gè)靶點(diǎn),我們不能說(shuō)沒(méi)有任何人做,做的人非常少,全球目前只有一家小公司在做這樣一個(gè)靶點(diǎn),他們針對(duì)的是另外一種適應(yīng)癥,現(xiàn)在還沒(méi)有應(yīng)用在臨床。

Q4:請(qǐng)教AI公司和CDMO公司是如何合作的?

任峰:目前很多算法或重點(diǎn)都不是和CDMO公司合作,主要還是集中于前期Drug Discover階段,對(duì)Development沒(méi)有特別涉及。

可能有的AI公司設(shè)計(jì)化合物合成路線,或者針對(duì)工廠自動(dòng)化可以跟CDMO公司進(jìn)行深入合作。

Q5:請(qǐng)問(wèn)有比較好加速binding affinity預(yù)測(cè)的方法嗎?

任峰:Chemistry42系統(tǒng),并不能告訴哪些化合物binding affinity比另一些化合物要好,只能幫助產(chǎn)生一些小分子化合物可能binding在蛋白上。

我們也是用像薛定諤binding affinity預(yù)測(cè)或者優(yōu)先級(jí)排序方式,目前據(jù)我所知,用薛定諤預(yù)測(cè)binding affinity應(yīng)該已經(jīng)是比較好的。

Q6:AI用于藥物研發(fā)的商業(yè)化前景如何呢?例如幾年前很多企業(yè)做肺小結(jié)節(jié)的AI診斷,競(jìng)爭(zhēng)堪稱紅海,而醫(yī)院付費(fèi)意愿不強(qiáng)烈。對(duì)比當(dāng)下,現(xiàn)在做AI制藥的公司也非常多,是否會(huì)出現(xiàn)類似的結(jié)果:很多AI公司希望與大藥企合作/license-out,大藥企付費(fèi)意愿并不強(qiáng)烈?

任峰:用AI來(lái)做藥物研發(fā)商業(yè)化前景非常廣闊,而且大藥企是愿意付錢的,原因基于以下兩點(diǎn):

第一、大藥企面臨共同問(wèn)題,研發(fā)效率低、研發(fā)成本高、研發(fā)周期長(zhǎng)、失敗率高這樣的問(wèn)題,藥企希望能有顛覆性技術(shù)來(lái)改變現(xiàn)狀;

第二、人工智能目前經(jīng)過(guò)一些實(shí)例,已經(jīng)證明確實(shí)對(duì)解決新藥研發(fā)的問(wèn)題,可以提供顛覆性解決方案能力。

所以基于這兩點(diǎn)來(lái)說(shuō),大藥企是愿意付錢的。而且最近就有一篇報(bào)道,有藥企與AI公司簽訂開(kāi)發(fā)藥物協(xié)議,總金額達(dá)12億美金左右,同時(shí)首付金額也非常高,達(dá)到幾千萬(wàn)美金,這也證明大藥企愿意把這些錢投入到AI輔助藥物研發(fā)上。

Q7:AI制藥公司的數(shù)據(jù)從哪里得來(lái)呢?

任峰:目前的AI公司大多是小公司,這些公司絕大多數(shù)都是基于公開(kāi)數(shù)據(jù)。

接下里,AI公司的競(jìng)爭(zhēng)則就靠從這個(gè)published數(shù)據(jù)發(fā)展而來(lái)的私有數(shù)據(jù),所以現(xiàn)在有實(shí)力的AI公司都在建立自己的數(shù)據(jù)采集系統(tǒng)。

Q8:AI藥物研發(fā)公司建立了自研管線,和潛在合作藥企可能存在利益沖突,這塊是否有什么考慮?

任峰:每一家AI公司都是兩條腿走路,一個(gè)是有自研管線,另一方面是跟一些藥企合作,共同開(kāi)發(fā)一些項(xiàng)目。

因?yàn)樽匝泄芫€是通過(guò)自己的項(xiàng)目來(lái)驗(yàn)證或優(yōu)化人工智能平臺(tái),所以并沒(méi)有利益沖突。而其這些合作很多都是具有排他性的,自研管線和其他藥企合作是有排它性,不同藥企之間合作也有排它性。

Q9:AI新藥挖掘從苗頭到PCC的各個(gè)點(diǎn)的化合物數(shù)據(jù)庫(kù)是哪里來(lái)的?

任峰:這需要分成兩個(gè)情況:

第一,如果是針對(duì) Fast follow(快跟),那么數(shù)據(jù)采集都是從文獻(xiàn)和專利上扒下來(lái)進(jìn)行深度學(xué)習(xí),對(duì)系統(tǒng)進(jìn)行培訓(xùn)得來(lái);

第二,如果是全新靶點(diǎn),就像我們的IPF,就不需要已知數(shù)據(jù),針對(duì)靶點(diǎn)的數(shù)據(jù),人工智能系統(tǒng)可以通過(guò)其他項(xiàng)目的蛋白和小分子結(jié)合案例培訓(xùn),然后它就可以自己設(shè)計(jì)某個(gè)蛋白,不需要針對(duì)靶點(diǎn)進(jìn)行培訓(xùn)。

Q10:分子生成庫(kù)是否基于已有活性化合物結(jié)構(gòu),有哪些規(guī)則?

任峰:我們的Chemistry42分子生成庫(kù)不是針對(duì)某一個(gè)或某一類靶點(diǎn),而是針對(duì)所有的。

根據(jù)人工智能系統(tǒng),利用已知小分子和蛋白結(jié)合結(jié)合形狀和樣式進(jìn)行培訓(xùn),讓小分子(或片段)能識(shí)別蛋白里一些結(jié)合口袋。

把這些片段識(shí)別出來(lái)之后,再通過(guò)算法,把這些片段慢慢結(jié)合成真正的小分子化合物,這是它的主要邏輯。

Q11:想請(qǐng)問(wèn)AI企業(yè)與研發(fā)組織合作,對(duì)研發(fā)組織自身的數(shù)據(jù)有沒(méi)有什么要求?例如數(shù)據(jù)格式、數(shù)據(jù)類型、數(shù)據(jù)質(zhì)量。

任峰:這個(gè)是有要求的,AI企業(yè)跟研發(fā)組織合作,如果他們想根據(jù)自己數(shù)據(jù)用AI企業(yè)人工智能系統(tǒng),尋找靶點(diǎn)或發(fā)現(xiàn)化合物,就需要按照我們要求的格式錄入到系統(tǒng)當(dāng)中去。

而且,我們對(duì)數(shù)據(jù)組的質(zhì)量要求也非常高,因?yàn)楦哔|(zhì)量數(shù)據(jù)才能產(chǎn)生高質(zhì)量結(jié)果。

數(shù)據(jù)類型可能每個(gè)公司系統(tǒng)都不太一樣,例如我們的PandaOmics,就需要有組學(xué)數(shù)據(jù),尤其是人組學(xué)數(shù)據(jù),這樣才更適合找新靶點(diǎn)。

Q12:據(jù)我了解,數(shù)據(jù)庫(kù)來(lái)自文獻(xiàn),那數(shù)據(jù)可靠度怎么解決的,而且不同方法測(cè)得數(shù)值不一樣?

任峰:這是非常好的問(wèn)題,也是可能所有人工智能公司所面臨的問(wèn)題。

每個(gè)公司策略可能不同,例如我們的PandaOmics主要是用組學(xué)數(shù)據(jù),而且組學(xué)數(shù)據(jù)是細(xì)分的,最好是在同一個(gè)實(shí)驗(yàn)室里產(chǎn)生的祖學(xué)數(shù)據(jù)。

我們不會(huì)把所有組學(xué)數(shù)據(jù)累計(jì)在一起找新靶點(diǎn),這樣就可以避免實(shí)驗(yàn)方法不一致造成的困惑。

另外對(duì)于化合物,我們Chemistry42生成的小分子,它主要是基于晶體結(jié)構(gòu),所以晶體結(jié)構(gòu)數(shù)據(jù)基本上都是比較可靠的,此外我們也會(huì)挑比較好的晶體結(jié)構(gòu)來(lái)給系統(tǒng)進(jìn)行training。

Q13:國(guó)內(nèi)外藥企的情況也不一樣,國(guó)內(nèi)做fast-follow、me-too、me-better的可能比較多,可以介紹Insilico在中國(guó)的商業(yè)化情況嗎?

任峰:Insilico今年才開(kāi)始在中國(guó)商業(yè)化,以前在中國(guó)沒(méi)有團(tuán)隊(duì),知名度也比較低。

我們從今年開(kāi)始在中國(guó)做一些商業(yè)化合作,國(guó)內(nèi)確實(shí)做 fast-follow、me-too比較多,我們的Chemistry42,針對(duì)fast-follow也有非常好的經(jīng)驗(yàn),它可以小分子化合物選項(xiàng)里,選擇跟已知某一個(gè)小分子化合物結(jié)構(gòu)similarity,如果similarity做達(dá)到80-90%,

它產(chǎn)生的小分子化合物就跟設(shè)定的小分子化合物結(jié)構(gòu)非常類似,同時(shí)它有自己的專利空間。所以我們的Chemistry42對(duì)于fast-follow是非常高效的,目前也有幾個(gè)例子可以證明。

Q14:我想問(wèn)下如果設(shè)計(jì)的分子是真正全新的母核、側(cè)鏈,是否會(huì)因?yàn)榕c數(shù)據(jù)庫(kù)所有分子指紋匹配度不高導(dǎo)致預(yù)測(cè)準(zhǔn)確性會(huì)下降?

任峰:這是正常的。我們的Chemistry42里面可以選擇跟已知母核similarity很高的結(jié)果,例如80-90%;同時(shí)也可以選擇similarity非常低,例如30-40%。這樣涉及到的分子結(jié)構(gòu)是完全不一樣。

從理論上來(lái)講,越相似分子活性可能性越大,而且保持好性質(zhì)的可能性就越大,反之,活性就會(huì)低一些,而且有可能完全改變其他性質(zhì),

但這些分子會(huì)因?yàn)槭侨陆M合,跟已知化合物相似度非常小,那么它的專利空間就非常大,所以就需要做一個(gè)平衡。

Q15:大分子藥物方面有什么AI的策略或者案例嗎?

任峰:我們Insilicon Medicine目前不涉及大分子,但我們認(rèn)為人工智能系統(tǒng)在大分子領(lǐng)域?qū)⒂蟹浅:玫膽?yīng)用前景。

由于我們團(tuán)隊(duì)沒(méi)有大分子方面人才,所以目前不知道大分子設(shè)計(jì)的痛點(diǎn),我們也沒(méi)有大分子業(yè)務(wù)。

Q16:如果靶點(diǎn)蛋白沒(méi)有復(fù)合物怎么辦,如何預(yù)測(cè)呢?用同源蛋白建模是好的解決方法嗎?

任峰:是的,如果靶點(diǎn)蛋白沒(méi)有復(fù)合物,我們的方式就是去找同源性比較高的蛋白,來(lái)代替靶向蛋白,放到Chemistry42里面,這樣也可以產(chǎn)生相應(yīng)小分子化合物。

Q17:臨床數(shù)據(jù)來(lái)源于醫(yī)院?jiǎn)幔?/strong>

任峰:是的,臨床數(shù)據(jù)最初肯定來(lái)源醫(yī)院,但也有一些公開(kāi)臨床數(shù)據(jù),經(jīng)過(guò)我們整理之后放到系統(tǒng)里;

同時(shí)我們以前也跟一些其他國(guó)家,例如和英國(guó)政府合作做臨床數(shù)據(jù)分析,所以也有一些自有數(shù)據(jù)。

Q18:三個(gè)平臺(tái)對(duì)外開(kāi)放嗎?如何收費(fèi)?

任峰:我們只有PandaOmics對(duì)外開(kāi)放,它是通過(guò)組學(xué)數(shù)據(jù)幫助找新靶點(diǎn),我們已經(jīng)將其部署在云端。

其他兩個(gè)還沒(méi)有完成這樣部署,所以暫時(shí)還不能開(kāi)放,我們今年有可能會(huì)把Chemistry42也部署到云端。

目前PandaOmics是收取一定的授權(quán)費(fèi)。

再次感謝今天來(lái)參加線上會(huì)議,然后非常高興有這么多志同道合的朋友對(duì)AI感興趣,AI以后會(huì)有可能發(fā)展成一種顛覆性技術(shù)來(lái)幫助新藥研發(fā)。我們也堅(jiān)持相信AI只有跟新藥研發(fā)團(tuán)隊(duì)結(jié)合在一起,才能實(shí)現(xiàn)最大價(jià)值。雷鋒網(wǎng)雷鋒網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章

編輯

專注AI醫(yī)療的新勢(shì)力和投融資丨微信ID:Daniel-six
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄