0
本文作者: 劉海濤 | 2021-08-31 15:29 |
近日,權(quán)威機(jī)構(gòu)IDC發(fā)布報(bào)告《IDC PeerScape: 中國(guó)新藥研發(fā)中新興信息化技術(shù)應(yīng)用實(shí)踐與案例》。
其中,華為云聯(lián)合高校進(jìn)行的計(jì)算機(jī)輔助藥研案例,被該報(bào)告列為新藥研發(fā)機(jī)構(gòu)與專(zhuān)業(yè)的生物計(jì)算技術(shù)企業(yè)合作開(kāi)展新藥研發(fā)的最佳實(shí)踐之一,成為了所有新藥研發(fā)項(xiàng)目的參考范本。
至此,華為云的AI藥物研發(fā)布局也逐漸展露雄心。
更早之前,其還就得到中科院上海藥物研究所的青睞,將AI能力和計(jì)算藥物、藥物研發(fā)進(jìn)行結(jié)合,推出了基于 ModelArts平臺(tái)的藥物聯(lián)邦學(xué)習(xí)服務(wù)。
此外,在2020年4月,華為云還發(fā)布了迄今為止全球最大的免費(fèi)公開(kāi)新冠藥物虛擬篩選數(shù)據(jù)庫(kù)——“神農(nóng)項(xiàng)目”。
云+AI技術(shù)出身的華為云業(yè)務(wù),為何頻頻在傳統(tǒng)的生物醫(yī)藥行業(yè)出招,在市場(chǎng)規(guī)模遠(yuǎn)超消費(fèi)行業(yè)的制藥產(chǎn)業(yè),其又在籌劃著多大的戰(zhàn)略意圖。
近日,雷鋒網(wǎng)《醫(yī)健AI掘金志》以“AI制藥·下一個(gè)現(xiàn)象級(jí)賽道”為主題,邀請(qǐng)燧坤智能、英飛智藥、宇道生物、西湖歐米、華為云,五家先鋒企業(yè),舉辦了一場(chǎng)線上論壇分享。
作為此次論壇的嘉賓,華為云醫(yī)療智能體產(chǎn)品總監(jiān)孟鑫,以《華為云人工智能在生命科學(xué)領(lǐng)域的探索和實(shí)踐》為題,進(jìn)行了演講。
孟鑫表示:藥物研發(fā)非常復(fù)雜,包含很多環(huán)節(jié),從最開(kāi)始藥物發(fā)現(xiàn)到臨床前,到后續(xù)藥物流通,包含著很多復(fù)雜環(huán)節(jié)。
以AI新藥研發(fā)為例,不只要關(guān)注藥物分子設(shè)計(jì)和篩選,背后需要藥物研究、基因臨床和醫(yī)學(xué)影像等等的支撐。
其中,華為云只聚焦在幾個(gè)點(diǎn):藥物設(shè)計(jì)、藥物大規(guī)模虛擬篩選、藥物協(xié)同性、藥物重定向維度,集合云計(jì)算的能力,在云上做智能分析和結(jié)構(gòu)預(yù)測(cè),能讓這些準(zhǔn)確度提升一個(gè)新水平。
目前,華為云和國(guó)內(nèi)單細(xì)胞測(cè)序平臺(tái)合作,提供數(shù)據(jù)算法和算力,協(xié)作做單細(xì)胞測(cè)序數(shù)據(jù)云上開(kāi)發(fā)和邊緣計(jì)算。在原來(lái)模型基礎(chǔ)上,做了大量空間搜索和運(yùn)算,大概能提高2~3倍分析速度。以前需要使用100個(gè)算力,現(xiàn)在只需要20個(gè)算力就可以實(shí)現(xiàn)單個(gè)樣本分析,對(duì)10萬(wàn)個(gè)、100萬(wàn)個(gè)樣本同樣也能夠提升效率。
以下是演講全部?jī)?nèi)容,《醫(yī)健AI掘金志》做了不改變?cè)獾恼砗途庉嫞?/strong>
大家好,我是華為云醫(yī)療智能體產(chǎn)品總監(jiān)孟鑫。今天給大家分享華為云人工智能在生命科學(xué)領(lǐng)域的探索和實(shí)踐。
演講主要從三個(gè)方面來(lái)進(jìn)行:
第一個(gè)方面,華為云在人工智能方面的技術(shù)研究。
第二個(gè)方面,華為云在人工智能的發(fā)展趨勢(shì)。
第三個(gè)方面,華為云在生命科學(xué)領(lǐng)域的一些探索和實(shí)踐。
華為云長(zhǎng)期扎根于AI基礎(chǔ)研究,覆蓋計(jì)算機(jī)視覺(jué)、語(yǔ)音語(yǔ)義和決策優(yōu)化三大AI方向。
在華為云的未來(lái)規(guī)劃中,AI的發(fā)展主要聚焦在模型高效、數(shù)據(jù)高效、知識(shí)高效、算力高效思維的重點(diǎn)。
此外,針對(duì)產(chǎn)業(yè)中的一些核心問(wèn)題,我們又提出6大基礎(chǔ)研究計(jì)劃。
1. 面向大模型的模型摸高的計(jì)劃;2. 面向小模型的模型瘦身的計(jì)劃;3. 面向多模態(tài)學(xué)習(xí)的數(shù)據(jù)魔方計(jì)劃;4. 面向小樣本學(xué)習(xí)的數(shù)據(jù)冰山計(jì)劃;5. 面向通用知識(shí)抽取的萬(wàn)物預(yù)示計(jì)劃;6. 面向新學(xué)習(xí)范式的敘事合一計(jì)劃。
這些計(jì)劃產(chǎn)生許多研究成果,包括自動(dòng)化學(xué)習(xí)與訓(xùn)練模型等,而將來(lái)這些成果也會(huì)采用即插即用的方式部署在華為云。
首先介紹一下這張圖片,也就是目前華為云的AI能力,可以看到左邊,國(guó)際大賽上的最佳論文上有很多提名,論文數(shù)量上已經(jīng)進(jìn)入世界第一梯隊(duì)。
圍繞剛才提到的幾個(gè)創(chuàng)新和計(jì)劃,我們?cè)谟?jì)算機(jī)視覺(jué)上的很多比賽都得到第一名,在語(yǔ)音、語(yǔ)義識(shí)別上和決策優(yōu)化上拿到了很好的成績(jī)。
整體來(lái)看,目前華為云的AI戰(zhàn)略,主要圍繞著感知、認(rèn)知和決策三大方面進(jìn)行,像感知圖像分類(lèi)、目標(biāo)檢測(cè)、預(yù)訓(xùn)練模型、實(shí)力分割都已經(jīng)集成在ModelArts平臺(tái)。
此外,華為云在去年還提出了知識(shí)計(jì)算,AI在認(rèn)知之后,就需要做相應(yīng)的決策,也就是運(yùn)籌優(yōu)化過(guò)程,中間的技術(shù)主要涵蓋強(qiáng)化學(xué)習(xí)和智能控制。
這里首先介紹一下,華為云的ModelArts平臺(tái),該平臺(tái)沉淀了華為云的頂尖AI技術(shù),目前主要分為兩層:
基礎(chǔ)層是ModelArts平臺(tái),提供數(shù)據(jù)和數(shù)據(jù)處理,以及模型訓(xùn)練、管理、推理、部署等服務(wù)。
此外,我們還在ModelArts平臺(tái)上,提供了很多的行業(yè)套件,幫助各個(gè)企業(yè)開(kāi)發(fā)更適用自己的AI算法和模型,此外還有一些行業(yè)頂尖的算法,可以很方便開(kāi)發(fā)相應(yīng)模型,針對(duì)訓(xùn)練數(shù)據(jù)做相應(yīng)部署。
ModelArts目前適用的芯片也是,華為自主的AI芯片,計(jì)算能力非常高,在很多大規(guī)模作業(yè)可以做到40096卡單任務(wù)并行。
介紹完ModelArts平臺(tái)之后,我再分享一下近些年人工智能大概發(fā)展趨勢(shì)。
第一,從小模型到大模型,過(guò)去10年內(nèi),AI算法對(duì)算力需求提升了40萬(wàn)倍左右;
第二,從全監(jiān)督學(xué)習(xí)到自監(jiān)督學(xué)習(xí)10年內(nèi),自監(jiān)督學(xué)習(xí)全年度差距縮小了90%以上;
第三,人工智能與科學(xué)計(jì)算進(jìn)行交匯,從模型、算法、軟件和硬件,4個(gè)層面上都有一個(gè)交匯點(diǎn)。
而這些變化,也在生物醫(yī)學(xué)、工業(yè)、氣象、能源等眾多領(lǐng)域制造深刻影響。在AI建模、AI求解、AI框架、AI視頻、AI芯片適配上,也增加了許多的人工智能可解釋性。
首先,分子動(dòng)力學(xué)層面可以進(jìn)行大規(guī)模分子模擬;物理學(xué)上,可以通過(guò)神經(jīng)網(wǎng)絡(luò)求解確定方程;在蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)中,AI可以預(yù)測(cè)蛋白質(zhì)三維結(jié)構(gòu)。
根據(jù)我們的總結(jié),這些數(shù)據(jù)中心和生產(chǎn)力迭代過(guò)程主要分為幾個(gè)階段:
第一,技術(shù)應(yīng)用做局部探索;
第二,技術(shù)發(fā)展與社會(huì)環(huán)境相互碰撞;
第三,技術(shù)發(fā)展與社會(huì)環(huán)境相互促進(jìn)。
現(xiàn)在正處于人工智能進(jìn)入核心生產(chǎn)系統(tǒng)的過(guò)程,目前,華為在人工智能行業(yè)大約落地超過(guò)600個(gè)項(xiàng)目,進(jìn)入核心業(yè)務(wù)的系統(tǒng)也超過(guò)30%。
接下來(lái)重點(diǎn)介紹:華為云人工智能在生命科學(xué)領(lǐng)域的探索,其中主要包含三個(gè)方面:智能基因組分析、智能藥物研發(fā)、智能醫(yī)學(xué)影像研發(fā)。
首先介紹基因組分析,基因組分析數(shù)據(jù)量和計(jì)算量非常大,后期解讀基因組數(shù)據(jù)也非常困難,里面包含基因/蛋白質(zhì)組學(xué)等等,這都屬于智能基因分析范疇。
因?yàn)橐粋€(gè)基因組數(shù)據(jù)就有幾百個(gè)G大小,而如果涉及到超過(guò)1萬(wàn)人,乃至10萬(wàn)人,數(shù)據(jù)量就會(huì)更大,這種情況就需要大數(shù)據(jù)能力。
所以我們希望結(jié)合華為云大數(shù)據(jù)能力,加上智能分析算法,幫助基因組領(lǐng)域做分析和研究。
第二點(diǎn),新藥研發(fā)。
大家知道藥物研發(fā)非常復(fù)雜,包含很多環(huán)節(jié),從最開(kāi)始藥物發(fā)現(xiàn)到臨床前,到后續(xù)藥物流通,包含著很多復(fù)雜環(huán)節(jié)。
其中,華為云只聚焦在幾個(gè)點(diǎn):藥物設(shè)計(jì)、藥物大規(guī)模虛擬篩選、藥物協(xié)同性、藥物重定向維度。
集合云計(jì)算的能力,在云上做智能分析和結(jié)構(gòu)預(yù)測(cè),能讓這些準(zhǔn)確度提升一個(gè)新水平。
最后醫(yī)學(xué)影像,這是AI技術(shù)應(yīng)用最早領(lǐng)域,今年審批了十幾個(gè)AI醫(yī)療器械三類(lèi)證。
這個(gè)領(lǐng)域之所以非?;鸨驮谟跀?shù)據(jù)的標(biāo)準(zhǔn)化,因?yàn)槿斯ぶ悄苁?0%數(shù)據(jù)+20%運(yùn)算,數(shù)據(jù)量越大,AI準(zhǔn)確度就會(huì)越好,如果能夠提升智能醫(yī)學(xué)影像研發(fā)平臺(tái)和算法,降低人工操作復(fù)雜度,同樣也可以提升醫(yī)學(xué)影像的準(zhǔn)確性。
接下來(lái)詳細(xì)談?wù)劵蚪M領(lǐng)域。
我們目前開(kāi)發(fā)了一套自動(dòng)建模的工具,利用這套工具可以在很少的代碼開(kāi)發(fā)情況下,就能做多組學(xué)分析。
此外,像癌癥亞型分類(lèi)、靶基因預(yù)測(cè)、細(xì)胞發(fā)育預(yù)測(cè)等多種場(chǎng)景,我們的自動(dòng)建模工具也都有做過(guò)相應(yīng)的案例。
而在基因測(cè)序里,除了測(cè)序以外,更重要還要對(duì)數(shù)據(jù)分析,也就是解析mRNA,把電信號(hào)轉(zhuǎn)成基因序列信號(hào)。
特別是三代測(cè)序,以前的工具速度和精準(zhǔn)度都比較有限,而現(xiàn)在Fast-Bonito工具使檢測(cè)精度有了大幅提升,但檢測(cè)速度很慢,華為云也基于自己的研發(fā)力量,將這個(gè)速度提升到5倍以上。
還有新藥研發(fā)方面。
從去年2月開(kāi)始,我們做了一個(gè)新項(xiàng)目:全球最大的新冠藥物篩選數(shù)據(jù)庫(kù)及可視化平臺(tái)。
此外,新冠肺炎也可以通過(guò)醫(yī)學(xué)影像方式去檢測(cè)這種病灶,推動(dòng)決策,華為云可以做到三維病灶空間量化展示,在幾十秒就會(huì)有結(jié)果,提升檢測(cè)速度。
人工智能和云計(jì)算上,剛才已經(jīng)做了大量的介紹,目前我們的AutoGenome工具,已經(jīng)可以做到數(shù)據(jù)的自動(dòng)增長(zhǎng)、自動(dòng)的套餐選擇和神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索。
所以在新藥研發(fā)可以提供很多的幫助,例如生信工作人員就不用再學(xué)習(xí)大量的底層技術(shù),可以很方便用這個(gè)框架去做一些科研的發(fā)現(xiàn)。
針對(duì)單細(xì)胞組學(xué)的研究,研究配套組織和分子在結(jié)構(gòu)和空間上的關(guān)系,通過(guò)我們的框架把數(shù)據(jù)整理標(biāo)準(zhǔn)的訓(xùn)練數(shù)據(jù),然后再做各種訓(xùn)練。
這就像根據(jù)單細(xì)胞陽(yáng)性分離的精度,按照細(xì)胞的發(fā)育周期進(jìn)行分類(lèi),分類(lèi)的精度相比于傳統(tǒng)方法有一個(gè)比較大的提升,至少達(dá)到20%以上。
第二個(gè)案例是人工智能和單細(xì)胞測(cè)序,以及云計(jì)算的結(jié)合?,F(xiàn)在單細(xì)胞也比較火,以前大家習(xí)慣所有的細(xì)胞一起去測(cè)序,現(xiàn)在隨著越來(lái)越精準(zhǔn)。
在國(guó)內(nèi)就有一家單細(xì)胞測(cè)序平臺(tái),我們通過(guò)和他們一起合作,他們提供線下技術(shù)和服務(wù),我們?cè)诰€上也用華為云平臺(tái)來(lái)提供數(shù)據(jù)算法和算力,一起協(xié)作,做單細(xì)胞測(cè)序數(shù)據(jù)在云上開(kāi)發(fā),和邊緣計(jì)算。
剛才有介紹Fast-Bonito這個(gè)工具,那么為什么三代測(cè)序的結(jié)果要比人工智能方式比較好,因?yàn)樗旧砭褪且粋€(gè)一個(gè)電信號(hào)波形圖。
這樣就可以用AI方式去學(xué)習(xí)他們之間的關(guān)系,例如AA、TT、ATP的波形就很不一樣,波谷和波峰有很大差異。
那么通過(guò)對(duì)原來(lái)序列,做了很多標(biāo)準(zhǔn)的referenc之后,也就可以把模型訓(xùn)練的更精準(zhǔn)。
同時(shí),華為云還在原來(lái)模型的基礎(chǔ)上,做了大量的空間搜索和運(yùn)算,用華為云芯片,大概能提高2~3倍分析速度。
目前這個(gè)案例主要是一個(gè)樣本的情況,以前是需要使用100個(gè)算力,現(xiàn)在只需要20個(gè)算力就可以實(shí)現(xiàn)一個(gè)樣本的分析。
同樣當(dāng)我們面對(duì)10萬(wàn)個(gè)、100萬(wàn)個(gè)樣本同樣也能夠提升效率,節(jié)省費(fèi)用和時(shí)間。
然后是藥物篩選方面。
從去年2月,國(guó)內(nèi)疫情爆發(fā)沒(méi)多久,我們就和國(guó)內(nèi)幾所高校一起進(jìn)行新冠肺炎藥物篩選工作。
當(dāng)時(shí)我們?cè)谠粕现饕\(yùn)用超過(guò)15000個(gè)GPU進(jìn)行藥物篩選,將原來(lái)需要兩個(gè)月時(shí)間,21個(gè)新冠靶點(diǎn),8500個(gè)上市藥物的篩選工作縮短到兩天,篩選工作效率提升了30倍。
當(dāng)時(shí)我們?cè)?月初找到了5個(gè)候選藥物,有兩個(gè)進(jìn)入了臨床實(shí)驗(yàn)過(guò)程,后來(lái)因?yàn)閲?guó)內(nèi)疫情得到了很好的控制,所以臨床試驗(yàn)也就逐步放緩了一些,而我們的研究后來(lái)也得到了紅點(diǎn)獎(jiǎng),發(fā)表在JCIM期刊。
我們主要給這個(gè)項(xiàng)目命名為神農(nóng)計(jì)劃,主要是尋找和篩選大量的已知藥物分子,因?yàn)檫@些分子的物理和化學(xué)性質(zhì)都已經(jīng)比較穩(wěn)定,相當(dāng)于老藥新用的過(guò)程。
下面再介紹一下,華為云在醫(yī)學(xué)影像方面的工作。
這方面主要介紹一個(gè)腦部神經(jīng)元鏈接的案例,也就是腦科學(xué)
這個(gè)研究過(guò)程非常復(fù)雜,小如斑馬魚(yú)這么大的生物,個(gè)體非常小,大腦尺度只有0.5毫米左右。
但它的神經(jīng)元突觸數(shù)目卻非常多,達(dá)到108,如果把這些神經(jīng)元都鏈接起來(lái),就需要大量的數(shù)據(jù)標(biāo)注工作。
大家知道人類(lèi)基因組數(shù)據(jù)大概有109左右,兩者做類(lèi)比,就相當(dāng)于要把人類(lèi)的每一根細(xì)胞都要鏈接起來(lái)。這個(gè)過(guò)程中完成一個(gè)大腦的神經(jīng)元重建,一般一個(gè)標(biāo)注員大概需要125年的時(shí)間。
而利用我們的AI算法和ModelArts平臺(tái)可以實(shí)現(xiàn)集群和大規(guī)模分布訓(xùn)練,將原來(lái)的需要125年的工作量,縮短到10天內(nèi)完成,而且利用的資源也非常少。整個(gè)神經(jīng)元重構(gòu)費(fèi)用減少為原來(lái)的1/77 ,準(zhǔn)確度和召回率都在95%以上,是一個(gè)非常大的突破。
目前,我們還只是研究一個(gè)斑馬魚(yú)腦部神經(jīng)元這樣小范圍的數(shù)據(jù),以后如果要研究像老鼠,像人腦這樣更復(fù)雜的數(shù)據(jù),都會(huì)有一定的借鑒意義。
那回到我們?yōu)槭裁匆芯窟@樣的數(shù)據(jù),未來(lái)的智能究竟是什么樣子,就是來(lái)源于像人腦這樣的研究,怎樣實(shí)現(xiàn)控制,怎樣實(shí)現(xiàn)反饋,我們的神經(jīng)網(wǎng)絡(luò)研究,其實(shí)也就是模仿腦部神經(jīng)元的構(gòu)建,回歸生物學(xué)的本質(zhì)。
這里列舉一個(gè)和醫(yī)療器械公司合作的案例。
華為云和微清醫(yī)療的合作案例,微清本身就有眼底診斷系統(tǒng),可以通過(guò)光學(xué)做青光眼識(shí)別,以及糖尿病疾病的診斷。
這其中,主要是利用華為云平臺(tái),做數(shù)據(jù)標(biāo)注管理和病人應(yīng)用,幫助醫(yī)生更方便做診斷,以前可能需要用半小時(shí),現(xiàn)在也就幾分鐘時(shí)間,就能完成青光眼疾病診斷。
總結(jié)與展望
首先,大算力將是AI成功的基石。
以前神經(jīng)網(wǎng)絡(luò)做到三層就很厲害,現(xiàn)在往往可以做到幾十層或幾百層,模型也變得很大,對(duì)于算力要求也非常大。
我們猜測(cè)AI系統(tǒng)發(fā)展程度是可以利用數(shù)據(jù)和消耗算力來(lái)衡量,與卡達(dá)爾肖夫指數(shù)類(lèi)似,AI智能化程度對(duì)算力需求會(huì)呈指數(shù)級(jí)增長(zhǎng)。
近些年,我們國(guó)家也在建設(shè)AI計(jì)算中心,AI算力作為一種基礎(chǔ)資源需求,開(kāi)始被社會(huì)所需要。
其次,軟硬件一體化將是大勢(shì)所趨。
軟件發(fā)展一定程度會(huì)受限于技術(shù)的瓶頸,隨后就需要依賴(lài)硬件進(jìn)一步發(fā)展,而硬件達(dá)到一定水平后也需要更好軟件架構(gòu)。
之后,AI與科學(xué)計(jì)算會(huì)深度融合。
AlphaFold2將人類(lèi)98.5%的蛋白質(zhì)做了預(yù)測(cè),大家越來(lái)越認(rèn)識(shí)到人工智能跟科學(xué)研究密切相關(guān)。
最后,深度整合醫(yī)療資源,全面賦能行業(yè)創(chuàng)新。
以AI新藥研發(fā)為例,不只是要關(guān)注藥物分子設(shè)計(jì)和篩選,背后需要藥物研究、基因臨床和醫(yī)學(xué)影像等等的支撐。
Deepmind就表示,如果一個(gè)臨床試驗(yàn)?zāi)軌虻玫交蚪M學(xué)支撐,它的成功率就會(huì)提升兩倍。
受益于基因組學(xué)、藥物靶點(diǎn)發(fā)現(xiàn)和基準(zhǔn)研究,AI技術(shù)已經(jīng)開(kāi)始在基因、藥物、臨床等更多方面做分析工作。
這其中加速各方融合,促進(jìn)數(shù)據(jù)資源的轉(zhuǎn)化使用也非常重要,在國(guó)家管控越來(lái)越明確之后,大家能夠更深入的合作,一同探討數(shù)據(jù)方面的聯(lián)合創(chuàng)新,加速應(yīng)用落地。
Q1:1.在AI制藥浪潮中,華為更側(cè)重怎樣的角色,是算法提供方,還是算力提供方,具體深入到pcc和臨床試驗(yàn),又有哪些合作點(diǎn)?
孟鑫:華為云作為基礎(chǔ)設(shè)施的算力提供方,安全培訓(xùn)這塊做的非常好,也拿到了2799認(rèn)證,同時(shí)標(biāo)志著我們?cè)卺t(yī)療領(lǐng)域有非常大的決心。
但華為云并不是所有的算法都做,我們希望把這個(gè)領(lǐng)域打開(kāi),做一些案例被大家看到,大家可以在我們的運(yùn)營(yíng)商開(kāi)發(fā)自己的算法,或者也可以用我們的算力和算法。
華為云也只是提供了非常少量的算法,希望大家合作一起做一些算法,我們也愿意和大家一起去探索。
對(duì)于專(zhuān)門(mén)做醫(yī)療AI公司來(lái)說(shuō),華為云整個(gè)體量相對(duì)來(lái)說(shuō)還是大一些,我們更希望去做一些大規(guī)模的事情或者基礎(chǔ)方面的服務(wù)。
例如,有一些公司想做模型開(kāi)發(fā),但是沒(méi)有很好的基底模型,大模型需要做1萬(wàn)億級(jí)別參數(shù)的訓(xùn)練,訓(xùn)練需要幾個(gè)月的時(shí)間,小公司肯定負(fù)擔(dān)不起,華為云可以把基礎(chǔ)部分做了。
華為云今年也發(fā)布了大模型,訓(xùn)練了幾個(gè)月的時(shí)間之后做出來(lái),大家可以去華為云運(yùn)營(yíng)的公眾號(hào)可以搜到相關(guān)介紹。
有了大模型想要針對(duì)某一個(gè)積分領(lǐng)域去做出自己的優(yōu)質(zhì)、特點(diǎn)和數(shù)據(jù),再做一些訓(xùn)練可能會(huì)更容易,可以用少量的幾塊算力,就得到好的結(jié)果,站在更高的級(jí)別。
我給到大家一個(gè)提前消息,華為云在今年9月份會(huì)有更多的基礎(chǔ)服務(wù)發(fā)布,實(shí)驗(yàn)這一塊就是收費(fèi)者招募、培訓(xùn)、加速的AI研究,都可以通過(guò)這樣方式去做。
華為云和國(guó)內(nèi)一些頂尖的醫(yī)院有合作,在臨床試驗(yàn)的數(shù)據(jù)有很多的發(fā)現(xiàn),而且有相應(yīng)的文章發(fā)表,大家有興趣可以去看看。
Q2:請(qǐng)問(wèn)計(jì)算服務(wù)如何收費(fèi)?目前的價(jià)格水平如何?下降趨勢(shì)如何?
孟鑫:大家可以用CPU的算力或者NGO算力,目前來(lái)看收費(fèi)比較貴,只有大企業(yè)才有實(shí)力做出來(lái),但是AI算力費(fèi)用會(huì)逐漸降低,再加上國(guó)內(nèi)芯片受到一些限制,國(guó)際上短缺,技術(shù)發(fā)展持續(xù)的迭代和更新,大部分會(huì)持續(xù)下降。
同時(shí),意味著人工智能技術(shù)受益于成本的下降,會(huì)越來(lái)越普及被大家所接受,每一個(gè)人都能夠用得起,都能做AI。
Q3:看到AI新藥研發(fā)企業(yè),也在賣(mài)藥物篩選服務(wù)收費(fèi)模式,這和咱們的計(jì)算服務(wù)有沒(méi)有合作點(diǎn),配合起來(lái)幫助藥企加速新藥研發(fā)?
孟鑫:國(guó)內(nèi)和國(guó)際上有很多AI藥物研發(fā)企業(yè)和華為云都有比較深入的合作。
一方面是華為云基礎(chǔ)的云資源,在本地區(qū)構(gòu)建這種集群很難達(dá)到大規(guī)模的訴求,還需要花費(fèi)很大的精力去運(yùn)營(yíng)資源,在云上可以很好的來(lái)解決這個(gè)問(wèn)題,想用的時(shí)候就用,不想用的時(shí)候就關(guān)掉。
另外,云上有各種各樣的AI模型,對(duì)AI新藥研發(fā)企業(yè)來(lái)說(shuō)有很多好處,因?yàn)榭梢詭椭麄內(nèi)プ鰧?duì)外提供服務(wù)。
我們內(nèi)部也在開(kāi)會(huì)研討,在華為云上有很多這樣的案例,我們自己做或者有一些藥企會(huì)找到我們想一起合作,我們?cè)敢鈳椭麄儼研滤幾龀鰜?lái)。
華為云與其他藥物研發(fā)企業(yè)不太一樣,有些藥物研發(fā)企業(yè)有自己的定位,只提供相應(yīng)的研究服務(wù)。
華為云從現(xiàn)在定位來(lái)看更傾向于做平臺(tái),希望能夠幫助大家更好的去服務(wù)企業(yè),也可以配合大家去做一些創(chuàng)新。
Q4:請(qǐng)問(wèn)系統(tǒng)架構(gòu)中有哪些方面是為生物計(jì)算專(zhuān)門(mén)設(shè)計(jì)或優(yōu)化的?
孟鑫:剛才我舉了一個(gè)例子,利用AI來(lái)加速三代測(cè)序過(guò)程,在模型空間搜索上做了相應(yīng)的優(yōu)化,讓模型會(huì)更小一些,在計(jì)算時(shí)間上速度有提升。
另外提到過(guò)的一系列工具,也是專(zhuān)門(mén)針對(duì)經(jīng)營(yíng)組織和多組學(xué)的特點(diǎn)去研發(fā),有基因調(diào)控的關(guān)系,并不會(huì)因?yàn)閮蓚€(gè)名字比較相近就導(dǎo)致基因功能一樣,或者就能夠發(fā)揮作用,看似沒(méi)有關(guān)系的兩個(gè)名字實(shí)際上是有一些意義的。同時(shí),華為云在神經(jīng)網(wǎng)絡(luò)上也有自己的設(shè)計(jì)。
Q5:華為云AI在慢病早篩領(lǐng)域是否有相應(yīng)的案例?
孟鑫:有的,和北京技術(shù)所教授其實(shí)有一個(gè)合作,利用AI方式去研究食管癌案例,大家感興趣可以去搜一下。
Q6:人工智能可以對(duì)早期診斷疾病、有效開(kāi)出藥物、監(jiān)測(cè)患者對(duì)處方的依從性做出判斷嗎?
孟鑫:可以的,臨床輔助決策AI也發(fā)揮了很大的作用,國(guó)家衛(wèi)健委也在臨床輔助決策上面有一個(gè)全國(guó)性的試點(diǎn)項(xiàng)目正在開(kāi)展中。
利用人工智能對(duì)電子病歷做相應(yīng)分析,進(jìn)行學(xué)習(xí)和檢查疾病診斷的病變,可以給出藥物治療的方案。
需要做很多診斷工作,包括現(xiàn)在醫(yī)保上面提到病案首頁(yè),我們的合作伙伴也有一些聯(lián)合方案。
Q7:人工智能生物學(xué)中有什么核心難點(diǎn)?
孟鑫:用人工智能方式去解答生物學(xué)方面問(wèn)題,就需要大量數(shù)據(jù),如果數(shù)據(jù)量比較小,那學(xué)習(xí)出來(lái)的模型就不具有代表性,結(jié)果不會(huì)太好。
以前做統(tǒng)計(jì)模型或者記錄模型重要的是保持準(zhǔn)確,現(xiàn)在越多數(shù)據(jù)才能把問(wèn)題表述的更加有特征。
把人類(lèi)當(dāng)成一個(gè)嬰兒而言,從小就對(duì)他進(jìn)行培養(yǎng),如果只培養(yǎng)某一方面技能的話,他另外一方面肯定是失衡的,所以全面的數(shù)據(jù)是最核心的。
另外,智能模型和人工智能模型融合起來(lái),就是計(jì)算和人工智能來(lái)到了一個(gè)歷史性的交匯點(diǎn)。希望這種模型的機(jī)制,物理、化學(xué)或者數(shù)學(xué)方面,能更容易理解得到的結(jié)果,把兩個(gè)技術(shù)聯(lián)系起來(lái)。
知識(shí)圖譜也有很多難點(diǎn),特別是針對(duì)我們生命科學(xué)領(lǐng)域的知識(shí)本身,要用一個(gè)圖去標(biāo)記所有數(shù)據(jù),同時(shí)還要把他們的依賴(lài)條件表述出來(lái)。
Q8:和藥研所合作現(xiàn)在是什么情況?
孟鑫:上海藥物所在這個(gè)領(lǐng)域算是國(guó)內(nèi)的Number one,專(zhuān)門(mén)做藥物研究的,所以我們和國(guó)內(nèi)的院校是有合作的,同北大、深圳和上海的一些高校進(jìn)行科研合作,非常歡迎院校的老師同我們進(jìn)一步合作。
在華為云有專(zhuān)門(mén)針對(duì)高校扶持計(jì)劃,能夠讓大家去做相應(yīng)的研究和資源。
Q9:目前在AI新藥研發(fā)上,看到咱們大多數(shù)進(jìn)展都在新冠領(lǐng)域上,有沒(méi)有其他案例介紹一下?
孟鑫:有的,現(xiàn)在還不太方便說(shuō),后續(xù)也會(huì)跟大家再分享我們的一些進(jìn)展。后續(xù)也會(huì)跟大家再分享我們的一些進(jìn)展。我就回答到這里,謝謝雷鋒網(wǎng)。雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。