丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
醫(yī)療AI 正文
發(fā)私信給劉海濤
發(fā)送

0

鄂維南院士: AI主戰(zhàn)場,將從自動駕駛、人臉識別,轉(zhuǎn)至生物領(lǐng)域

本文作者: 劉海濤 2021-05-24 10:43
導(dǎo)語:談到人工智能,大家馬上想到的可能是自動駕駛、人臉識別等場景。但接下來,傳統(tǒng)科學(xué)領(lǐng)域?qū)⒊蔀槿斯ぶ悄苤鲬?zhàn)場。

近日,由百圖生科與播禾創(chuàng)新主辦,《醫(yī)健AI掘金志》協(xié)辦的 “首屆中國生物計算大會” 在蘇州閉幕。

作為主論壇報告的開場嘉賓,北京大數(shù)據(jù)研究院院長鄂維南,以《機器學(xué)習(xí)與科學(xué)計算》為題,在大會做了開場報告。

鄂維南表示,從50年代開始,科學(xué)計算領(lǐng)域發(fā)展了差分方法、有限元方法、譜方法等基本方法來處理基礎(chǔ)的物理模型,并且在工程和技術(shù)上得到了廣泛應(yīng)用。但依然還有很多問題沒有解決。

例如:材料的性質(zhì)與設(shè)計;分子、藥物的性質(zhì)及設(shè)計;基于基本原理的控制論方法;燃燒問題(內(nèi)燃機的模擬、設(shè)計與控制)。

這些因素也導(dǎo)致理論研究場景與實際問題距離甚遠(yuǎn)。

鄂維南認(rèn)為,解決這些問題的新的出路就是機器學(xué)習(xí)和物理模型的結(jié)合。以經(jīng)典的物理模型提供數(shù)據(jù),在此基礎(chǔ)上通過機器學(xué)習(xí)產(chǎn)生更有效且同樣可靠的模型。

以今天的生物計算為例,藥物設(shè)計最重要的環(huán)節(jié)之一就是自由能計算。如果沒有自由能計算,基于基本原理的設(shè)計藥物可能就是一句空話。

為此,鄂維南的團隊用上述方法研發(fā)了高維空間的高效采樣方法RiD和自由能計算的有效方案。

最后,鄂維南發(fā)表了自己對AI和科學(xué)計算的展望:“談到人工智能,大家馬上想到的可能是自動駕駛、人臉識別等場景。但接下來,傳統(tǒng)的科學(xué)領(lǐng)域?qū)⒊蔀槿斯ぶ悄艿闹鲬?zhàn)場。AI for Science 將帶動生物、化學(xué)、材料、工程等領(lǐng)域進入新的發(fā)展模式?!?/p>

以下為鄂維南院士的演講內(nèi)容,雷鋒網(wǎng)做了不改變原意的編輯和整理:

鄂維南:在討論生物計算之前,首先談一談科學(xué)計算。

我是在2015年,開始利用深度學(xué)習(xí)做生物數(shù)據(jù)分析的,當(dāng)時開發(fā)出一種被作稱為DeFine的軟件。自那時起,我們就發(fā)現(xiàn)了生物計算的潛力,AI從數(shù)據(jù)分析,到科學(xué)模型,都開始創(chuàng)造新的機會。

今天,科學(xué)計算主要涉及兩大主題:物理模型和數(shù)據(jù)處理。

首先,過去大家一直強調(diào)數(shù)學(xué)、計算機、統(tǒng)計學(xué),但卻忽略了物理學(xué)。

事實上,科學(xué)計算的主要模型都是基于物理學(xué),例如牛頓方程、空氣動力學(xué)、彈性力學(xué)、電磁場理論、量子力學(xué)等等。

雖然還有觀點認(rèn)為,納米、生物會衍生出新的科學(xué)模型,但就目前情況而言,新的科學(xué)模型,都基本源于這些物理模型。但在過去的很多年里,科學(xué)計算模型,一直無法滿足解決實際問題的算力需求,為此,絕大多數(shù)科學(xué)家的工作都是簡化模型。即使一小部分物理學(xué)家找到基本原理,也無法將其應(yīng)用于實際。

這種現(xiàn)象一直延續(xù)到上世紀(jì)50年代,電子計算機出現(xiàn)后才得以根本改變。

隨后,科學(xué)計算領(lǐng)域陸續(xù)發(fā)展出差分方法、有限元方法、譜方法等一些系列科學(xué)計算方法,讓人類首次實現(xiàn)利用基本原理來解決實際問題的夢想。像橋梁設(shè)計、大樓設(shè)計、飛機設(shè)計都已經(jīng)利用科學(xué)計算,實現(xiàn)了基本的目標(biāo)。從數(shù)學(xué)角度而言,這里需要的所有函數(shù)都是用多項式逼近的方式處理的。

這一下解決了結(jié)構(gòu)力學(xué)、航空航天、天氣預(yù)報、石油勘探與開采等多個工科問題,組成了現(xiàn)代工業(yè)和技術(shù)賴以生存的基礎(chǔ)。但電子計算機并沒有一下解決所有問題,像生物計算就沒有實現(xiàn)利用基本原理進行藥物設(shè)計的需求。

其中的本質(zhì)原因在于,藥物設(shè)計目前還沒有完全找到基本原理,但生物設(shè)計又是非常經(jīng)驗化的學(xué)科,其中涵蓋材料、反應(yīng)等多個問題,這些因素導(dǎo)致理論研究場景與實際問題相距甚遠(yuǎn)。

那為什么會出現(xiàn)這種情況?我認(rèn)為根本原因,就在于維數(shù)災(zāi)難,即內(nèi)在變量太多導(dǎo)致維數(shù)增加,復(fù)雜度也呈指數(shù)級增加。例如,大家熟知的薛定諤方程,其中的波函數(shù)自由度是電子個數(shù)的三倍。而模擬實際問題所需要處理的電子數(shù)往往是百萬千萬。

其次,生物計算的數(shù)據(jù)處理,生物計算在處理的數(shù)據(jù)種類上,就包含了DNA和基因組學(xué)、蛋白組學(xué)、圖像等多種數(shù)據(jù)。

從任務(wù)角度來看,數(shù)據(jù)處理主要包括三個步驟:

第一imaging——反演,通過實驗儀器和數(shù)據(jù)反演出內(nèi)在結(jié)構(gòu);

第二image processing,如何去掉圖像中的多種噪音,并完成圖像分割、修補等步驟;

第三image recognition——圖像識別。

這和前兩大任務(wù)有較大區(qū)別。例如,在一系列圖像中,分別存在狗和貓圖像,那如何分辨出究竟是狗還是貓,就涉及到圖像識別問題。

圖像識別的本質(zhì)就是在圖像空間找到一個函數(shù),并告知圖像內(nèi)容,其中圖像間維度信息大概有3000多維。而且以前處理的都是單張照片,現(xiàn)在處理則是帶有變量的函數(shù),二者有本質(zhì)區(qū)別。

其實,數(shù)學(xué)一直都是非常保守的領(lǐng)域,我自己就從未想過,數(shù)據(jù)會完成圖像識別這樣的任務(wù)。

這其中最大的變量,應(yīng)該就是深度學(xué)習(xí),從事計算機的人在經(jīng)過多年努力后,終于找到深度學(xué)習(xí)這一工具,使圖像識別得到有效解決。

例如AlphaGo,從圖像識別到圖像生成再到AlphaGo,這三個過程從數(shù)學(xué)角度而言就是高維問題。第一個問題是解決高維函數(shù)逼近,第二是高維概率密度,第三是解決高維超大空間Bellman方程。

深度學(xué)習(xí)解決問題的本質(zhì),就是提供了一個高維函數(shù)的逼近方法。而科學(xué)計算最大的影響就是將數(shù)學(xué)計算方法和物理數(shù)據(jù)這兩類方法結(jié)合起來。

過去大家一直都將模型和數(shù)據(jù)割裂開來,兩者結(jié)合之后,就可以從模型得到數(shù)據(jù),而后從數(shù)據(jù)得到更有效的模型。

另外,從分子動力學(xué)角度而言,藥物設(shè)計作為分子動力學(xué)最主要的應(yīng)用場景,涵蓋了基因組學(xué)、蛋白組學(xué)等多個維度信息。而且,分子動力學(xué)也是基本藥物設(shè)計最不可或缺的工具,其中主要的困難點就是算原子之間的相互作用,這些都要通過解電子問題實現(xiàn),需要遵循量子力學(xué)原理。

1985年,出現(xiàn)了一個劃時代的工作,即通過量子力學(xué)計算原子之間相互作用力,使分子動力學(xué)成為可靠工具,但因為這種方法效率有限,一般只能處理幾百個原子。所以,人們只能通過猜測方法來解決實際問題,但通過猜測設(shè)計藥品并不可行。

于是通過機器學(xué)習(xí),以經(jīng)典的物理模型提供數(shù)據(jù),在此基礎(chǔ)上通過機器學(xué)習(xí)產(chǎn)生更有效且同樣可靠的模型的方法,開始被大規(guī)模使用。各種小分子、大分子藥物和復(fù)雜材料都可以達到與量子力學(xué)同樣的精度,且比量子力學(xué)更有效得多的體系。

通過機器學(xué)習(xí)方法+高性能計算得出了結(jié)果,首次將機器學(xué)習(xí)和科學(xué)計算、高性能計算結(jié)合在一起,并帶來幾個數(shù)量級的展現(xiàn)。

除了分子動力學(xué)以外,我們團隊也發(fā)展出一系列新方法,為藥物研發(fā)提供幫助。

例如,具有量子化學(xué)精度的密度泛函模型DeePKS。過去密度泛函主要是針對于量子力學(xué),在大分子方面還有諸多的限制,DeePKS主要是希望像量子力學(xué)一樣,能夠做到滿足小分子,以及一部分相對小一點的大分子的需求。

除此之外,我們還研發(fā)了高維空間的高效采樣方法RiD和自由能計算的有效方案。在藥物設(shè)計當(dāng)中,最重要的工具就是自由能計算,如果無法實現(xiàn)自由能計算,那藥物設(shè)計就是一句空話。RiD的主要作用就是通過強化學(xué)習(xí)方法,做一些粗?;肿觿恿W(xué)運算。

前幾天,我們還發(fā)布了開源社區(qū)DeepModeling的社區(qū)宣言,希望將大家的力量整合到一起、推動事情向前發(fā)展。DeepModeling這個概念最早源自開源社區(qū),即將深度學(xué)習(xí)與物理模型相結(jié)合。

最后,講一下對AI和科學(xué)計算的展望。

談到人工智能,大家馬上想到的可能是自動駕駛、人臉識別等場景。但接下來,傳統(tǒng)的科學(xué)領(lǐng)域?qū)⒊蔀槿斯ぶ悄艿闹鲬?zhàn)場。AI for Science 將帶動生物、化學(xué)、材料、工程等領(lǐng)域進入新的發(fā)展模式。另外還有新一代科學(xué)軟件的落地問題,過去我們的科學(xué)軟件、工業(yè)軟件都有卡脖子問題。但隨著這些新模式出現(xiàn),會推動新一代科學(xué)軟件加速落地,為我們的科學(xué)軟件建設(shè)提供絕佳的機會。

此外,科學(xué)研究也將從“小農(nóng)作坊”轉(zhuǎn)變到“安卓”模式。過去各大科學(xué)實驗室普遍都是自給自足的小農(nóng)作坊,在大平臺出現(xiàn)之后,大家可以對應(yīng)開發(fā)出自己感興趣的應(yīng)用、平臺和科研,并衍生出巨大的科研社區(qū)。  雷鋒網(wǎng)雷鋒網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章

編輯

專注AI醫(yī)療的新勢力和投融資丨微信ID:Daniel-six
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說