0
本文由清華大學(xué)姜蔚蔚向雷鋒網(wǎng)AI科技評(píng)論投稿,未經(jīng)允許禁止轉(zhuǎn)載。
雷鋒網(wǎng) AI 科技評(píng)論按:這篇論文試圖通過深度神經(jīng)網(wǎng)絡(luò)來解決天體力學(xué)中著名的三體問題。早在牛頓的時(shí)代,三體問題就已經(jīng)被提出,即三個(gè)可視為質(zhì)點(diǎn)的天體在相互之間萬有引力作用下的運(yùn)動(dòng)規(guī)律問題,至今無法被精確求解。與之相對(duì)的,描述兩個(gè)天體相互運(yùn)動(dòng)的二體問題可以通過牛頓力學(xué)完美解決。三體問題在國內(nèi)的知名度部分來自于科幻小說家劉慈欣的小說《三體》,其中就描述了一個(gè)生活在三體星系的地外文明,忍受著三顆恒星復(fù)雜多變的運(yùn)行軌跡帶來的變化多端的天氣,由此產(chǎn)生了星際移民并試圖占領(lǐng)地球的故事。
從數(shù)學(xué)上說,每一個(gè)天體在另外兩個(gè)天體的萬有引力作用下的運(yùn)動(dòng)方程可以表示為3個(gè)二階的常微分方程或6個(gè)一階的常微分方程[1]。在三體問題中,對(duì)應(yīng)了求解18階方程。然而,物理定律只給了我們10個(gè)等式,包含3個(gè)質(zhì)心方程、3個(gè)動(dòng)量守恒方程、3個(gè)角動(dòng)量守恒方程和1個(gè)能量守恒方程。因此從數(shù)學(xué)上完美求解三體問題是不可能的。
既然如此,數(shù)學(xué)家們擱置了一般情況下的三體問題求解,轉(zhuǎn)而尋找特定條件下的解,例如法國數(shù)學(xué)家龐加萊就提出了限制性三體問題,即兩體的質(zhì)量極大,第三體不能對(duì)它們?cè)斐蓴_動(dòng)的情況。在研究這個(gè)問題的過程中,龐加萊提出了混沌理論,并且發(fā)現(xiàn)了三體問題中的“蝴蝶效應(yīng)”:如果初始狀態(tài)有一個(gè)小的擾動(dòng),那么后來的狀態(tài)會(huì)有極大的不同。
與數(shù)學(xué)家們不同,計(jì)算機(jī)科學(xué)家采取了另一種思路,即通過近似和數(shù)值技術(shù)來計(jì)算分析三體之間的關(guān)系。到了2015年,研究人員提出了一個(gè)名為Brutus的積分器,基于Bulirsch-Stoer算法可以求解N體問題的任意給定精度的近似收斂解。然而這種方法對(duì)內(nèi)存的要求隨著精度的增高和模擬時(shí)間的增長而呈指數(shù)級(jí)增長。
論文標(biāo)題:Newton vs the machine:solving the chaotic three-body problem using deep neural networks
下載鏈接:https://arxiv.org/abs/1910.07291
在這篇論文中,來自愛丁堡大學(xué)、劍橋大學(xué)、阿威羅大學(xué)、萊頓大學(xué)的研究人員試圖通過深度神經(jīng)網(wǎng)絡(luò)來解決三體的計(jì)算問題。神經(jīng)網(wǎng)絡(luò)模型取得了跟Brutus非常接近的計(jì)算結(jié)果,但是速度卻快了一億倍。如此令人震驚的速度提升效果引發(fā)了數(shù)學(xué)家和計(jì)算機(jī)學(xué)家對(duì)于這篇論文的關(guān)注和大量討論。
作者首先簡化了三體問題,限制為三個(gè)質(zhì)量相等、初始速度為零的粒子在一個(gè)平面上的引力問題。如圖1所示:
圖1. 三個(gè)粒子的初始位置。
粒子1的初始位置x1=(1,0)代表了距離原點(diǎn)的單位距離,粒子2的初始位置x2在圖1中的綠色區(qū)域中隨機(jī)產(chǎn)生,而由于對(duì)稱性,粒子3的初始位置x3=-x1-x2。圖1中的紅點(diǎn)代表粒子2和粒子3重合的特殊情況,此時(shí)x2=x3=(-0.5, 0)。
然后作者們利用Brutus模擬求解了10000次它們的三體運(yùn)動(dòng),完成這些模擬花費(fèi)了10天的時(shí)間。接下來對(duì)神經(jīng)網(wǎng)絡(luò)模型而言,作者們使用其中的9900次模擬作為訓(xùn)練集,100次模擬作為訓(xùn)練集。這篇論文中使用的深度神經(jīng)網(wǎng)絡(luò)模型是一個(gè)包含10個(gè)隱藏層、128個(gè)節(jié)點(diǎn)前饋神經(jīng)網(wǎng)絡(luò),如圖2所示:
圖2. 牛頓肖像畫和神經(jīng)網(wǎng)絡(luò)模型。
訓(xùn)練過程采用了Adam優(yōu)化器,每個(gè)epoch分為5000個(gè)batch,激活函數(shù)使用了ReLU。訓(xùn)練過程中平均絕對(duì)誤差隨epoch變化的情況如圖3所示,
圖3. 平均絕對(duì)誤差vs epoch。
其中實(shí)線代表訓(xùn)練集,虛線代表驗(yàn)證集,3.9、7.8和10分別代表了使用的數(shù)據(jù)量的大小,特別的,10代表使用了全部10天生成的數(shù)據(jù),即全部數(shù)據(jù)集。
圖4. 神經(jīng)網(wǎng)絡(luò)和Brutus結(jié)果的對(duì)比。
在圖4中,作者給出了訓(xùn)練好的模型與Brutus計(jì)算結(jié)果的對(duì)比,左半邊為訓(xùn)練集上的對(duì)比,右半邊為驗(yàn)證集上的對(duì)比。三種顏色的曲線代表三個(gè)例子的運(yùn)動(dòng)軌跡,而由于結(jié)果太接近,實(shí)線代表的神經(jīng)網(wǎng)絡(luò)的軌跡和虛線代表的Brutus的軌跡幾乎無法分辨,代表經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)令人滿意地再現(xiàn)了粒子之間的相互作用。而神經(jīng)網(wǎng)絡(luò)的計(jì)算時(shí)間(大約是10的負(fù)三次方秒)比Brutus快了十萬倍(有時(shí)候甚至是一億倍)。進(jìn)一步,作者們也對(duì)比了神經(jīng)網(wǎng)絡(luò)模型對(duì)于初始位置擾動(dòng)的敏感性。通過在x2的初始位置上加入一個(gè)很小的擾動(dòng),神經(jīng)網(wǎng)絡(luò)模型依舊取得了跟Brutus相近的結(jié)果,如圖5所示。
圖5. 初始位置的敏感依賴。
最后,作者們也嘗試?yán)蒙窠?jīng)網(wǎng)絡(luò)來預(yù)測(cè)粒子的速度信息,但是神經(jīng)網(wǎng)絡(luò)在求解問題的時(shí)候似乎沒有遵循能量守恒定律,作者們?cè)谌藶榧尤胍粋€(gè)能量投影層之后,才使得預(yù)測(cè)誤差從10-2降低到了10-5,如圖6所示。
圖6. 相對(duì)能量誤差。
這篇論文成功驗(yàn)證了神經(jīng)網(wǎng)絡(luò)在混沌系統(tǒng)仿真中的應(yīng)用,能夠以更快的速度完成傳統(tǒng)的方法(例如Brutus)的仿真工作,從而展示了在解決類似的復(fù)雜性問題上的應(yīng)用潛力。
這篇論文的不足也是很明顯的。很多人認(rèn)為這篇論文只是一種概念上的驗(yàn)證,因?yàn)檎撐闹械纳窠?jīng)網(wǎng)絡(luò)模型只能解決二維平面內(nèi)并且初速度為0的三體問題。深度學(xué)習(xí)近年來的火爆使得它的應(yīng)用早于超出了傳統(tǒng)的計(jì)算機(jī)領(lǐng)域。在物理領(lǐng)域,曾經(jīng)就有研究將神經(jīng)網(wǎng)絡(luò)應(yīng)用于模擬中子星碰撞[3]。然而這種廣泛的應(yīng)用也引起了研究人員的擔(dān)憂和質(zhì)疑,例如Nature上一篇利用深度學(xué)習(xí)預(yù)測(cè)地震余震[4]的論文就被質(zhì)疑為深度學(xué)習(xí)方法的“濫用”。目前來看深度神經(jīng)網(wǎng)絡(luò)還無法完全替代Brutus這樣的工具。正如作者所說的,未來他們會(huì)考慮構(gòu)建一個(gè)混合系統(tǒng),當(dāng)計(jì)算負(fù)擔(dān)過重時(shí)引入神經(jīng)網(wǎng)絡(luò),直到可以繼續(xù)使用Brutus方法計(jì)算,從而能夠更快地模擬星體之間的運(yùn)動(dòng)。
參考:
[1] 淺談三體問題, 甘慶雨, 2014. http://hpc.seu.edu.cn/dong/class/2014-Ganqingyu.pdf
[2] Boekholt T, Zwart S P. On the reliability of N-bodysimulations[J]. Computational Astrophysics and Cosmology, 2015, 2(1): 2.
[3] Adamczewski-Musch J, Arnold O, Behnke C, et al. Probing densebaryon-rich matter with virtual photons[J]. Nature Physics, 2019, 15:1040-1045.
[4] DeVries P M R, Viégas F, Wattenberg M, et al. Deep learning ofaftershock patterns following large earthquakes[J]. Nature, 2018, 560(7720):632.
雷鋒網(wǎng)報(bào)道。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。