0
本文作者: 楊麗 | 2021-07-14 11:03 |
地球自轉(zhuǎn)一圈需要24小時(shí),那么你知道脈沖星(不斷發(fā)出脈沖信號(hào)的中子星)自轉(zhuǎn)一周需要多久嗎?
答案是:按秒計(jì)算。
即便是目前發(fā)現(xiàn)轉(zhuǎn)速“最慢”的脈沖星(編號(hào)J0250+5854),它自轉(zhuǎn)一周可能也只需要23秒。而轉(zhuǎn)速快的脈沖星,它可能在你一眨眼的功夫就已經(jīng)偷偷跑了幾十個(gè)轉(zhuǎn)了。
因而,我們?nèi)祟?lèi)用肉眼是很難直觀感受到脈沖星的頻率。約定俗成的手段是,利用射電天文望遠(yuǎn)鏡對(duì)脈沖星發(fā)出的射電信號(hào)特征進(jìn)行提取,然后將這部分特征通過(guò)二維空間的方式表達(dá)出來(lái)。科學(xué)家通過(guò)對(duì)這些數(shù)據(jù)進(jìn)行相應(yīng)的追蹤觀測(cè),才能夠發(fā)現(xiàn)脈沖星的痕跡。
但這一切帶來(lái)的工作量都太大了。
2021世界人工智能大會(huì)期間,馬化騰宣布了騰訊與國(guó)家天文臺(tái)的合作,雙方合作的項(xiàng)目,主要是借助騰訊云的計(jì)算、存儲(chǔ)能力與騰訊優(yōu)圖實(shí)驗(yàn)室AI算法的能力,為中國(guó)天眼FAST尋找脈沖星提速。
一家是互聯(lián)網(wǎng)公司里的實(shí)驗(yàn)室,一家是從事基礎(chǔ)科研的天文臺(tái),如何開(kāi)啟探星業(yè)務(wù)?
找星星的人
中國(guó)科學(xué)院國(guó)家天文臺(tái)研究院、FAST首席科學(xué)家李菂向雷鋒網(wǎng)透露,雙方合作期間已經(jīng)被驗(yàn)證的新脈沖星已經(jīng)有5顆了。
讓人興奮的數(shù)字。
實(shí)際上,這場(chǎng)興奮最初源于1967年和1993年的兩次脈沖星觀測(cè)發(fā)現(xiàn),其意義引發(fā)了全世界天文學(xué)家對(duì)脈沖星探索的強(qiáng)烈熱情。
而在中國(guó)天眼落成之前,中國(guó)的望遠(yuǎn)鏡和中國(guó)工作的科學(xué)家從來(lái)沒(méi)有發(fā)現(xiàn)過(guò)新的脈沖星。
2016年9月,全球最大的500米單口徑球面射電望遠(yuǎn)鏡FAST落成,也就是我們?nèi)缃癯Uf(shuō)的“中國(guó)天眼”。
過(guò)去幾年,僅中國(guó)天眼FAST一家就已經(jīng)觀測(cè)到近350顆脈沖星,占全球已發(fā)現(xiàn)脈沖星總數(shù)(近3000顆)的十分之一。
可以說(shuō),中國(guó)科學(xué)家在利用天眼作為天體設(shè)備搜尋脈沖星方面,已經(jīng)具備一定的領(lǐng)先性和成熟經(jīng)驗(yàn)。
而這一領(lǐng)先性有望被再度提升。
2021年,騰訊優(yōu)圖實(shí)驗(yàn)室主動(dòng)找到李菂老師團(tuán)隊(duì),希望能利用騰訊自身在AI算法、計(jì)算資源調(diào)度等方面的優(yōu)勢(shì),為航天探星做出一些努力。
經(jīng)過(guò)前期的一系列交流和探索后,雙方很快就在春節(jié)后正式確立了項(xiàng)目:即利用 AI 幫助中國(guó)天眼 FAST 處理每天接收到的龐大數(shù)據(jù)量,并通過(guò)視覺(jué) AI 分析找到脈沖星線(xiàn)索。
李菂老師告訴雷鋒網(wǎng):
“首先,科學(xué)家捕捉到的脈沖星發(fā)出的射電信號(hào),其實(shí)是一個(gè)對(duì)電磁場(chǎng)的高速采樣。通過(guò)信號(hào)處理和頻譜分析,得到的是一個(gè)視頻流,也就是動(dòng)態(tài)譜。衡量的一個(gè)維度是時(shí)間,另一個(gè)維度是頻率。不過(guò),這種頻率非???,通常人眼和人腦是沒(méi)有辦法處理的,實(shí)際上包括計(jì)算機(jī)視覺(jué),如今處理的絕大多數(shù)情況是靜態(tài)的照片。
從70年代脈沖星首次被驗(yàn)證時(shí),大家就在沿用類(lèi)似的方式,將視頻流一段一段截取出來(lái),但截出來(lái)的采樣量還是太大了。因此,我們需要再做進(jìn)一步的信息提取,最終會(huì)形成各種類(lèi)型的特征圖,給科研工作者進(jìn)行判斷。”
復(fù)雜的圖像數(shù)據(jù)
優(yōu)圖實(shí)驗(yàn)室在這個(gè)過(guò)程中做的,其實(shí)就是將交給科研工作者判斷的特征圖,交給機(jī)器來(lái)處理判斷。當(dāng)然這部分特征圖也是經(jīng)過(guò)處理后的適合計(jì)算機(jī)視覺(jué)領(lǐng)域處理的圖像數(shù)據(jù)。
騰訊優(yōu)圖實(shí)驗(yàn)室副總經(jīng)理黃飛躍向雷鋒網(wǎng)指出:
“一般來(lái)講不管是人眼還是機(jī)器視覺(jué)都有可能漏掉(星星)。但首先漏掉了可能我們也沒(méi)有辦法知道;其次我們現(xiàn)在更多關(guān)注的是準(zhǔn)確率,畢竟要處理的數(shù)據(jù)量太大了,存量數(shù)據(jù)都還沒(méi)有處理完。現(xiàn)在首要是先把容易找的先找到,漏掉一些沒(méi)有關(guān)系,之后再進(jìn)行進(jìn)一步的細(xì)篩?!?/p>
這個(gè)過(guò)程就好比是粗篩和預(yù)處理,利用AI的方式解決掉(如針對(duì)缺少標(biāo)注數(shù)據(jù)問(wèn)題,采用了小樣本學(xué)習(xí)、遷移學(xué)習(xí)方法),然后留下的少部分樣本,再經(jīng)過(guò)人工再次比對(duì)確認(rèn)。從整個(gè)流程的效率和識(shí)別的準(zhǔn)確率上都有比較高的提升。
從結(jié)果來(lái)看,F(xiàn)AST一周產(chǎn)生的數(shù)據(jù),大約相當(dāng)于3000 萬(wàn)張信號(hào)圖。如果以人工肉眼按照 1 張/秒速度,在不吃不喝不休息的條件下,需要用一年的時(shí)間。如果通過(guò) AI 處理,只需要 3 天時(shí)間就可以處理 FAST 的 1 個(gè)月數(shù)據(jù),極大的節(jié)省了人工時(shí)間成本。
從磨合到共同促進(jìn)
在與優(yōu)圖實(shí)驗(yàn)室合作之前,并不代表天眼FAST沒(méi)有嘗試過(guò)與機(jī)器學(xué)習(xí)等交叉學(xué)科的探究。
“雖然我們是基礎(chǔ)學(xué)科,但它與工業(yè)界能夠做到的技術(shù)是息息相關(guān)的。實(shí)際上,有一小部分關(guān)鍵技術(shù)是從基礎(chǔ)研究的需求里提出的,這是一個(gè)相互促進(jìn)的過(guò)程?!崩钋呎f(shuō)道。
例如,F(xiàn)AST團(tuán)隊(duì)就已經(jīng)普遍在嘗試使用AI技術(shù),F(xiàn)AST團(tuán)隊(duì)中的一位研究員,在2014年就已經(jīng)利用深度學(xué)習(xí)模型找到了脈沖星。但問(wèn)題就在于團(tuán)隊(duì)一般只能獲得到一些公共的工具,他們?nèi)狈Φ恼蔷邆涞讓娱_(kāi)發(fā)的專(zhuān)業(yè)研發(fā)人員和能力。
而與之磨合的優(yōu)圖實(shí)驗(yàn)室其實(shí)也不乏有天文愛(ài)好者,甚至有研究員此前曾針對(duì)天文信號(hào)分析做過(guò)研究。再后來(lái),團(tuán)隊(duì)愈加意識(shí)到計(jì)算機(jī)視覺(jué)等AI技術(shù)對(duì)天文臺(tái)探星工作的可能性。
在黃飛躍看來(lái),“在騰訊內(nèi)部有很多的項(xiàng)目是自下而上進(jìn)行的,很多很小的團(tuán)隊(duì)其實(shí)是因?yàn)榕d趣而產(chǎn)生。如果說(shuō)之前我們解決的是生存問(wèn)題,現(xiàn)在我們解決的是情懷問(wèn)題?!?/p>
騰訊優(yōu)圖實(shí)驗(yàn)室定位于應(yīng)用與研究?jī)刹阶撸阂皇窃谟?jì)算機(jī)視覺(jué)技術(shù)的產(chǎn)業(yè)落地;二是有更多科研性的探索。出于這樣的初衷,實(shí)驗(yàn)室內(nèi)部會(huì)不定期挖掘、探索新的方向。
或許,正是因?yàn)檫@樣的機(jī)緣為雙方接下來(lái)的合作做了良好鋪墊。
實(shí)驗(yàn)室也要理解用戶(hù)
此次大會(huì),我們明顯還看到一個(gè)信號(hào):優(yōu)圖實(shí)驗(yàn)室在AI的規(guī)?;矫骈_(kāi)始形成自己的節(jié)奏。
過(guò)去很長(zhǎng)一段時(shí)間里,互聯(lián)網(wǎng)大廠(chǎng)的AI實(shí)驗(yàn)室更強(qiáng)調(diào)對(duì)前沿技術(shù)的探索,單純拼科研成果,而不是經(jīng)濟(jì)效益。
大會(huì)現(xiàn)場(chǎng),騰訊云副總裁、騰訊優(yōu)圖實(shí)驗(yàn)室總經(jīng)理吳運(yùn)聲宣布推出TI ONE、TI Matrix、TI DataTruth三大AI底層平臺(tái),包括算法開(kāi)發(fā)、模型訓(xùn)練、數(shù)據(jù)標(biāo)注和數(shù)據(jù)處理等一系列開(kāi)發(fā)能力。目前騰訊云已經(jīng)開(kāi)放超過(guò)300項(xiàng)人工智能的能力,超過(guò)50個(gè)人工智能解決方案。
據(jù)騰訊官方介紹,TI ONE提供了一套從數(shù)據(jù)處理、算法開(kāi)發(fā)、模型訓(xùn)練、模型自動(dòng)調(diào)優(yōu)到模型在線(xiàn)推理服務(wù)、離線(xiàn)批量預(yù)測(cè)發(fā)布的一站式 AI 開(kāi)發(fā)平臺(tái);TI Matrix靈活組合多項(xiàng)AI關(guān)鍵能力,打通了AI從模型到業(yè)務(wù)落地“最后一公里”;TI DataTruth是一款數(shù)據(jù)標(biāo)注平臺(tái),可提升數(shù)據(jù)采集和數(shù)據(jù)標(biāo)注能力。
從列舉的一些案例中,不難發(fā)現(xiàn):從過(guò)去的消費(fèi)互聯(lián)網(wǎng)領(lǐng)域,到如今工業(yè)、金融、傳媒等產(chǎn)業(yè)互聯(lián)網(wǎng)領(lǐng)域,都已經(jīng)有了騰訊優(yōu)圖落地的身影。
在吳運(yùn)聲看來(lái),過(guò)去幾年騰訊優(yōu)圖在落地產(chǎn)業(yè)的改造上更像是“打了一些釘子,這是必要的,但也都是單點(diǎn),想要形成規(guī)模化還是有一定難度的?!?/p>
這說(shuō)明:實(shí)驗(yàn)室更加從用戶(hù)視角開(kāi)始理解問(wèn)題。
在會(huì)后的媒體對(duì)話(huà)中,吳運(yùn)聲提到,
“目前技術(shù)落地到行業(yè)的一個(gè)很大挑戰(zhàn)就是行業(yè)知識(shí)的不了解。在過(guò)去,很多AI科研人員如果不了解行業(yè),做出來(lái)的東西跟行業(yè)的需求始終有一個(gè)隔閡在。比如我們內(nèi)部實(shí)驗(yàn)室評(píng)測(cè)的各項(xiàng)指標(biāo)都很好,但就是很難落地到行業(yè)。因此,我們需要跟隨行業(yè)專(zhuān)家進(jìn)行非常深入的迭代性交流和技術(shù)解決,才能讓實(shí)驗(yàn)的結(jié)果變得真正可用。”
當(dāng)科研與應(yīng)用不再?zèng)_突
與之相呼應(yīng)的是,與上述天眼FAST項(xiàng)目的合作,其實(shí)是騰訊科技向善的一個(gè)標(biāo)桿案例。
這與我們所在乎的AI助力行業(yè)究竟是不是一種矛盾?
吳運(yùn)聲表示,“騰訊做每一件事情不一定都是要考慮短期的經(jīng)濟(jì)價(jià)值,還要考慮對(duì)社會(huì)價(jià)值的長(zhǎng)遠(yuǎn)影響。實(shí)際上,與天文臺(tái)的交流與合作中,我們也會(huì)發(fā)現(xiàn),利用多模態(tài)技術(shù)解決探星問(wèn)題是一個(gè)比較好的思路。實(shí)際上這對(duì)我們自身的底層技術(shù)得到打磨也會(huì)帶來(lái)良好的影響。”
其實(shí),觀察騰訊各大科技實(shí)驗(yàn)室近段時(shí)間的表現(xiàn),你會(huì)發(fā)現(xiàn):它們開(kāi)始主動(dòng)出擊,頻繁與云業(yè)務(wù)等各部門(mén)聯(lián)動(dòng)起來(lái),作為整體解決方案打包出去的同時(shí),也會(huì)為了落地要行業(yè)、要場(chǎng)景,為了規(guī)?;性颇芰Φ闹?。
仰望星空,但同時(shí)也要腳踏實(shí)地。實(shí)打?qū)嵉乜吹叫┬Ч?、成果,才是激?lì)這群科研工作者的最強(qiáng)動(dòng)力。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。