丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
醫(yī)療AI 正文
發(fā)私信給任平
發(fā)送

0

「霰彈槍測(cè)序法」推動(dòng)者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

本文作者: 任平 2023-04-20 10:43
導(dǎo)語:時(shí)來天地皆同力,運(yùn)去英雄不自由。

姜濤是極少數(shù)能同時(shí)把計(jì)算機(jī)理論和生物學(xué)都做好的學(xué)者。

近四十年的工作學(xué)習(xí)生涯中,姜濤最初并非從事生物信息學(xué)工作,而是研究計(jì)算機(jī)理論和算法。

直到1995年,他獲得首次學(xué)術(shù)休假,決定利用機(jī)會(huì)拜師Richard M. Karp。人類史上規(guī)模最宏大的跨國(guó)跨學(xué)科工程人類基因組計(jì)劃進(jìn)行之際,就連Karp這樣享譽(yù)國(guó)際的計(jì)算理論界泰斗都投身其中。

就這樣,姜濤走上生信道路,新世紀(jì)后又參與了第二次生命科學(xué)浪潮——基因芯片設(shè)計(jì)與應(yīng)用。

43歲,姜濤當(dāng)選美國(guó)科學(xué)促進(jìn)會(huì)會(huì)士(AAAS Fellow),又在一年后接連升任UCR校長(zhǎng)講座教授和計(jì)算機(jī)協(xié)會(huì)會(huì)士(ACM Fellow)。1988年博士畢業(yè)至今,姜濤發(fā)表了超300篇論文,高產(chǎn)期一年多達(dá)18篇。

「霰彈槍測(cè)序法」推動(dòng)者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

回顧這一路的發(fā)展軌跡, 姜濤認(rèn)為自己多少帶有些運(yùn)氣成分,“個(gè)人成就總是離開不科學(xué)發(fā)展大環(huán)境,如此才能保證科研工作的影響力及可持續(xù)性?!?/p>

但換句話說,那又何嘗不是時(shí)勢(shì)造英雄,即所謂“時(shí)來天地皆同力,運(yùn)去英雄不自由?!?br/>

中科大,學(xué)術(shù)的春天

1958年,蘭州市郊北山之麓,一座新學(xué)校拔地而起。

此處黃土光裸、風(fēng)沙肆虐,來人無不嘆句荒涼。

原來,在鐵道部的領(lǐng)導(dǎo)下,唐山鐵道學(xué)院、北京鐵道學(xué)院兩所學(xué)校(部分系所及員工)遷至于此,組建起了這所新的“蘭州鐵道學(xué)院”,也就是后來的蘭州交通大學(xué)。

“西部大開發(fā)”,一個(gè)充滿了時(shí)代性的口號(hào),將許多人的一生留在了那里。姜濤的父母就是如此,他們隨唐山鐵道學(xué)院西遷至蘭州,把家安在了大西北,并養(yǎng)育了一對(duì)兒女。

上世紀(jì)70年代,我國(guó)部分地區(qū)的中學(xué)學(xué)制為四年(初高中各兩年),等到姜濤1979年考入中科大時(shí),也僅僅16歲出頭。在當(dāng)時(shí)平均年齡為16.7歲的同級(jí)學(xué)生中,姜濤比中科大少年班的學(xué)生也大不了多少。

實(shí)際上,姜濤完全有機(jī)會(huì)參加1977年的高考,當(dāng)時(shí)已通過了省里的高考預(yù)考,但姜濤自覺書沒讀夠,便拖到了兩年后。兜兜轉(zhuǎn)轉(zhuǎn),姜濤回到了老家安徽。

「霰彈槍測(cè)序法」推動(dòng)者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月


1984年,姜濤(左二)在中科大畢業(yè)時(shí)和室友合影

1978年3月,時(shí)任中科大校長(zhǎng)的郭沫若在全國(guó)科學(xué)大會(huì)上發(fā)表了演講《科學(xué)的春天》,鼓勵(lì)全國(guó)的青少年學(xué)習(xí)當(dāng)代科學(xué)技術(shù),打破陳規(guī),披荊斬棘,開拓我國(guó)科學(xué)發(fā)展的道路。

這篇激情洋溢的演講令姜濤深受震撼,時(shí)隔四十余年,他仍然形容那篇演講是“詩一樣的鼓舞”。

同樣在1978年,作家徐遲在《人民文學(xué)》發(fā)表了報(bào)告文學(xué)《哥德巴赫猜想》,這篇講述數(shù)學(xué)家陳景潤(rùn)成長(zhǎng)與研究經(jīng)歷的文章一經(jīng)問世就引起了熱烈反響。全國(guó)各地報(bào)紙、廣播電臺(tái)紛紛全文轉(zhuǎn)載和連續(xù)廣播,在當(dāng)時(shí)掀起了崇尚科學(xué)的熱潮。

1979年,來自西部黃土高坡的姜濤,與來自江蘇張家港的周耀旗(現(xiàn)任深圳灣實(shí)驗(yàn)室系統(tǒng)與物理生物學(xué)研究所副所長(zhǎng))一起進(jìn)入了中科大,還差點(diǎn)成了同班同學(xué)。

周耀旗曾介紹,1979年的高考化學(xué)科目非常難,他在這門科目上發(fā)揮得卻不錯(cuò),因?yàn)檫@個(gè)優(yōu)勢(shì)填報(bào)了中科大的近代化學(xué)系。

姜濤原本的計(jì)劃也是學(xué)習(xí)化學(xué)專業(yè)。他的母親曾在蘭州鐵道學(xué)院給排水系執(zhí)教,研究水環(huán)境等相關(guān)課題,化學(xué)知識(shí)背景深厚。在母親的耳濡目染下,姜濤的高考化學(xué)成績(jī)非常優(yōu)異。但在改革開放后,中國(guó)半導(dǎo)體產(chǎn)業(yè)逐漸進(jìn)入全面復(fù)蘇階段,中科大無線電電子學(xué)系(現(xiàn)名為電子工程與信息科學(xué)系)成為了全國(guó)教育重心。

著名電子學(xué)家、時(shí)任中國(guó)科學(xué)院電子學(xué)研究所所長(zhǎng)顧德歡先生出任首任系主任。姜濤談到,“從實(shí)用性方面考慮,父母更鼓勵(lì)我選擇無線電系?!?/p>

那時(shí),中科大各院系一直延續(xù)著“五年制+大一不分專業(yè)”的教學(xué)模式。入學(xué)第二年,姜濤選擇了計(jì)算機(jī)專業(yè)。1982年,計(jì)算機(jī)專業(yè)獨(dú)立建系,不再隸屬于無線電系,姜濤也在這一年結(jié)束了長(zhǎng)達(dá)三年的基礎(chǔ)課程學(xué)習(xí),開始進(jìn)行專業(yè)課學(xué)習(xí)。

受時(shí)代所限,即便是中科大這樣的高校,在七、八十年代能夠提供給學(xué)生的上機(jī)機(jī)會(huì)也十分有限。姜濤描述,“只好把主要精力放在基礎(chǔ)學(xué)科上,一邊學(xué)習(xí)數(shù)學(xué)、物理、化學(xué)的課程,一邊排隊(duì)等待上機(jī)。”

一天,數(shù)學(xué)系的王樹禾前來教授圖論課,還是穿著他那件發(fā)皺的藍(lán)色中山裝。在姜濤的記憶中,王老師有科大組合數(shù)學(xué)四大天王之一的美譽(yù),他編撰的《圖論》深入淺出、鞭辟入里,被計(jì)算機(jī)系選為教材。

但更重要的是,他每堂課總是特意查找有關(guān)數(shù)學(xué)家的生平,為枯燥的內(nèi)容增色不少。

「霰彈槍測(cè)序法」推動(dòng)者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月


王樹禾、李炯生、陶懋頎、李喬(從左到右),在中科大被稱為組合與圖論四大天王

那堂課結(jié)束后,姜濤很快便找到了一個(gè)可行的科研方案——理論研究,從自己擅長(zhǎng)的數(shù)學(xué)與算法入手。

后來,在王樹禾教授的鼓勵(lì)之下,他便將目標(biāo)確定為一個(gè)懸而未決的圖論問題:哈約斯猜想(Hajós' Conjecture)。實(shí)際上,這個(gè)猜想早在1961年就由法國(guó)數(shù)學(xué)家哈約斯(Hajos, G.)提出,簡(jiǎn)單來說,就是如何將一個(gè)圖拆分成少量不相交的圈。

經(jīng)過半年的研究,盡管姜濤沒有完全解決這一問題,但他至少在平面圖的范圍內(nèi)證明了哈約斯猜想。后來這一成果于1984年發(fā)表在中科大的學(xué)報(bào)上,是姜濤為數(shù)不多的中文研究成果,也成為了他競(jìng)爭(zhēng)郭沫若獎(jiǎng)學(xué)金的重要成績(jī)。

值得一提的是,由于新中國(guó)此前從未設(shè)立過學(xué)金,只有“助困”性質(zhì)的人民助學(xué)金,郭沫若獎(jiǎng)學(xué)金也被視為“新中國(guó)第一獎(jiǎng)學(xué)金”,更被無數(shù)科大學(xué)子視為夢(mèng)寐以求的最高獎(jiǎng)。

1982年開春,學(xué)校隆重舉行1981年度郭沫若獎(jiǎng)學(xué)金獲得者、三好學(xué)生、優(yōu)秀學(xué)生干部授獎(jiǎng)大會(huì)。獲獎(jiǎng)?wù)哂薪獫字囟鳎ㄇ迦A大學(xué)經(jīng)濟(jì)管理學(xué)院院長(zhǎng))。

對(duì)姜濤而言,這是他學(xué)術(shù)生涯的起點(diǎn)。

選錯(cuò)學(xué)校、自掙學(xué)費(fèi),一份轟動(dòng)性的計(jì)算機(jī)成果

姜濤的出國(guó)經(jīng)歷堪稱曲折。1984年,姜濤與周耀旗同年畢業(yè)。

相比之下,周耀旗獲得了國(guó)家公派留學(xué)的名額,在中山大學(xué)進(jìn)行一年集訓(xùn)后順利出國(guó)。而姜濤所在的計(jì)算機(jī)系,在中國(guó)仍是一個(gè)新興學(xué)科,并不屬于多個(gè)公派留學(xué)的計(jì)劃覆蓋范圍之內(nèi)。

于是,姜濤準(zhǔn)備“曲線出國(guó)”——報(bào)考清華大學(xué)的研究生,爭(zhēng)取已分到清華的日本留學(xué)名額。

可在準(zhǔn)備考試之前,中科大計(jì)算機(jī)系公布了公派留學(xué)計(jì)劃——從應(yīng)屆畢業(yè)生中選拔一些優(yōu)秀學(xué)生出國(guó)留學(xué),畢業(yè)后回到中科大任教。盡管一番折騰,姜濤最終拿到了留學(xué)名額,并通過了英語考試。

出國(guó)在望,手續(xù)卻不太順利。

這項(xiàng)留學(xué)計(jì)劃原本啟動(dòng)時(shí)間就比較晚,且當(dāng)時(shí)國(guó)內(nèi)的計(jì)算機(jī)科學(xué)底蘊(yùn)尚淺,姜濤與國(guó)外幾所高校溝通留學(xué)事宜都沒有成功。原定于1984年秋天啟程的留學(xué)之旅,便拖了下來。

經(jīng)過漫長(zhǎng)的等待,兩封來自美國(guó)的錄取通知姍姍而來,一封來自馬里蘭大學(xué),另一封來自明尼蘇達(dá)大學(xué)。這兩所學(xué)校都被是公立名校,但相比較而言,馬里蘭大學(xué)的計(jì)算機(jī)專業(yè)排名要更靠前。

然而,那個(gè)年代信息流通緩慢,姜濤找來的一份美國(guó)大學(xué)計(jì)算機(jī)科學(xué)專業(yè)的排名(Gourman Report),顯示明尼蘇達(dá)優(yōu)于馬里蘭。所以,拿著這份“過時(shí)”的排名,1985年初,姜濤去往明尼蘇達(dá)大學(xué)。

「霰彈槍測(cè)序法」推動(dòng)者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

1986年于明尼蘇達(dá)大學(xué)

作為中科大計(jì)算機(jī)系的公派留學(xué)生,姜濤這一批學(xué)子擔(dān)負(fù)著學(xué)成歸國(guó)任教的任務(wù)。在挑選專業(yè)時(shí),姜濤站在學(xué)校和國(guó)家更需要的角度考慮,選擇了當(dāng)時(shí)國(guó)內(nèi)尚未開設(shè)的軟件工程專業(yè)。

一段時(shí)間后,姜濤發(fā)現(xiàn)軟件工程專業(yè)的很多課程自己沒有學(xué)過,很難跟上進(jìn)度。加上當(dāng)年在科大排隊(duì)上機(jī)的經(jīng)歷,讓他在編程功底上欠缺太多,于是決定轉(zhuǎn)向其他研究方向——計(jì)算機(jī)理論。

當(dāng)時(shí)的明尼蘇達(dá)大學(xué)計(jì)算機(jī)系中,這個(gè)方向的老師并不多,姜濤選擇了其中一位美籍菲律賓教授Oscar Ibarra。這位教授當(dāng)時(shí)正在進(jìn)行晶格自動(dòng)機(jī)(cellular automata,作為并行計(jì)算的一個(gè)基本模型)的研究.因此,姜濤博士階段的研究主要圍繞這一主題進(jìn)行。

生計(jì)問題是姜濤在留學(xué)期間的另一重壓力。

國(guó)家資助了姜濤留學(xué)第一年的學(xué)費(fèi)與生活費(fèi),次年開始所有的開銷都要自己承擔(dān)。于是姜濤選擇了在當(dāng)時(shí)最適合學(xué)生做的兼職——擔(dān)任學(xué)校的教學(xué)助理與科研助理,獲取獎(jiǎng)學(xué)金。讀博士期間,姜濤有一半的時(shí)間在做教學(xué)助理,另一半的時(shí)間在做科研助理。

1987年,姜濤在晶格自動(dòng)機(jī)通訊復(fù)雜度研究上取得了初步成果,開始參加國(guó)際學(xué)術(shù)會(huì)議;1988年,攻讀博士學(xué)位不到四年的姜濤已經(jīng)達(dá)到了畢業(yè)標(biāo)準(zhǔn)。

畢業(yè)前夕,姜濤參加在華盛頓特區(qū)舉行的IEEE Structure in Complexity Theory年會(huì)時(shí),結(jié)識(shí)了會(huì)議的一位“圈內(nèi)人物”——李明。

李明已經(jīng)博士后畢業(yè),在美國(guó)任教,和姜濤一樣是一位純粹的計(jì)算機(jī)理論研究者,與生物學(xué)的緣分尚未來臨。但這次的會(huì)面為二人在加拿大重逢,成為關(guān)系密切的朋友與合作伙伴,共同研究生物信息學(xué)埋下了伏筆。

二十世紀(jì)八十年代末,留學(xué)生想要留美任教手續(xù)十分繁瑣,難以獲得簽證,畢業(yè)后往往要先離開美國(guó)一段時(shí)間,再回去才能應(yīng)聘教職。作為北美州唯二的兩個(gè)發(fā)達(dá)國(guó)家,加拿大與美國(guó)毗鄰,二者的社會(huì)文化環(huán)境、科研條件等都較為相似,幾所杰出的高校也具有很好的科研基礎(chǔ)。

在美國(guó)簽證發(fā)放不斷收緊的情況下,姜濤前往加拿大的麥克馬斯特大學(xué)任教,李明也離開了美國(guó)前往加拿大工作,先后入職約克大學(xué)與滑鐵盧大學(xué),和姜濤所在的麥克馬斯特大學(xué)車程不到一小時(shí)。

「霰彈槍測(cè)序法」推動(dòng)者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

1994年,姜濤(居中)在麥克馬斯特大學(xué)的科研團(tuán)隊(duì)

初到加拿大,姜濤在當(dāng)?shù)氐挠?jì)算機(jī)理論領(lǐng)域“舉目無親”,不遠(yuǎn)處的李明既是老鄉(xiāng),又是在美國(guó)求學(xué)時(shí)的舊相識(shí),自然而然地來往密切起來。

“對(duì)我來說,李明是一位兄長(zhǎng),我在工作上得到了很多他的幫助和提攜。”

李明比姜濤年長(zhǎng)幾歲,向來不吝惜向姜濤傳授自己的科研經(jīng)驗(yàn),甚至于后來姜濤轉(zhuǎn)向生物信息學(xué)的研究也與李明的鼓勵(lì)密分不開。除此之外,兩人在Kolmogorov complexity理論在計(jì)算復(fù)雜性及算法平均復(fù)雜性分析中的應(yīng)用方面也有多項(xiàng)合作,并解決了多個(gè)著名難題。

二十世紀(jì)九十年代初,在李明的激勵(lì)下,姜濤參與到人類基因組計(jì)劃中的一個(gè)重要測(cè)序方法——霰彈槍測(cè)序法的研究之中。其中一個(gè)相關(guān)的重要問題是:當(dāng)給定一組字符串后,怎樣計(jì)算它們的最短公共超串(shortest superstring)。

姜濤首次得到了一個(gè)著名算法的線性逼近分析。后來,團(tuán)隊(duì)中又加入了來自荷蘭CWI的John Tromp、 MIT的Avrim Blum、貝爾實(shí)驗(yàn)室的Mihalis Yannakakis三位學(xué)者,合作發(fā)布了一篇STOC論文《 Linear approximation of shortest superstrings》,在當(dāng)時(shí)的計(jì)算機(jī)理論領(lǐng)域引起了強(qiáng)烈反響,帶動(dòng)了一大批做算法的學(xué)者研究這一問題。

「霰彈槍測(cè)序法」推動(dòng)者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

2006年,姜濤(右一)和李明(左一)合影

可以說,霰彈槍測(cè)序法是姜濤的生物信息學(xué)入門之作。

1994年,姜濤和他在麥克馬斯特大學(xué)的第一個(gè)博士生王魯生,以及加州大學(xué)伯克利分校的Eugene Lawler教授(著名組合數(shù)學(xué)家;已故),合作開發(fā)了一個(gè)關(guān)于多序列比對(duì)的快速近似算法。

這一算法在當(dāng)時(shí)引起不小的震動(dòng)。不少本領(lǐng)域的權(quán)威人士,如Pavel Pevzner、Eugene Myers、Webb Miller等都認(rèn)為“這個(gè)結(jié)果既 surprising ,又非常deep”,并被寫進(jìn)多本生物信息學(xué)教科書。

1995年,姜濤和王魯生以及另一位在加拿大西安大略大學(xué)的張凱中教授合作,一起開發(fā)了一種比較樹結(jié)構(gòu)的方法,稱為“樹比對(duì)”,并于當(dāng)年發(fā)表。這種方法較傳統(tǒng)樹結(jié)構(gòu)比較方法(樹編輯)在計(jì)算上有多種優(yōu)越性,所以也在生物信息領(lǐng)域之外(如數(shù)據(jù)庫查詢,XML數(shù)據(jù)處理等)得到廣泛應(yīng)用。

這一研究的份量在姜濤看來不輕,因?yàn)殚L(zhǎng)期以來生物信息學(xué)總是借鑒其他領(lǐng)域的方法,如,機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、自然語言、圖像處理,“而它是為數(shù)不多的,將生物信息學(xué)方法推廣到其它領(lǐng)域的范例之一”。

這是姜濤從計(jì)算復(fù)雜性理論轉(zhuǎn)向算法研究的分水嶺,卻不能算是他進(jìn)入生物信息學(xué)領(lǐng)域的標(biāo)志,“這時(shí)候我還從還沒有真正看過生物數(shù)據(jù),只是做了一些算法問題?!?/p>

直到1995年學(xué)術(shù)休假時(shí),李明建議姜濤,“生物信息學(xué)現(xiàn)在非常重要,我們應(yīng)該盡早涉入。”

拜師計(jì)算機(jī)理論大佬

出于對(duì)李明的信任和尊敬,姜濤決定利用學(xué)術(shù)休假學(xué)習(xí)生物信息學(xué)。

1995年,姜濤利用一年的學(xué)術(shù)休假“拜師”Richard M. Karp。Karp(1985年圖靈獎(jiǎng)獲得者)是一位計(jì)算機(jī)理論、算法領(lǐng)域的大師,一生有諸多傳奇。1968年,他離開工作十年的IBM沃森研究中心,前往加州大學(xué)伯克利分校(UC Berkeley)工作。

那里是計(jì)算機(jī)科學(xué)理論的一個(gè)著名研究中心,Stephen Cook(1982年圖靈獎(jiǎng)獲得者)、Manuel Blum(1995年圖靈獎(jiǎng)獲得者) 、姚期智(2000年圖靈獎(jiǎng)獲得者)等一批知名學(xué)者都先后在此任教,學(xué)術(shù)氣氛十分濃厚。

不過,這樣一位計(jì)算機(jī)科學(xué)界的頂級(jí)大佬,在90年代初期來了一個(gè)“大轉(zhuǎn)彎”——將研究重心移到了生物信息學(xué)領(lǐng)域。

這在學(xué)術(shù)圈是轟動(dòng)性的大事。很多學(xué)者猜測(cè)是由于HGP(人類基因組計(jì)劃)的啟動(dòng),使得Karp看到了計(jì)算科學(xué)在基因組測(cè)序及分析方面的潛力。沒過多久,Karp本人就親自證實(shí)了這一猜測(cè)。

姜濤是最早得知Karp研究變動(dòng)的人。1995年,在姜濤發(fā)去拜師郵件后,很快便收到了Karp的回信:“我即將搬去華盛頓大學(xué)(西雅圖),你有沒有興趣同往?”

1993年,人類基因組計(jì)劃的發(fā)展如潮水般兇猛,自動(dòng)化基因測(cè)序儀的誕生推動(dòng)HGP進(jìn)入了實(shí)質(zhì)性的運(yùn)作階段。1994年,3000個(gè)(原計(jì)劃為600- 1500) 標(biāo)簽分辨率為1CM (即1%重組率)的遺傳圖譜的繪制,標(biāo)志著HGP進(jìn)入一個(gè)新階段——物理圖譜繪制階段。

Karp之所以要?jiǎng)由砣ネ餮艌D,一個(gè)重要原因是HGP的研究中心之一設(shè)在了“西雅圖華盛頓大學(xué)基因組測(cè)序中心”?,F(xiàn)在,有一個(gè)機(jī)會(huì)擺在姜濤面前。

這個(gè)中心里,領(lǐng)導(dǎo)者是物理圖譜領(lǐng)軍人士及人類基因組計(jì)劃發(fā)起人之一Maynard Olson,具體合作者包括Gane Wong及于軍,大家共同創(chuàng)立了當(dāng)時(shí)世界上最嚴(yán)謹(jǐn)、精確、系統(tǒng)的基因組物理圖譜制作方法——多酶完全水解物理圖譜,還將其用于規(guī)?;锢韴D譜制作,并為基于克隆的DNA測(cè)序提供直接材料。

那時(shí)候姜濤還沒到35歲,但覺得時(shí)間過得飛快。這是一段繪制人類DNA圖譜的“軍備競(jìng)賽”,醫(yī)藥公司以及私營(yíng)企業(yè)實(shí)驗(yàn)室加入競(jìng)爭(zhēng),迫使人類基因組計(jì)劃陷入一場(chǎng)瘋狂角逐。

姜濤逐漸認(rèn)識(shí)到,“在生物學(xué)問題里,不能再為了做出漂亮的算法而只關(guān)注簡(jiǎn)化后的數(shù)學(xué)問題,必須直面所有真實(shí)的生物數(shù)據(jù)?!?/p>

如今,姜濤仍對(duì)那段經(jīng)歷印象深刻,很大一部分原因是此前他從未脫離老本行,即便是合作一些生物課題,也是將自己定義為一名計(jì)算機(jī)理論學(xué)者。

Karp看出了姜濤的疑慮,臨別之際他送給了姜濤一句話,“沒有關(guān)系,都是科學(xué),不要太關(guān)注領(lǐng)域的界限。”

「霰彈槍測(cè)序法」推動(dòng)者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

姜濤與Richard Manning Karp教授

重回麥克馬斯特大學(xué),姜濤趕上了被譽(yù)為“加拿大基因組計(jì)劃”的CGAT項(xiàng)目(Canadian Genome Analysis and Technology)。該項(xiàng)目計(jì)劃耗資2200萬美元,為期5年,用以資助加拿大學(xué)者從人類染色體圖譜繪制和小鼠免疫系統(tǒng)基因測(cè)序,到社會(huì)問題研究的所有項(xiàng)目。

姜濤與李明再續(xù)合作,順利申請(qǐng)到第一批經(jīng)費(fèi),約十幾萬加元。

姜濤稱,“盡管這筆經(jīng)費(fèi)并不算多,但提供了認(rèn)真去做生物信息學(xué)的良機(jī)。”

不過,加拿大啟動(dòng)基因組計(jì)劃,只是HGP推動(dòng)各國(guó)參與生命科學(xué)大討論的冰山一角。

自1999年以來,伴隨著測(cè)序儀的改進(jìn)和新的用于組裝和注釋軟件的開發(fā),人類基因組測(cè)序已在全球數(shù)十個(gè)主要研究中心全面展開。這也意味著,HGP培育了一種新的科學(xué)研究協(xié)作文化。

1999年,姜濤去往美國(guó)加州大學(xué)河濱分校(University of California - Riverside,UCR),任計(jì)算機(jī)科學(xué)與工程系教授。對(duì)于這次任職,姜濤一是想認(rèn)真做生物信息學(xué),二是加強(qiáng)與生物學(xué)背景的學(xué)者合作。

因此,即使李明已經(jīng)邀請(qǐng)他去往滑鐵盧大學(xué)任職,但考慮到河濱分校擁有世界級(jí)水平的植物系,姜濤還是選擇了后者。

他講到,“我在工作面試中能感覺到,該校的教授們非常愿意和計(jì)算背景的人合作?!笔孜幌蚪獫斐鲩蠙熘Φ木褪且晃恢参镞z傳學(xué)大咖——?jiǎng)偵先蜺CR自然科學(xué)與農(nóng)學(xué)院長(zhǎng)不久的Michael T. Clegg教授。

「霰彈槍測(cè)序法」推動(dòng)者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

Michael T. Clegg教授

Clegg希望在任期內(nèi)完成一件事:重振正在衰退的統(tǒng)計(jì)系,發(fā)展新興學(xué)科。

因此,他對(duì)生物信息學(xué)很感興趣。姜濤的到來讓他看到了希望,兩人迅速討論決定合作研究一些植物基因的遺傳機(jī)制并全面分析植物基因組中的各種重復(fù)序列。

經(jīng)歷了半年的前期準(zhǔn)備工作,2000年,兩人與當(dāng)時(shí)剛搬到加州大學(xué)圣巴巴拉分校的李明合作,成功申請(qǐng)到了NSF-ITR第一批大規(guī)模項(xiàng)目。

對(duì)他們來說,此舉相當(dāng)有振奮意義。“這個(gè)項(xiàng)目不僅是由美國(guó)國(guó)家科技署發(fā)起的支持信息技術(shù)優(yōu)先領(lǐng)域的特殊項(xiàng)目,而且第一批大規(guī)模項(xiàng)目的命中率不到1%,結(jié)果還是由白宮直接官宣?!?/p>

毫無疑問,姜濤也借此打響了在美國(guó)任教的第一槍。

“算法是終身興趣,生信是一生事業(yè)”

今年是姜濤在河濱分校任教的第23個(gè)年頭。這些年里,姜濤發(fā)表論文300余篇,是一位名副其實(shí)的“多產(chǎn)型學(xué)者”,也是一位炙手可熱的“合作者”。

2001年,姜濤被第二位合作對(duì)象“鎖定”,植物病理系的James Borneman教授。

Borneman是一位微生物學(xué)家,多年來一直與多個(gè)實(shí)驗(yàn)室合作,希望了解微生物在病原體和疾病中的作用。

當(dāng)時(shí)他敏銳地注意到,“DNA微芯片技術(shù)”正成為各國(guó)學(xué)術(shù)界和工業(yè)界研究和開發(fā)的熱點(diǎn),尤其在1998年6月29日美國(guó)宣布正式啟動(dòng)“基因芯片計(jì)劃”,聯(lián)合私人投資機(jī)構(gòu)投入了20億美元以上的研究經(jīng)費(fèi)后,以基因芯片為核心的相關(guān)產(chǎn)業(yè)迅速在全球崛起。

這對(duì)Borneman來說無疑是他從事微生物研究的最佳窗口期。他難掩激動(dòng),“這場(chǎng)研究消除了人工培養(yǎng)微生物的環(huán)節(jié),將推動(dòng)我們研究成千上萬的微生物。”

所以,對(duì)于這場(chǎng)“豪賭”,Borneman必須選對(duì)團(tuán)隊(duì)。

他注意到,姜濤的豐富算法研究經(jīng)驗(yàn)將對(duì)芯片探針的設(shè)計(jì)至關(guān)重要,加上他在生物信息學(xué)中的積累,正是此次項(xiàng)目的最佳合作人選。

在姜濤的幫助下,系里的熱衷于算法的同事Marek Chrobak也加入進(jìn)來。

這是一位波蘭學(xué)者,早年工作與姜濤在加拿大時(shí)從事的計(jì)算復(fù)雜性分析有不少交集,此次姜濤親自邀請(qǐng)自然是熱情接受,姜濤因此感慨,“我來UCR做起了生物信息學(xué),至少系里有一個(gè)人能夠理解自己?!?/p>

緊接著Della Vedova Gianluca(來自Milan Bicocca University的一位訪問學(xué)生)、UCR博士生Andres Figueroa的加入,五人團(tuán)隊(duì)的人選正式敲定。

「霰彈槍測(cè)序法」推動(dòng)者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

James Borneman、姜濤、Marek Chrobak

2001年,以Borenman教授及姜濤為主導(dǎo)開發(fā)的OFRG技術(shù)(Oligonucleotide Fingerprinting of rRNA Genes),一度成為當(dāng)時(shí)最先進(jìn)的微生物群體分析手段,可以用來分析植物根部土壤中的微生物群體組成。

時(shí)隔多年,姜濤站在更長(zhǎng)遠(yuǎn)的視角上,認(rèn)為“這次研究在基因研究歷史上影響并不大,很快便被大規(guī)模測(cè)序技術(shù)普及所替代”,但值得一提的是,這次研究卻奠定了姜濤此后的一個(gè)研究主線:利用計(jì)算機(jī)科學(xué)的手段解決實(shí)際的生物學(xué)問題。

此后,姜濤頻繁開展相關(guān)領(lǐng)域的合作,其中之一是與同校的分子生物學(xué)家Frances M. Sladek合作。

她多年通過實(shí)驗(yàn)手段研究核受體的調(diào)控機(jī)制,于2002年找到姜濤想通過計(jì)算方法來擴(kuò)大研究范圍,加快研究進(jìn)程。因此二人研究發(fā)明了一種新型馬爾科夫鏈(當(dāng)時(shí)起名為optimized Markov chains,后被人改稱為permutated Markov chains),并建立一個(gè)重要核受體(HNF4a)綁定位點(diǎn)當(dāng)時(shí)最大的數(shù)據(jù)集。

「霰彈槍測(cè)序法」推動(dòng)者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月


2003年,姜濤(紅衣居中)與UCR科研團(tuán)隊(duì)

除此之外,姜濤還趕了一個(gè)“時(shí)髦”。

在RNA-seq技術(shù)出現(xiàn)不久之后,基于RNA-Seq數(shù)據(jù)的轉(zhuǎn)錄組組裝,即從數(shù)百萬個(gè)短讀段中重建所有全長(zhǎng)mRNA轉(zhuǎn)錄本并確定它們的峰度,成為分子生物學(xué)學(xué)界的一大挑戰(zhàn)。

2010年,姜濤和UCR博士生李煒、清華大學(xué)訪問學(xué)生馮建興,共同提出了一個(gè)通過RNA-seq讀段來重建轉(zhuǎn)錄組,并估計(jì)每個(gè)mRNA轉(zhuǎn)錄本(isoforms,也叫基因異構(gòu)體)峰度的算法,稱為Isoinfer,屬于這方面最早的方法之一。

2011年,姜濤與團(tuán)隊(duì)利用數(shù)據(jù)的稀疏性,對(duì)這個(gè)算法做了進(jìn)一步改進(jìn),稱為Isolasso,并得到了更廣泛地應(yīng)用。這一研究的影響是廣泛的、雙重的。

首先,由于下一代測(cè)序(NGS)技術(shù)的快速發(fā)展,及其對(duì)生命科學(xué)和醫(yī)學(xué)的潛在影響,RNA-Seq數(shù)據(jù)分析在生物信息學(xué)中屬于時(shí)興主題。

其次,盡管許多RNA-Seq應(yīng)用程序取得了成功,但在RNA-Seq數(shù)據(jù)分析中仍然存在不少挑戰(zhàn),其中之一來自RNA-Seq讀取中的偏差的理解和處理。

因此,姜濤等人提出的處理RNA-Seq偏差的方法,屬于結(jié)合了統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)和組合算法的技術(shù)典范。

2002年夏天,姜濤開始頻繁回國(guó)訪問并到清華擔(dān)任客座教授,為新世紀(jì)初的中國(guó)生物信息學(xué)事業(yè)做出了重要貢獻(xiàn)。而他做的第一件事,就是和大學(xué)同學(xué)鐘揚(yáng)恢復(fù)了聯(lián)系。

實(shí)際上,兩人自畢業(yè)后已經(jīng)十七年未見。但當(dāng)年鐘揚(yáng)在復(fù)旦大學(xué)研究植物多樣性及進(jìn)化并開始對(duì)生物信息學(xué)發(fā)生興趣。通過同學(xué)關(guān)系聯(lián)系上姜濤后兩人一拍即合,確定了合作關(guān)系,并共同承擔(dān)了國(guó)家基金委第二期“龍星計(jì)劃”生物信息學(xué)在復(fù)旦的授課。

2005年,兩人首次提出了一個(gè)利用基因在基因組上的順序來分析直系同源基因的一個(gè)新方法,解決了同源基因序列極其相似的難題。

「霰彈槍測(cè)序法」推動(dòng)者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

2002年,姜濤與鐘揚(yáng)于虹橋機(jī)場(chǎng),2010年鐘揚(yáng)在姜濤所在的UCR實(shí)驗(yàn)室。

值得一提的是,2002年徐鷹回國(guó)創(chuàng)辦了生物信息國(guó)際研討會(huì)(IBW),不僅打開了國(guó)內(nèi)外學(xué)術(shù)交流的通道,更在此次會(huì)議中討論做出決定:“以后每屆的IBW會(huì)議,都在會(huì)議所在地,開會(huì)前辦五天的龍星計(jì)劃?!?/p>

如此一來,國(guó)內(nèi)生信隊(duì)伍原本各自為營(yíng),但在徐鷹等學(xué)者的努力下聚集起來,有力的推動(dòng)了生物信息學(xué)在國(guó)內(nèi)的發(fā)展,姜濤在此后的很長(zhǎng)時(shí)間里,也成為IBW會(huì)議的“常備軍”。

「霰彈槍測(cè)序法」推動(dòng)者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

第三屆IBW議特邀代表與部分學(xué)生(姜濤在前排左一)

幾乎在同一時(shí)間,2003年,姚期智在清華計(jì)算機(jī)系成立了一個(gè)“計(jì)算機(jī)理論講席教授組”,姜濤成為最早入組的學(xué)者之一。

實(shí)際上,這正是姚期智在清華開創(chuàng)的特殊教育模式。

為培養(yǎng)中國(guó)的計(jì)算機(jī)精英研究生,姚期智希望吸引海外人學(xué)者回國(guó)授課,但每位教授回國(guó)時(shí)間又很有限。

“姚先生想到了當(dāng)時(shí)清華初起的一個(gè)好辦法,成立一個(gè)6-10人講課團(tuán)隊(duì),每個(gè)人講一兩個(gè)月的課,加起來就是一整年的課程,保證了對(duì)學(xué)生培養(yǎng)的連續(xù)性。”

「霰彈槍測(cè)序法」推動(dòng)者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

 姚期智教授

由此,清華的計(jì)算機(jī)學(xué)科第一次集齊了理論、應(yīng)用、系統(tǒng)結(jié)構(gòu)和軟件四大領(lǐng)域的優(yōu)秀學(xué)者,分別為姜濤、鄧小鐵(香港城市大學(xué))、堵丁柱(德州大學(xué)達(dá)拉斯分校)、李明(滑鐵盧大學(xué))、蔡進(jìn)一(威斯康星大學(xué))、尹依群(普林斯頓大學(xué))、滕尚華(波士頓大學(xué))、劉燕虹(紐約大學(xué)石溪分校)、Ko Ker-I(紐約大學(xué)石溪分校)、邵中(耶魯大學(xué))。

到2007年,姚期智建立了清華大學(xué)理論計(jì)算機(jī)科學(xué)研究中心,擴(kuò)招研究生,同時(shí)組建了第二屆講席教授組20人,其中美國(guó)國(guó)家科學(xué)院院士4名、美國(guó)人文科學(xué)院院士2名、美國(guó)國(guó)家工程院院士1名、奈望林納獎(jiǎng)得主2名。

隨著各個(gè)講席教授組在清華的成功,自動(dòng)化系決定成立一個(gè)“計(jì)算生物學(xué)講席教授組”。通過李衍達(dá)院士,張學(xué)工教授及美國(guó)冷泉港實(shí)驗(yàn)室的張奇?zhèn)ィㄖ锌拼?7級(jí))的努力,這一想法很快得到實(shí)現(xiàn)。

2008年5月,清華大學(xué)自動(dòng)化系下的“生物信息學(xué)與系統(tǒng)生物學(xué)講席教授組”正式成立,美國(guó)南加州大學(xué)教授、計(jì)算生物學(xué)奠基人之一Michael S. Waterman教授受聘為講席教授組首席科學(xué)家,講席教授組的成員包括姜濤、張奇?zhèn)?、王永雄、劉軍、孫豐珠(博士師從Waterman),陳挺等著名世界級(jí)學(xué)者。

至此,我國(guó)第一個(gè)生物信息學(xué)與系統(tǒng)生物學(xué)研究中心誕生了。

「霰彈槍測(cè)序法」推動(dòng)者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

2012年長(zhǎng)城上,姜濤(前排左一)與Michael Waterman  (居中白帽者)、張奇?zhèn)ィ◣R者)等清華同事以及學(xué)生合影

近些年來,姜濤長(zhǎng)期在清華大學(xué)訪問,和多位教授合作培養(yǎng)了六名博士生,研究領(lǐng)域主要集中在算法及機(jī)器學(xué)習(xí)方法在生物信息學(xué)領(lǐng)域的應(yīng)用上,尤其是RNA異構(gòu)體功能的預(yù)測(cè)。在與雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))的交流中,姜濤極認(rèn)真地說到,“算法是我的終身興趣,生物信息學(xué)是我一生的事業(yè)。因?yàn)樯蓬I(lǐng)域有大量數(shù)據(jù),包括不同物種的測(cè)序數(shù)據(jù),是機(jī)器學(xué)習(xí)理想的應(yīng)用場(chǎng)景。同時(shí),這一領(lǐng)域缺乏基準(zhǔn)真相(ground truth或標(biāo)簽),又極具有挑戰(zhàn)性。”基于這個(gè)想法,姜濤多年來的研究主線從未出現(xiàn)偏差。這是正是很多計(jì)算機(jī)科學(xué)出身的學(xué)者極為重視的一點(diǎn)。只不過,姜濤的態(tài)度很明確,他是一個(gè)依舊談?wù)摗袄硐搿钡娜?。“我希望建立一個(gè)像基因功能數(shù)據(jù)庫Gene Ontology (GO)一樣的基因異構(gòu)體功能標(biāo)注數(shù)據(jù)庫,并得到廣泛應(yīng)用,讓基因異構(gòu)體之間的功能差異得到更多生物學(xué)家的重視,使得今后我們每當(dāng)談到基因功能時(shí),必想到不同的異構(gòu)體?!睘榱诉@個(gè)理想,姜濤還有很長(zhǎng)的一段路要走。

未知是最大的動(dòng)力

有意思的是,這么多年過去,姜濤一直沒做兩件事,一是管理工作,二是發(fā)朋友圈。

這是姜濤刻意為之。他堅(jiān)持認(rèn)為,自己的性格不適合做管理工作。早在中科大讀書之時(shí),他就已做了取舍:寧可泡在圖書館里找課題做研究,空余時(shí)間在足球場(chǎng)上踢出一身汗,也沒有考慮去競(jìng)爭(zhēng)學(xué)生會(huì)組織工作。

近年來,姜濤的博士生每年穩(wěn)定在五名以上,高峰時(shí)曾經(jīng)到過十來名,他更不考慮謀個(gè)管理職位,而是省出時(shí)間多和學(xué)生一對(duì)一交流。

“你能想象,如果和每個(gè)學(xué)生每周都深聊的話,還是非常忙的?!?/p>

至于朋友圈,他談到,“作為一位理論研究工作者,我寫作的速度跟思考的速度遠(yuǎn)遠(yuǎn)不匹配,所以發(fā)朋友圈對(duì)我來講跟寫論文一樣,是件大事,需要認(rèn)真計(jì)劃。”

但這樣一位學(xué)者,卻對(duì)社會(huì)學(xué)、心理學(xué)很感興趣,總覺得自己的科研和興趣愛好終究會(huì)聯(lián)系在一起。

“當(dāng)年出國(guó)時(shí)基本上對(duì)美國(guó)社會(huì)一無所知,很長(zhǎng)時(shí)間是通過看美劇來了解美國(guó)的家庭及朋友圈文化。

但在美國(guó)生活了這么多年,孩子們長(zhǎng)大以后卻告訴我電視劇所描述的與真實(shí)生活差別還蠻大的?!?/p>

在對(duì)生活和研究上,姜濤的態(tài)度都是一樣,未知是最大的動(dòng)力。

「霰彈槍測(cè)序法」推動(dòng)者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

作者注:

1993年,中國(guó)參與人類基因組計(jì)劃,生物信息學(xué)科迎來大爆發(fā)。在近三十年的時(shí)間里,一大批生物、化學(xué)、物理、計(jì)算等專業(yè)的學(xué)者,前仆后繼加入到學(xué)科的產(chǎn)研建設(shè),那是一個(gè)靈感迸發(fā)、情誼綿長(zhǎng)的年代,也是一個(gè)走出質(zhì)疑、迷茫的年代。

目前,雷峰網(wǎng)啟動(dòng)《生物信息學(xué)的三十年往事》專題,將陸續(xù)推出徐鷹、潘毅、周耀旗、許東、姜濤、張奇?zhèn)?、唐建等新老學(xué)者的人物故事,記錄光輝歲月,以照后人之路。

關(guān)于生物信息學(xué)的更多故事,歡迎與本文作者吳彤交流,微信號(hào):icedaguniang

雷峰網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說