丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
AI+ 正文
發(fā)私信給張利
發(fā)送

1

華大基因BGI Online負責人金鑫主講:基因大數(shù)據(jù)的起源、現(xiàn)狀與未來| 雷鋒網(wǎng)公開課

本文作者: 張利 2017-05-19 09:38 專題:雷峰網(wǎng)公開課
導(dǎo)語:對于人類基因組,我們可能認識了不少單詞,粗略地理解了語法,但還完全不懂斷句,我們對整篇文章一無所知

隨著基因測序價格以超摩爾定律的勢態(tài)下降,其被廣泛應(yīng)用于基因組學(xué)研究、臨床診斷以及多種疾病個性化治療等領(lǐng)域。對此,業(yè)內(nèi)人士認為,當今基因測序行業(yè)面臨最大的挑戰(zhàn)已不再是基因測序技術(shù),而是處理巨大的數(shù)據(jù)量以及如何從巨大數(shù)據(jù)中獲取臨床指導(dǎo)。據(jù)雷鋒網(wǎng)了解,生物信息分析服務(wù)是目前業(yè)界公認的最具發(fā)掘潛力以及盈利能力的環(huán)節(jié),但目前國內(nèi)還處于起步階段。

那么,基因數(shù)據(jù)與其他數(shù)據(jù)有何異同?處理基因數(shù)據(jù)又何難點和挑戰(zhàn)?基因數(shù)據(jù)的未來是怎樣的?本次公開課,雷鋒網(wǎng)AI掘金志欄目邀請了華大基因研發(fā)中心副總監(jiān)金鑫,帶來《基因大數(shù)據(jù)簡史——起源、現(xiàn)狀和未來》的主題演講。

嘉賓介紹:

華大股份研發(fā)中心副總監(jiān)、BGI Online平臺負責人金鑫,華大基因的青年科學(xué)家。

華大基因BGI Online負責人金鑫主講:基因大數(shù)據(jù)的起源、現(xiàn)狀與未來| 雷鋒網(wǎng)公開課

金鑫曾參與了一系列重大科研項目攻堅,包括國際千人基因組計劃、中丹糖尿病基因組計劃、人類泛基因組圖譜計劃、高原基因組計劃,及自閉癥基因組計劃等。早在2009年,金鑫就以在校生的身份在《Nature》子刊《Nature Biotechnology》發(fā)表《構(gòu)建人類泛基因組序列圖譜》,并首次提出了“人類泛基因組”概念。

公開課視頻:

(注:本次公開課中,金鑫博士展示有趣的案例,并回答多個網(wǎng)友精彩問題,所以推薦優(yōu)先觀看視頻。)


以下是金鑫博士演講內(nèi)容,雷鋒網(wǎng)做了不改變原意的編輯:

我是金鑫,來自華大基因,我現(xiàn)在是華大股份研發(fā)中心副總監(jiān),同時也是BGI Online和大數(shù)據(jù)專項的負責人。今天我想跟大家分享的題目是基因數(shù)據(jù)起源、傳承與演化。

我們都說基因是上帝的語言,在說基因之前,我先給大家看一塊石碑,這塊石碑叫羅塞塔石碑,已經(jīng)保存了2200多年,大約是公元前197年制作的,其上面刻有多種語言:希臘文字、埃及象形文字、也有當時埃及的民間文字、羅馬文字。實際上,石碑是迄今為止已知的保存信息最長久的一種載體。

華大基因BGI Online負責人金鑫主講:基因大數(shù)據(jù)的起源、現(xiàn)狀與未來| 雷鋒網(wǎng)公開課

我們身體里有很多細胞,每個細胞里都有一個完整的基因組,基因組上所承載信息的載體是ATCG這四個非常簡單的基本單元,我們稱之為堿基。從地球上有生命起,絕大部分已知的地球生物都是通過DNA的形式來承載我們生命的全部秘密,但所謂的承載和傳遞并不是只做一次記錄,更多的是通過不斷的復(fù)制把它傳遞下去,而且傳遞過程并不是非常精確的完整復(fù)制過程,這使得如今整個地球上的物種成千上萬、豐富多彩。

基因的起源

很多年前,人類就開始了讀基因天書的努力。

在20世紀,人類有三大科學(xué)創(chuàng)舉:1945年的曼哈頓原子彈計劃、1969年的阿波羅登月計劃和2000年前后完成的人類基因組計劃。

從一開始,我們就是人類基因組計劃中的一份子,當時一共有6個國家參加,美、英、法、德、日、中,中國是唯一一個參與人類基因組計劃的發(fā)展中國家。1999年9月9日,華大基因為完成人類基因組計劃中國部分那個1%而成立的。當時要去讀取人的基因數(shù)據(jù),需要做一個完整的人類基因參考序列,就像一個地圖導(dǎo)航坐標系一樣,這其實是非常困難的。6個國家成百上千科學(xué)家花費了13年時間和30億美金才完成了第一個人的基因組測序,當然,這個過程中,也帶來很多相關(guān)學(xué)科、技術(shù)和產(chǎn)業(yè)的發(fā)展。我想給大家講的是,2000年之前,讀一個人的基因數(shù)據(jù)要耗巨資需要十幾年的時間。

如今,是一個數(shù)據(jù)的時代,一個互聯(lián)網(wǎng)的時代,一個智能的時代,而所有這一切的核心是我們今天講的數(shù)據(jù)。

相比其他數(shù)據(jù),基因數(shù)據(jù)的產(chǎn)生有很多特別的地方,基因數(shù)據(jù)的獲取需要一個特別的設(shè)備——基因測序儀。2015年10月份,中國第一款的國產(chǎn)自主知識產(chǎn)權(quán)的基因測序儀問世,這就是華大研發(fā)的。

其實,過去幾十年,如同很多的高精尖醫(yī)療設(shè)備和其他大型設(shè)備一樣,基因測序儀其實大部分依賴進口。而如今,全球只有兩個國家三家公司能夠量產(chǎn)臨床級別的基因測序儀,兩個國家是美國和中國,三家公司是illumina、賽默飛世爾和中國的華大基因。

很多人都非常熟悉摩爾定律,價格不變時,集成電路上容納晶體管數(shù)量18個月增加一倍。而在2007年前后,基因測序技術(shù)的大突破使得基因測序成本飛速下降,下降速度甚至超過了摩爾定律的斜率。

華大基因BGI Online負責人金鑫主講:基因大數(shù)據(jù)的起源、現(xiàn)狀與未來| 雷鋒網(wǎng)公開課

這個圖是截止到2011年的1月份的,而如今,這條線已經(jīng)基本上跟坐標軸的最底部平齊,也就是說讀取一個人的基因數(shù)據(jù)成本已經(jīng)低于一千美金了。我們相信隨著技術(shù)的進一步提升、生產(chǎn)進一步規(guī)?;覀冞€有機會把它變得更便宜。

基因數(shù)據(jù)與很多其他數(shù)據(jù)有一個很大的不同點:獲取單位數(shù)據(jù)成本依然較高。淘寶有電商數(shù)據(jù)、百度有搜索數(shù)據(jù)、滴滴打車有出行數(shù)據(jù),這些是在大家使用的過程伴生的,我們可以認為這些數(shù)據(jù)產(chǎn)生的邊際成本幾乎為0,但是基因數(shù)據(jù)的產(chǎn)生需要專門的操作,通過抽血或取唾液,從中提出DNA,經(jīng)過專門的基因測序設(shè)備,最終才能夠得到基因數(shù)據(jù)。所以,如果基因數(shù)據(jù)要像其他數(shù)據(jù)一樣被人人所接觸、為人人的健康服務(wù),那么其獲取成本應(yīng)進一步降低,獲取速度進一步加快。

2003年,我們完成了第一個人基因組測序,從2006年左右開始,有人獲得了自己完整的基因組數(shù)據(jù),其中就有DNA雙螺旋結(jié)構(gòu)發(fā)現(xiàn)者沃森。2008年左右,第一次獲取了亞洲人的基因數(shù)據(jù)圖譜,后來日本人、韓國人、非洲人等的基因數(shù)據(jù)也不斷被解碼出來,但當時,有自己個人基因組數(shù)據(jù)的人幾乎沒有,2010年開始,有非常多大型科研項目啟動,全球很多人有了自己的基因數(shù)據(jù)。保守估計,有自己基因數(shù)據(jù)的人已經(jīng)超過了數(shù)百萬,我覺得這是令人非常興奮的事情,因為對于基因數(shù)據(jù),我們曾經(jīng)是一無所知的,但是從過去十年開始,基因數(shù)據(jù)非??焖俚乇猾@取和積累起來。

傳承

英國皇室家庭曾經(jīng)有人攜帶一個非常嚴重的遺傳病的基因——血友病,這種基因的突變會導(dǎo)致其凝血能力發(fā)生障礙,同時皇室家族又講究血統(tǒng)的純正,所以血友病在這個家族代代相傳,如今這一代的英國皇室已經(jīng)基本上沒有人是血友病致病基因的攜帶者了,但是歐洲很多其他的皇室家族中依然有血友病基因存在,這就是基因數(shù)據(jù)代代相傳。把自己的基因傳遞下去,其實是每一個個體、每一個物種的最基本本能,基因傳遞了我們所有的各種各樣的特征,也包括了致病基因。

遺傳是代代相傳,但同時也有一母生九子,九子各不同,生命傳遞的過程中有變異存在的可能性,而這個變異所帶來的風(fēng)險其實是每個人都可能會遇到的每個人都可能會遇到的。

我們之前做過一個自閉癥科研項目,其中選取的自閉癥樣本都是父母雙方正常,但是他們的孩子卻很明確地判定是自閉癥,基因檢測發(fā)現(xiàn)父母雙方?jīng)]有任何奇怪的基因。關(guān)于孩子發(fā)生嚴重的疾病原因,后來有很多專家說是父母雙方將其基因傳遞給子代時,后代的基因更多來自于父方。男性跟女性的生殖策略是非常不同的,女性一生中卵子的數(shù)目是確定的,大約每月排出一個卵子直到絕經(jīng),但是男性從有生育能力開始就在大量的復(fù)制精子,以量取勝,成千上萬、甚至上億顆精子不斷的被生產(chǎn)出來,而精子復(fù)制過程中發(fā)生新突變的可能性比卵子要大很多。

我們曾經(jīng)做過一個觀測,我們找到了很多家庭,把這個父親的年齡作為一個自變量,觀測父親年齡跟孩子基因中發(fā)生新變異的數(shù)量的關(guān)系,發(fā)現(xiàn)一個明顯的正相關(guān)關(guān)系,據(jù)當時估算,父親的年齡每增加一歲,孩子就有可能會增加一個左右的新突變。人類基因組數(shù)量很大,基因突變可能發(fā)生在任何的位置,可能在絕大部分位置的小突變,不會有什么問題,但是如果不幸,突變發(fā)生在很重要位置上,那么孩子就有患病的風(fēng)險。

那么,為什么生命數(shù)據(jù)要這樣呢?為了把基因數(shù)據(jù)傳遞下去,相對更精確得復(fù)制、產(chǎn)生的錯誤更少一些不是更好嗎?

如果我們從整個物種的角度講,對此的考慮就可能會很不一樣。在某種程度上,新突變增加了物種基因多樣性。如果基因多樣性變得單一,那么物種繼續(xù)發(fā)展下去就變得比較困難。

舉一個非常簡單的例子,廣東、廣西和海南省地中?;驍y帶率相對較高,這是有原因的,這是人類生存過程一種與環(huán)境的妥協(xié),地中海貧血基因一開始是在地中海沿岸發(fā)現(xiàn)的,而地中海貧血大都發(fā)生在這個維度上,原因是這樣的,很久之前,在這種維度的自然和氣象環(huán)境之下,瘧疾高發(fā),一旦患病非常嚴重會導(dǎo)致死亡,而地中海貧血致病基因攜帶者對瘧疾有一定的抗性,在人類還沒有別的手段控制瘧疾時,這種基因攜帶者有生存優(yōu)勢,最終,導(dǎo)致地中海貧血致病基因在這些地區(qū)大量傳開了。

如今,我們經(jīng)常會被問到,是不是攜帶某種壞基因?但什么是好基因,什么是壞基因呢?從根本上講,基因沒有好壞之分,只有多樣性。這種多樣性導(dǎo)致有些人由于基因突變看起來與我們不一樣,但這其實為人類生存贏得一種新的可能性,比如環(huán)境、氣象和地質(zhì)條件發(fā)生大規(guī)模的變化,或整個食物結(jié)構(gòu)發(fā)生巨變等,這時如果說人類基因都非常相似的話,那人類這個物種生存的可能性就會大大降低。

基因科技&未來

那么,對于嚴重遺傳病、腫瘤、傳染病等,科技能做什么呢?

從生育角度,像地中海貧血這樣的遺傳病可以在寶寶出生之前進行產(chǎn)前檢查,尤其是在高發(fā)地區(qū),甚至在備孕之前就可以去做基因檢測,進行相應(yīng)的準備并接受指導(dǎo)。如果檢查結(jié)果是父母雙方攜帶同樣的遺傳病致病基因,可以進行相應(yīng)的干預(yù),比如植入胚胎,選擇沒有攜帶致病突變或說不會引起疾病的基因拷貝的胚胎做植入,如果成功受孕,寶寶就肯定是健康的。另外還有不孕不育的問題,一部分不育是因為習(xí)慣性流產(chǎn),其中一大部分與基因有關(guān),可以通過基因檢測發(fā)現(xiàn)和預(yù)防。

華大基因BGI Online負責人金鑫主講:基因大數(shù)據(jù)的起源、現(xiàn)狀與未來| 雷鋒網(wǎng)公開課

如今,我們做的最多的是無創(chuàng)產(chǎn)前檢查,用于篩查21-三體綜合癥。未來,我相信每個寶寶出生時都會做一個基因檢測,讀取其基因數(shù)據(jù),用于疾病預(yù)防和用藥指導(dǎo)。

如今,我們還面臨很多其它挑戰(zhàn),比如腫瘤。腫瘤最重要的是預(yù)防,當處于腫瘤中晚期發(fā)現(xiàn)時,治療辦法是非常有限的,如果能早發(fā)現(xiàn)、早期篩查并且輔以個性化藥物的話,能有效控制病情甚至未來可能治愈。我們現(xiàn)在知道腫瘤是一種基因病,是環(huán)境和基因共同導(dǎo)致的?;驒z測不僅僅意味著早期篩查,同時這項技術(shù)對藥物研發(fā)也有重要作用,比如對腫瘤細胞進行基因檢測,找到其特異性的標靶序列,把這些序列添加到經(jīng)過加工的免疫細胞上,將這個免疫細胞注入身體中,這種技術(shù)能在一定程度上治療腫瘤。

大家可能對SARS記憶猶新,在非典病人的組織液、血液等提取病原體,進行基因檢測,能確定病原體類型。如今,我們基本能做到,對于絕大部分已知的病原微生物,我們不僅可以知道它是什么,而且可以知道其有沒有抗藥性、對某種抗生素是否有抗性等。

那么,基因技術(shù)能做什么?

精準醫(yī)療人人都在講,但精準醫(yī)療的基礎(chǔ)是基因數(shù)據(jù)。2016年,這三家公司都積累了100多萬人的部分基因數(shù)據(jù),所謂部分基因數(shù)據(jù),是通過基因芯片技術(shù),讀取部分數(shù)據(jù)得到某方面的基因信息。

華大基因也積累了很多數(shù)據(jù),到2016年4月份時,僅僅無創(chuàng)產(chǎn)篩這個項目就做了100萬人,但我們是通過全基因組數(shù)據(jù)測序獲取數(shù)據(jù)的,所以盡管樣本量差不多,我們的數(shù)據(jù)量級是遠遠超過他們的。而到現(xiàn)在,華大基因的數(shù)據(jù)量至少已經(jīng)翻倍了。

華大基因BGI Online負責人金鑫主講:基因大數(shù)據(jù)的起源、現(xiàn)狀與未來| 雷鋒網(wǎng)公開課

2001~2015年,基因數(shù)據(jù)產(chǎn)生是大型研究機構(gòu)推動的,2015年之后,研究機構(gòu)和企業(yè)有了很多基因檢測的應(yīng)用,從研究項目驅(qū)動轉(zhuǎn)為研究項目和應(yīng)用共同驅(qū)動,基因數(shù)據(jù)的積累速度肯定會加速的。

但隨著基因數(shù)據(jù)積累,讀懂基因這本天書的重要性和難點就凸顯出來了。

對于人類基因組,我們可能認識了不少單詞,粗略地理解了語法,但還完全不懂斷句,所以我們對整篇文章一無所知,我們對基因的了解還處在非常早期階段,我們可以從簡單的物種開始做起,比如最簡單的生命、病毒等,但依然有非常多的挑戰(zhàn),但我認為,大數(shù)據(jù)和人工智能/機器學(xué)習(xí)將會為其帶來突破。

華大基因BGI Online負責人金鑫主講:基因大數(shù)據(jù)的起源、現(xiàn)狀與未來| 雷鋒網(wǎng)公開課

基因數(shù)據(jù)與其它數(shù)據(jù)有區(qū)別,獲取數(shù)據(jù)的成本比較高,同時數(shù)據(jù)量大。若用現(xiàn)在的技術(shù),若要將基因數(shù)據(jù)讀得準確,需要讀很多份并組合起來,才能知道其排列,一般要讀30次,腫瘤研究中,有時候會測幾百次甚至幾千次。每個人的基因數(shù)據(jù)至少有100G的原始數(shù)據(jù),如果把全中國人的基因數(shù)據(jù)全都讀出來,怎么存、怎么處理就是一個很大的問題。

我們知道了基因數(shù)據(jù),也知道其最終的表現(xiàn),隨著數(shù)據(jù)增多,我們就有可能理解基因數(shù)據(jù),這其中會用到人工智能技術(shù)。但以我們目前處理信息和數(shù)據(jù)的能力,理解、解讀、歸納和總結(jié)基因數(shù)據(jù)的挑戰(zhàn)非常大。但如今人工智能技術(shù)有很大的突破,加上愈來愈便宜的數(shù)據(jù)產(chǎn)出,我們認為這件事未來是美好的。

科學(xué)發(fā)現(xiàn)推動了技術(shù)發(fā)明,技術(shù)發(fā)明帶動了產(chǎn)業(yè)發(fā)展,三個齒輪互相聯(lián)動,科學(xué)發(fā)現(xiàn)是核心。本質(zhì)上,我們要把科學(xué)問題轉(zhuǎn)化成技術(shù)問題,技術(shù)問題轉(zhuǎn)化為經(jīng)濟問題。馬斯克最近說到99%的科研論文都是沒用的,他表達的意思與此類似,科研只是進行了探索和驗證,最終還需要工程上的落地。

那華大做了什么呢?我們希望將單個基因讀取的成本降至極限,這意味著每個人有更大可能性獲取自己的基因數(shù)據(jù),同時基因數(shù)據(jù)與個人的關(guān)系也會更大。同時,我們在云端做基因數(shù)據(jù)分析——即華大基因BGI平臺,希望把基因數(shù)據(jù)分析的成本降至極限,通過與阿里云合作,基因數(shù)據(jù)分析的成本已經(jīng)降至100元以內(nèi)了。

物理、數(shù)學(xué)中都有很多定理和公式,但生物學(xué)中沒有,希望隨著生命數(shù)據(jù)積累越來越多和分析技術(shù)的逐步提升,生命科學(xué)也能有一個核心公式。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

分享:
相關(guān)文章

編輯

我是雷鋒網(wǎng)醫(yī)療科技編輯,歡迎與我交流:zhangli@leiphone.com
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說