0
本文作者: 李雨晨 | 2022-09-30 23:44 |
辭去360人工智能研究院院長(zhǎng)一職、投身AI制藥,對(duì)于鄧亞峰來(lái)說(shuō)是不是一個(gè)不后悔的決定?
2012年,AlexNet深度卷積神經(jīng)網(wǎng)絡(luò)在ImageNet分類(lèi)比賽中大殺四方,深度學(xué)習(xí)革命就此發(fā)軔。
一年后,鄧亞峰加入了百度深度學(xué)習(xí)研究院,成為一名資深科學(xué)家。
2016年8月,鄧亞峰離開(kāi)百度加入格靈深瞳,半年后成為CTO,職業(yè)角色從一名技術(shù)專(zhuān)家,轉(zhuǎn)變?yōu)橐粋€(gè)百人技術(shù)團(tuán)隊(duì)的管理者。
2020年,鄧亞峰加入360集團(tuán)。
他的近三段職業(yè)生涯,以四年為一個(gè)節(jié)點(diǎn),但卻一直圍繞AI切換賽道和角色。
在一個(gè)偶然的機(jī)會(huì)下,鄧亞峰認(rèn)識(shí)了現(xiàn)任公司首席科學(xué)家侯廷軍,后者是浙大藥學(xué)院教授,在計(jì)算機(jī)輔助藥物設(shè)計(jì)領(lǐng)域有二十多年的積累。
當(dāng)時(shí),鄧亞峰已經(jīng)是360集團(tuán)副總裁、人工智能研究院院長(zhǎng)兼搜索事業(yè)部總經(jīng)理,管理著400人左右的產(chǎn)品技術(shù)團(tuán)隊(duì)。
但兩人深入交流之后,鄧亞峰毅然決定進(jìn)入AI制藥行業(yè)。
2022年自然語(yǔ)言處理峰會(huì)上,鄧亞峰以碳硅智慧創(chuàng)始人兼CEO身份公開(kāi)亮相,并且在近日完成了5000萬(wàn)人民幣天使輪融資,由聯(lián)想創(chuàng)投、聯(lián)想之星聯(lián)合領(lǐng)投。
對(duì)于鄧亞峰而言,一切重新開(kāi)始。
對(duì)于自己做AI制藥,鄧亞峰給出了三個(gè)理由。
首先是,技術(shù)“遷移”的可行性。
細(xì)細(xì)算來(lái),鄧亞峰在CV(計(jì)算機(jī)視覺(jué))領(lǐng)域做了近20年,這是他身上的一個(gè)標(biāo)簽。
在百度深度學(xué)習(xí)研究院的三年里,鄧亞峰參與提出了第一個(gè)基于深度學(xué)習(xí)的端到端的一階段物體檢測(cè)框架DenseBox,和團(tuán)隊(duì)一起將LFW評(píng)測(cè)的準(zhǔn)確率做到了第一,成績(jī)是接近極限的99.77%;
在格靈深瞳他擔(dān)任CTO ,主要負(fù)責(zé)人臉識(shí)別、人體再識(shí)別、車(chē)輛識(shí)別等算法和軟件產(chǎn)品的研發(fā)工作。
“不過(guò),我不想只做CV,因?yàn)槲也幌虢o自己人生設(shè)限?!?/p>
所以到了360之后,除了CV之外,鄧亞峰開(kāi)始做NLP、多模態(tài)表示學(xué)習(xí)、機(jī)器人等方向。
在以深度學(xué)習(xí)為特征的AI技術(shù)躍遷下,不同研究方向的遷移、融合已經(jīng)漸成趨勢(shì)。
“2002年左右,做車(chē)牌識(shí)別和人臉識(shí)別是兩撥人,因?yàn)榇蠹业募夹g(shù)棧非常不一樣。想要轉(zhuǎn)行,得花上兩年時(shí)間學(xué)習(xí)。但是,二十年后的今天,借助CNN/Transformer等模型,CV領(lǐng)域內(nèi)部、CV和其他領(lǐng)域間,都可以比較輕松地實(shí)現(xiàn)跨界。”
和其他AI落地的領(lǐng)域一樣,藥物研發(fā)需要領(lǐng)域知識(shí),不僅僅涉及到藥學(xué),還包括物理、化學(xué)、生物、醫(yī)學(xué)等,這是一個(gè)非常跨學(xué)科的交叉領(lǐng)域。
對(duì)鄧亞峰而言,不可能在短時(shí)間內(nèi)學(xué)好所有的生物醫(yī)學(xué)知識(shí)。
但是在他看來(lái),有了一定的領(lǐng)域知識(shí),將具體場(chǎng)景的需求抽象成AI建模問(wèn)題后,會(huì)非??简?yàn)團(tuán)隊(duì)的AI算法建模能力和軟硬件產(chǎn)品開(kāi)發(fā)能力。
“我們團(tuán)隊(duì)已經(jīng)有比較多藥學(xué)背景的同學(xué),所以,我們最近一段時(shí)間花精力招人,更側(cè)重于AI算法人才。我們希望找到深度理解深度學(xué)習(xí),并且對(duì)生命科學(xué)感興趣、有使命感的人。這些算法同學(xué),初期需要學(xué)習(xí)一些領(lǐng)域知識(shí),之后就可以在團(tuán)隊(duì)配合下去解決新藥發(fā)現(xiàn)各子任務(wù)的建模問(wèn)題。實(shí)際上手項(xiàng)目的時(shí)間,只需要一兩個(gè)月就好。”
其次,是人生規(guī)劃的必要性。
在格靈深瞳2016年到2020年的3年半時(shí)間里,鄧亞峰是一個(gè)技術(shù)管理者,但他把內(nèi)部團(tuán)隊(duì)和業(yè)務(wù)梳理清楚之后,也對(duì)這一角色產(chǎn)生了疲態(tài)。
鄧亞峰坦言,離開(kāi)格靈深瞳,是不想一直做重復(fù)的事情。
“今年格靈深瞳也上市了,我離開(kāi)時(shí)還是放棄了很多的。如果我一直在格靈深瞳待下去,從財(cái)務(wù)角度會(huì)好很多,但我還是想做一件讓自己更有激情的事情。”
到了360之后,鄧亞峰已經(jīng)變成一個(gè)實(shí)際意義上的業(yè)務(wù)負(fù)責(zé)人,無(wú)論是在人工智能研究院還是搜索事業(yè)部,都要對(duì)預(yù)算負(fù)責(zé),要考慮項(xiàng)目的投入產(chǎn)出比。
所以,選擇加入360本身就是鄧亞峰有意實(shí)現(xiàn)自我轉(zhuǎn)型、從技術(shù)管理者向業(yè)務(wù)負(fù)責(zé)人的規(guī)劃使然。
最后一個(gè)原因是,是時(shí)代給他的機(jī)遇。
這一波AI的創(chuàng)業(yè)浪潮,本質(zhì)上屬于技術(shù)者?;ヂ?lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)的創(chuàng)業(yè)草莽氛圍,決定了創(chuàng)業(yè)者本身不需要精通技術(shù),洞悉人性、營(yíng)銷(xiāo)裂變、花錢(qián)拉新,就能做好一個(gè)創(chuàng)業(yè)項(xiàng)目。
但這種粗放的創(chuàng)業(yè)路徑,放在當(dāng)下的創(chuàng)業(yè)環(huán)境下早已難以為繼。
所以,我們能發(fā)現(xiàn)一個(gè)趨勢(shì):AI行業(yè)里的CEO,尤其是在創(chuàng)業(yè)初期的CEO,多是技術(shù)出身。
當(dāng)然,在一家公司成熟之后,出于商業(yè)化的考慮,技術(shù)管理者可能會(huì)讓位于銷(xiāo)售、渠道見(jiàn)長(zhǎng)的商業(yè)人才、抑或是職業(yè)經(jīng)理人。但是,技術(shù)管理者的思維、組織框架,已經(jīng)給公司打上深深的烙印。
一個(gè)很明顯的現(xiàn)象是,無(wú)論是“深度學(xué)習(xí)預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)”第一人許錦波、亦或是華深智藥彭健、百奧幾何唐建、燧坤智能曾建陽(yáng)等等一系列AI制藥公司的創(chuàng)始人,均是技術(shù)背景出身,也陸續(xù)拿到千萬(wàn)級(jí)別的融資,這說(shuō)明資本認(rèn)可這條賽道。
AI制藥,是一個(gè)屬于鄧亞峰這類(lèi)人的機(jī)會(huì)。
AI行業(yè)的創(chuàng)業(yè),緣起10年前。直至2016年的AlphaGo之后,醫(yī)療AI的創(chuàng)業(yè)大幕正式拉開(kāi)。
早期的醫(yī)療AI以醫(yī)學(xué)影像AI為標(biāo)志,但坦白而言,醫(yī)學(xué)影像AI的前期創(chuàng)業(yè)門(mén)檻不算高:基于開(kāi)源的數(shù)據(jù)庫(kù)和算法,就可以做成很好的“實(shí)驗(yàn)室”效果,輕松拿到融資。
同樣的情況,也發(fā)生在AI制藥身上。
2021年,全球AI+制藥產(chǎn)業(yè)共發(fā)生77起融資事件,累計(jì)融資額達(dá)45.64億美元,融資事件數(shù)和融資額共同刷新了歷年融資紀(jì)錄。對(duì)比2020年,2021年融資額增長(zhǎng)率達(dá)152%。
鄧亞峰認(rèn)為,技術(shù)角度,醫(yī)學(xué)影像AI是CV的垂直應(yīng)用領(lǐng)域,有現(xiàn)有的圖像檢測(cè)、分割算法模型可以借用,技術(shù)壁壘并不高;
商業(yè)角度,醫(yī)療影像服務(wù),一直都沒(méi)有找到一個(gè)合理地從消費(fèi)者身上額外收費(fèi)的模式,同時(shí),也難以處理與醫(yī)生的倫理關(guān)系,即最終還需要醫(yī)生簽字,無(wú)法真正代替醫(yī)生。
所以,最終醫(yī)療影像算法變成了醫(yī)療器械的附屬,難以創(chuàng)造非常高的商業(yè)價(jià)值。
相比而言,AI制藥有著與醫(yī)學(xué)影像AI不同的處境。
從AI制藥的痛點(diǎn)而言,目前的新藥研發(fā)效率很低,失敗率很高。鄧亞峰透露了一組數(shù)字:“目前手工試驗(yàn)是非常低效的,一個(gè)博士5年期間只能合成約100種化合物,效率并不高?!?。
在新藥發(fā)現(xiàn)的各個(gè)環(huán)節(jié)中,都有AI算法發(fā)揮的空間,AI是解決新藥研發(fā)領(lǐng)域痛點(diǎn)的鑰匙。誰(shuí)掌握了基于AI平臺(tái)開(kāi)發(fā)新藥的能力,誰(shuí)就會(huì)脫穎而出。而藥品市場(chǎng)是一個(gè)十萬(wàn)億市場(chǎng),具有非常大的想象空間。
另一方面,AI制藥領(lǐng)域的技術(shù)門(mén)檻非常高,沒(méi)有如計(jì)算機(jī)視覺(jué)、自然語(yǔ)言理解領(lǐng)域那樣成熟的框架和模型可以直接使用,現(xiàn)有的算法需要持續(xù)打磨才能產(chǎn)生價(jià)值,這就需要團(tuán)隊(duì)有非常強(qiáng)的算法建模能力。
新藥發(fā)現(xiàn)領(lǐng)域的AI技術(shù)分為兩個(gè)層次:
第一個(gè)層次,從微觀、底層的角度進(jìn)行建模,例如圍繞分子和靶點(diǎn)的相互作用或分子的性質(zhì)預(yù)測(cè),基于Transformer或者圖神經(jīng)網(wǎng)絡(luò)對(duì)底層物理化學(xué)規(guī)律進(jìn)行建模;
第二個(gè)層次,就是從宏觀層面對(duì)化合物、蛋白、基因、疾病之間的數(shù)據(jù)關(guān)聯(lián)性進(jìn)行建模,這里會(huì)用到多模態(tài)預(yù)訓(xùn)練、知識(shí)圖譜等技術(shù)。
“在生命科學(xué)領(lǐng)域,必須要有原創(chuàng)的模型和方法,去真正解決掉研發(fā)環(huán)節(jié)中的某個(gè)具體問(wèn)題,目標(biāo)客戶(hù)才會(huì)付費(fèi)。而且,AI制藥的目標(biāo)客戶(hù)不同于醫(yī)院,少了很多政策、倫理上的掣肘?!?/p>
如其他“AI+”賽道,AI制藥的核心在于制藥,需要具備深厚藥學(xué)背景的人才,這就要提到碳硅智慧的另一位聯(lián)合創(chuàng)始人侯廷軍教授。
侯廷軍教授本碩博均從北京大學(xué)畢業(yè),作為國(guó)家“萬(wàn)人計(jì)劃”科技創(chuàng)新領(lǐng)軍人才,曾獲得Elsevier中國(guó)高被引學(xué)者、藥明康德生命化學(xué)研究獎(jiǎng)、英國(guó)皇家化學(xué)會(huì)"Top 1%"高被引中國(guó)作者,SCI學(xué)術(shù)論文400余篇,ESI高引和擴(kuò)展ESI高引論文30篇,總引次數(shù) (google)> 20000 次,H因子70,軟件著作權(quán)19項(xiàng),發(fā)明專(zhuān)利43項(xiàng),并已授權(quán)23項(xiàng)。
作為浙江大學(xué)藥學(xué)院特聘教授,侯廷軍擁有長(zhǎng)達(dá)20余年的藥物設(shè)計(jì)方法學(xué)和應(yīng)用研究經(jīng)驗(yàn),在2022年剛剛發(fā)布的全球?qū)W者學(xué)術(shù)影響力排行榜上,他位列國(guó)內(nèi)藥學(xué)學(xué)科領(lǐng)軍人物榜單第三位。
他所帶領(lǐng)的研究團(tuán)隊(duì)也是國(guó)內(nèi)人工智能輔助藥物設(shè)計(jì)領(lǐng)域最好的團(tuán)隊(duì)之一。
兩人的分工則是:鄧亞峰作為董事長(zhǎng)兼CEO,負(fù)責(zé)公司的戰(zhàn)略規(guī)劃、運(yùn)營(yíng)管理以及人工智能軟硬件產(chǎn)品研發(fā);侯廷軍作為首席科學(xué)家,專(zhuān)注公司在藥學(xué)領(lǐng)域的研發(fā)和布局,以及前沿方向探索。
2022年9月,侯廷軍團(tuán)隊(duì)、浙江大學(xué)謝昌諭團(tuán)隊(duì)、武漢大學(xué)陳曦團(tuán)隊(duì)、中南大學(xué)曹東升團(tuán)隊(duì)及碳硅智慧團(tuán)隊(duì)聯(lián)合在《藥物化學(xué)雜志》(Journal of Medicinal Chemistry)發(fā)表了論文。
藥物發(fā)現(xiàn)中的一個(gè)問(wèn)題是,如何有效地尋找具有所需特性的新分子,例如生物活性、成藥性和安全性一直以來(lái)都是藥物發(fā)現(xiàn)中亟待解決的難題。
一個(gè)主要困難是類(lèi)藥物化學(xué)空間中分子的估計(jì)數(shù)量在10的三十次方到六十次方之間。如何從如此龐大的集合中智能地生成或識(shí)別有用的分子結(jié)構(gòu)一直是從頭藥物設(shè)計(jì)的長(zhǎng)期障礙。
基于遺傳算法(GA)的分子生成方法不需要模擬訓(xùn)練數(shù)據(jù)集的分布(因?yàn)樗鼈兏静恍枰?xùn)練),因此它們表現(xiàn)出更高的探索能力。
因此,上述5個(gè)團(tuán)隊(duì)聯(lián)合提出了兩種分子生成算法ChemistGA。模型在單靶點(diǎn)(DRD2)與多靶點(diǎn)(GSK3β與JNK3)分子生成任務(wù)中,對(duì)比現(xiàn)有的傳統(tǒng)GA與DL分子生成模型,ChemistGA 不僅保留了傳統(tǒng)GA分子生成算法的優(yōu)點(diǎn),而且大大提高了具有所需特性的生成分子的可合成率以及生成效率。
這樣的案例也表明,碳硅智慧在AI制藥的原創(chuàng)研究道路上,已經(jīng)正式起步。
僅有AI制藥的模型和算法策略并不夠,還需要形成一個(gè)完整的流程。
藥物設(shè)計(jì)需要一個(gè)像芯片設(shè)計(jì)領(lǐng)域的EDA工具,幫助藥物設(shè)計(jì)專(zhuān)家看到藥物設(shè)計(jì)全貌,且能形成數(shù)據(jù)和模型閉環(huán)迭代的設(shè)計(jì)平臺(tái)。
近期,不少AI制藥團(tuán)隊(duì)都陸續(xù)提出類(lèi)似概念,例如智峪生科、天壤智能等。
據(jù)鄧亞峰介紹,目前,碳硅智慧已建立了業(yè)內(nèi)領(lǐng)先且完全擁有自主知識(shí)產(chǎn)權(quán)的一站式新藥發(fā)現(xiàn)平臺(tái) DrugFlow,包括靶標(biāo)評(píng)估、虛擬篩選、先導(dǎo)化合物優(yōu)化、成藥性預(yù)測(cè)等模塊,可以幫助藥化專(zhuān)家更高效、便捷地找到潛在成藥分子。
這類(lèi)似于芯片設(shè)計(jì)領(lǐng)域的EDA軟件,幫助專(zhuān)家更好地決策和判斷。其中的成藥性預(yù)測(cè)、分子生成優(yōu)化、AI打分等模塊都是行業(yè)里面其他軟件不具備的獨(dú)特功能。
除此之外,碳硅智慧內(nèi)部的藥化及計(jì)算專(zhuān)家,基于DrugFlow平臺(tái),總結(jié)出基于AI計(jì)算的最佳藥物設(shè)計(jì)實(shí)踐,并對(duì)外提供藥物分子設(shè)計(jì)服務(wù)。
在美國(guó)國(guó)家生物技術(shù)信息中心工作多年,目前擔(dān)任夸克資本合伙人Leo 韓漣漪曾向雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))《醫(yī)健AI掘金志》表示:“在談AI前景前,藥學(xué)家和醫(yī)藥從業(yè)者,會(huì)先關(guān)注AI制藥企業(yè)的業(yè)務(wù)邏輯是什么,核心競(jìng)爭(zhēng)力在哪里,最終影響哪一類(lèi)賽道,無(wú)論是晶型預(yù)測(cè),還是小分子藥物篩選,AI怎樣找到藥物研發(fā)的服務(wù)關(guān)系才是關(guān)鍵。”
鄧亞峰表示,碳硅智慧沒(méi)有將自己定位成一家Biotech公司,而是想做行業(yè)AI基礎(chǔ)設(shè)施和服務(wù)賦能者,通過(guò)構(gòu)建基于AI和物理計(jì)算模型、數(shù)據(jù)驅(qū)動(dòng)、干濕實(shí)驗(yàn)閉環(huán)的藥物設(shè)計(jì)平臺(tái)和設(shè)計(jì)服務(wù),最終讓客戶(hù)自己決定是使用軟硬件設(shè)計(jì)產(chǎn)品,還是直接使用碳硅智慧的藥物設(shè)計(jì)服務(wù)。
在雷峰網(wǎng)此前的報(bào)道中,據(jù)2020年6月發(fā)表于Drug Discovery Today雜志的文章顯示,21家頭部跨國(guó)藥企在2014-2019年共發(fā)表398篇與“AI藥物研發(fā)”相關(guān)的論文,同時(shí)啟動(dòng)了73項(xiàng)內(nèi)部AI研發(fā)項(xiàng)目、61項(xiàng)與外部AI公司合作的項(xiàng)目、以及11項(xiàng)投資/收購(gòu)初創(chuàng)AI企業(yè)。
這里涉及到一個(gè)核心問(wèn)題:既然AI技術(shù)對(duì)藥企而言很重要,那么藥企不能通過(guò)自建團(tuán)隊(duì)來(lái)實(shí)現(xiàn)?
類(lèi)似的事情是,安防公司??低跀z像頭業(yè)務(wù)之外,專(zhuān)門(mén)設(shè)立AI事業(yè)部,做邊端算法;或者飛利浦、西門(mén)子等器械廠商去做掃描環(huán)節(jié)的圖像重建、增強(qiáng)等AI算法。如此而言,AI制藥團(tuán)隊(duì)就會(huì)面臨不小的挑戰(zhàn)。
“我覺(jué)得(藥企自建AI團(tuán)隊(duì))很難做起來(lái)。AI制藥不同于AI安防,安防本質(zhì)上是一個(gè)硬件生意,考驗(yàn)的是供應(yīng)鏈以及售后體系的構(gòu)建。”
鄧亞峰給出了自己的觀點(diǎn):“傳統(tǒng)藥學(xué)專(zhuān)家亦或是內(nèi)部的IT工程師,對(duì)于AI的理解是不一樣的。生命科學(xué)領(lǐng)域的AI,不是拿一個(gè)開(kāi)源軟件就可以做起來(lái)的,有很高的門(mén)檻,需要頂尖的團(tuán)隊(duì)才能真正做好。而成熟企業(yè),想建立這樣的團(tuán)隊(duì),目前看并不容易,核心原因是頂尖的AI人才不會(huì)選擇特別傳統(tǒng)的平臺(tái),兩種團(tuán)隊(duì)的文化氛圍差別很大。即使建立了AI團(tuán)隊(duì),在巨大投入下,AI的價(jià)值也很難評(píng)估,團(tuán)隊(duì)會(huì)面臨巨大的壓力?!?/p>
除此之外,企業(yè)內(nèi)部的關(guān)鍵決策人,其思路和視角仍不可避免地聚焦在傳統(tǒng)業(yè)務(wù)的“價(jià)值鏈”上,新業(yè)務(wù)的投入產(chǎn)出比也會(huì)屢受內(nèi)部爭(zhēng)議。
因此,鄧亞峰認(rèn)為,對(duì)于藥企來(lái)說(shuō),借助外部團(tuán)隊(duì)的AI能力,對(duì)自身而言是一個(gè)最具備“性?xún)r(jià)比”的選擇,也是不可或缺的補(bǔ)充劑。
從6月18日離職到正式運(yùn)營(yíng)碳硅智慧,鄧亞峰只花了三個(gè)月的時(shí)間。目前,公司已經(jīng)建立起近60人的團(tuán)隊(duì)。
而碳硅智能的第一要?jiǎng)?wù),是基于AI和物理計(jì)算模型以及軟件流程和硬件自動(dòng)化,去搭建一個(gè)真正提高藥物發(fā)現(xiàn)效率的設(shè)計(jì)平臺(tái)。無(wú)論是賣(mài)軟硬件產(chǎn)品,還是做藥物設(shè)計(jì)服務(wù),抑或是與戰(zhàn)略合作伙伴聯(lián)合做藥,都可以基于效率去談價(jià)值實(shí)現(xiàn)。
過(guò)去兩年,國(guó)外先后有Schrodinger薛定諤、Exscientia、Relay多家AI制藥企業(yè)完成了上市。從找到臨床前候選化合物,到接踵而至的藥企合作;從持續(xù)不斷的大額融資,到斬獲百億巨額訂單。
AI新藥研發(fā)企業(yè)的攻城掠地速度,刷新了各個(gè)藥企、投資人、AI圈人的認(rèn)知。
“AI對(duì)新藥研發(fā)領(lǐng)域的價(jià)值毋庸置疑,但是能否成長(zhǎng)為一個(gè)千億規(guī)模的大平臺(tái),還有待驗(yàn)證。關(guān)鍵在于,你相不相信制藥的固有模式會(huì)被AI改變。只要你創(chuàng)造了價(jià)值,就會(huì)有獲得回報(bào)的方式?!?nbsp;
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。