0
本文作者: 郭思 | 2023-09-19 11:18 |
他們不僅乘上了 AI 的浪潮,更創(chuàng)造了浪潮本身。
2007 年,顏水成飛赴南洋,第一次踏上新加坡的土地,走進(jìn)新加坡國(guó)立大學(xué)(NUS)的校園。彼時(shí),他將從美國(guó)伊利諾伊大學(xué)厄巴納-香檳分校(UIUC)結(jié)束博士后生涯,與導(dǎo)師黃煦濤(Thomas Huang)教授辭別,進(jìn)入找教職的階段。
1995 年,顏水成考入北京大學(xué)數(shù)學(xué)系后本碩博連讀,博士期間一直在微軟亞洲研究院(MSRA)實(shí)習(xí),由時(shí)任副院長(zhǎng)的張宏江博士指導(dǎo)。他對(duì)計(jì)算機(jī)視覺和多媒體分析十分癡迷,畢業(yè)后先去往香港中文大學(xué)多媒體實(shí)驗(yàn)室(MM Lab)跟隨后來(lái)的商湯創(chuàng)始人湯曉鷗教授做博士后研究,一年半之后又赴美國(guó)伊利諾伊大學(xué)厄巴納-香檳分校(UIUC),師從華人視覺鼻祖黃煦濤(Thomas Huang)教授做博士后。在黃煦濤的建議下,他在找教職時(shí),將目標(biāo)瞄準(zhǔn)了亞洲的高校,先后面試了 NTU 與 NUS 兩所新加坡大學(xué)。兩個(gè)學(xué)校都面試順利通過了。
顏水成在新加坡待了一個(gè)星期,給自己充分的時(shí)間來(lái)考慮最終去向。
最后要離開的前一天,他去到 NUS 的校園里,走走停停,來(lái)到未來(lái)辦公室旁邊的一處山坡,上面立著一棵枝繁葉茂的大樹。顏水成就站在那棵樹下,俯瞰著遠(yuǎn)處開闊的城市,感嘆著“這個(gè)地方真是太美了”,便定下了來(lái) NUS 的想法。
那時(shí)的他沒有想到,后來(lái)在 NUS 扎根下來(lái),自己也長(zhǎng)成了一棵枝繁葉茂的“大樹”,他與學(xué)生們之間的故事也從這里展開。
顏水成
三十出頭的顏水成意氣風(fēng)發(fā),很快著手組建了機(jī)器學(xué)習(xí)與視覺實(shí)驗(yàn)室(NUS-LV Lab),并定下了一個(gè)頗有野心的目標(biāo):
讓全世界都知道新加坡NUS-LV Lab是一個(gè)世界一流的計(jì)算機(jī)視覺研究團(tuán)隊(duì)!那幾年,整個(gè)實(shí)驗(yàn)室都處于全力向前高速奔跑的狀態(tài)。顏水成對(duì)自己和對(duì)學(xué)生都要求極高,每周一對(duì)一的交流從不間斷,學(xué)生第一篇稚嫩的論文會(huì)被他批得體無(wú)完膚。深夜時(shí) MSN 上彈出來(lái)一條消息“Hi”,學(xué)生們就知道一場(chǎng)深夜討論要來(lái)了,他們很驚詫,怎么導(dǎo)師比他們年輕人還能熬夜。正是在這樣一種師生齊心的勁頭下,每個(gè)學(xué)生最后都達(dá)到了顏水成對(duì)他們“well-trained”(受過良好訓(xùn)練)的期望。
到了 2010 年,顏水成團(tuán)隊(duì)在全球范圍內(nèi)已經(jīng)名聲漸起,他開始琢磨,“光寫文章還不行”,還要走到國(guó)際計(jì)算機(jī)視覺比賽的舞臺(tái)上,跟全世界企業(yè)和高校的團(tuán)隊(duì)一較高下。他將目光瞄準(zhǔn)了這一年的 Pascal VOC 挑戰(zhàn)賽。那時(shí)候,由歐盟組織的 Pascal VOC 是最熱門且含金量最高的視覺比賽,而李飛飛在同年發(fā)起的 ImageNet 挑戰(zhàn)賽,才剛剛起步。
這一年的主力是 2009 年入學(xué)的博士生陳強(qiáng)。陳強(qiáng)本科畢業(yè)于中國(guó)科學(xué)技術(shù)大學(xué),其后在上海交通大學(xué)讀碩士,在將視覺識(shí)別研究應(yīng)用在安防領(lǐng)域的過程中,他深感傳統(tǒng)的機(jī)器視覺技術(shù)無(wú)法真正解決識(shí)別問題,決定繼續(xù)讀博探索這個(gè)方向。陳強(qiáng)的碩士導(dǎo)師劉允才教授也曾師從黃煦濤,便把陳強(qiáng)推薦到了同門顏水成的門下。
陳強(qiáng)
陳強(qiáng)具有很強(qiáng)的解決問題的思維,而且對(duì)打比賽充滿激情,若是在比賽中獲得冠軍,也能更好的實(shí)踐自己的理論研究。
因?yàn)樵谧R(shí)別任務(wù)上有經(jīng)驗(yàn),陳強(qiáng)就專攻 Pascal VOC 的分類子項(xiàng)(Classification)。經(jīng)過半年的準(zhǔn)備,顏水成團(tuán)隊(duì)首戰(zhàn)告捷,成為最早在該比賽中奪冠的亞洲團(tuán)隊(duì)。值得一提的是,顏水成在打比賽方面的傳承實(shí)際是繼承于黃煦濤。黃煦濤極其喜歡Pascal VOC和ImageNet兩個(gè)比賽,曾多次奪得冠軍。在 NUS,傳承也從陳強(qiáng)那里開始了。
在首次出戰(zhàn)的這一年,顏水成門下進(jìn)來(lái)兩位新學(xué)生——董健和夏威,他們也加入了之后的比賽隊(duì)伍,并連續(xù)兩年奪冠。董健本科畢業(yè)于中國(guó)科學(xué)技術(shù)大學(xué),與師兄程斌和陳強(qiáng)均是校友。董健編程能力很強(qiáng),本科時(shí)出于業(yè)余愛好,曾開發(fā)過百萬(wàn)下載量的游戲。也正是在游戲開發(fā)中,產(chǎn)生了對(duì) AI 的濃厚興趣,決定跟從在AI領(lǐng)域有著深厚背景的顏水成。
董健
夏威與董健是同住了四年的室友。夏威本科在華中科技大學(xué)數(shù)理實(shí)驗(yàn)班就讀,在系里劉文予教授的實(shí)驗(yàn)室里做科研訓(xùn)練,參與過華科和朱松純老師在湖北創(chuàng)立的蓮花山實(shí)驗(yàn)室的一些合作項(xiàng)目,為后面在NUS開展正式的視覺研究打下了一些基礎(chǔ)。
顏水成(左)、夏威(右)
2011 年的 Pascal VOC,陳強(qiáng)和董健在這一年作為主力做物體分類子項(xiàng),再次拿到了分類子項(xiàng)的冠軍。這一年的物體分割子項(xiàng)(Segmentation)則由夏威主導(dǎo),成績(jī)位列第三名。那時(shí)團(tuán)隊(duì)也開始做檢測(cè)任務(wù),而各個(gè)任務(wù)之間都相互關(guān)聯(lián),尤其是在深度學(xué)習(xí)之前,做分割需要分類和檢測(cè)任務(wù)中很多傳統(tǒng)機(jī)器學(xué)習(xí)算法的支持,所以夏威也同時(shí)輔助做其它子項(xiàng)的比賽。這是深度學(xué)習(xí)到來(lái)的前夜。(暢聊加:lionceau2046)
02投身深度學(xué)習(xí)的第一次勝利
如果說 2010 年的冠軍是顏水成團(tuán)隊(duì)的一個(gè)小高峰,那么在 2012 年,他們則經(jīng)歷了一個(gè)徹底的大轉(zhuǎn)折——全面轉(zhuǎn)向深度學(xué)習(xí)。Pascal VOC 挑戰(zhàn)賽在 2012 年迎來(lái)收官之戰(zhàn)。董健和夏威作為主力,分別攬下了分類和分割兩個(gè)賽道的冠軍。至此,顏水成團(tuán)隊(duì)在分類子項(xiàng)上實(shí)現(xiàn)三連冠,總共拿下四個(gè)冠軍。這也是傳統(tǒng)視覺算法最后的輝煌。而另一邊,同期舉行的 ImageNet 挑戰(zhàn)賽終于在這一年大放異彩。包括顏水成在內(nèi)的所有人都沒有預(yù)料到,一輪新的人工智能熱潮會(huì)在那里被掀起。2018 年圖靈獎(jiǎng)得主、時(shí)任多倫多大學(xué)教授的 Geoffrey Hinton 團(tuán)隊(duì)提出深度卷積神經(jīng)網(wǎng)絡(luò) AlexNet,在 ImageNet 挑戰(zhàn)賽上一舉奪魁,深度學(xué)習(xí)的大潮由此拉開序幕。顏水成是“AlexNet時(shí)刻”的見證者之一,他和組里的學(xué)生都大為震動(dòng)。雖然那時(shí)團(tuán)隊(duì)在全球視覺比賽的舞臺(tái)上已經(jīng)屢獲佳績(jī),但他們驚訝地發(fā)現(xiàn),自己所用的傳統(tǒng)方法與深度學(xué)習(xí)這個(gè)“新物種”相比,竟能有這么大的 Gap。
顏水成對(duì)神經(jīng)網(wǎng)絡(luò)非常熟練,早在2000年,他就采用神經(jīng)網(wǎng)絡(luò)給北京一家企業(yè)做經(jīng)濟(jì)指標(biāo)的預(yù)測(cè)模型,產(chǎn)品上線后客戶反饋效果特別好。當(dāng)時(shí),Data-adaptive kernel 這樣的想法他就曾在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)上嘗試過。面對(duì)深度學(xué)習(xí)帶來(lái)的巨大性能提升,顏水成果斷下了決定:這是歷史性的變革,ALL-IN!。自此,顏水成整個(gè)實(shí)驗(yàn)室的研究方向和工作重點(diǎn)都完全轉(zhuǎn)到了深度學(xué)習(xí),是繼 Hinton 等先驅(qū)者之后第一批開始深度學(xué)習(xí)探索的實(shí)驗(yàn)室之一。
同時(shí)基于新加坡的優(yōu)勢(shì),顏水成的實(shí)驗(yàn)室應(yīng)該也是亞洲最早擁有百卡級(jí)NVIDIA GPU的大學(xué)實(shí)驗(yàn)室。顏水成在多年后告訴雷峰網(wǎng):“我不太相信某一代技術(shù)能解決所有問題,新一代技術(shù)出現(xiàn)一定能帶來(lái)更大的機(jī)會(huì)。所以我保持著隨時(shí)清零的心態(tài),新東西如果真的好,那我就會(huì)馬上把它往前推動(dòng)。”正是這種心態(tài),使得顏水成在之前的子空間、稀疏表示/低秩矩陣的兩次浪潮中都收獲頗豐,都有單篇引用過千的論文, 這一次則輪到了深度學(xué)習(xí)。他的學(xué)生后來(lái)都十分感激當(dāng)時(shí)顏水成的決斷:“最重要的是當(dāng)時(shí)顏老師的技術(shù)視野。方向選擇對(duì)了,打比賽拿名次就是水到渠成的事兒?!睕Q定轉(zhuǎn)型后,一個(gè)專門小組很快就成立了,為轉(zhuǎn)戰(zhàn) 2013 年的 ImageNet 挑戰(zhàn)賽做準(zhǔn)備。
顏水成把復(fù)現(xiàn) AlexNet 的任務(wù)交給了組里 11 級(jí)博士生林敏。
林敏
林敏從北京大學(xué)元培班畢業(yè),讀生物科學(xué)專業(yè),喜歡寫些代碼。進(jìn)入 NUS 后,林敏先去了一個(gè)生物實(shí)驗(yàn)室輪轉(zhuǎn)。那段時(shí)間,林敏白天做生物實(shí)驗(yàn),晚上寫代碼,同時(shí)在網(wǎng)上學(xué)吳恩達(dá)的機(jī)器學(xué)習(xí)課程。后來(lái)他覺得二選一才能更專注,于是干脆轉(zhuǎn)計(jì)算機(jī)。
然而,新舊事物之間并不總能迅速而平滑地更替,很多團(tuán)隊(duì)都在試圖復(fù)現(xiàn)并超越 AlexNet,顏水成團(tuán)隊(duì)在這一年的分類任務(wù)上采取的方案,是在復(fù)現(xiàn)的基礎(chǔ)上加以部分改動(dòng),同時(shí)沿用傳統(tǒng)的方法。也就是說,是一個(gè)“大雜燴”。最終第二名的成績(jī),象征了傳統(tǒng)視覺時(shí)代最后一次并不優(yōu)雅的掙扎。而對(duì)“大雜燴”不很滿意的林敏,也想要做一個(gè)全新的深度網(wǎng)絡(luò)出來(lái)。問題是,這個(gè)網(wǎng)絡(luò)要做成什么樣?顏水成下了一個(gè)命題:做減法。在當(dāng)時(shí)計(jì)算資源非常受限的大背景下,要用最小的資源達(dá)到最優(yōu)的性能。從這個(gè)目標(biāo)出發(fā),林敏負(fù)責(zé)網(wǎng)絡(luò)架構(gòu)的設(shè)計(jì),陳強(qiáng)則從視覺應(yīng)用的角度與林敏討論數(shù)據(jù)量的規(guī)模。他們最后提出了著名的網(wǎng)絡(luò)結(jié)構(gòu) NIN(Network in Network),首次使用了 1×1 卷積。1×1 卷積這個(gè)絕妙的設(shè)計(jì),是林敏的一次“妙手偶得之”。在構(gòu)思網(wǎng)絡(luò)結(jié)構(gòu)那段時(shí)間,林敏在一次課上突然出現(xiàn)自發(fā)性氣胸,住院一周。不過這絲毫未耽誤他的進(jìn)度,他沒想到的是,躺在醫(yī)院病床上的那一周,靈感全都迸發(fā)了出來(lái)。他讀到了“生成對(duì)抗網(wǎng)絡(luò)(GAN)之父” Ian Goodfellow 在那年發(fā)表的一篇論文。這篇論文提出名為 Maxout 的網(wǎng)絡(luò),在線性變化之外添加 Max(求最大值) 操作,從而改進(jìn)了以往的常規(guī)卷積網(wǎng)絡(luò)。林敏思來(lái)想去,尋到了 Maxout 在當(dāng)時(shí)具有最高識(shí)別率的原因所在,那就是有了 Max 操作后,它就比廣義線性模型更復(fù)雜了。他想到,如果再往前推進(jìn)一點(diǎn)呢?能不能把它變得更復(fù)雜一些?比如,在每一個(gè)卷積層后面再添加一個(gè) MLP(多層感知器)卷積層。
Network in Network在最后實(shí)現(xiàn)的時(shí)候,他才驚喜地發(fā)現(xiàn),太巧妙了,這正是 1×1 的卷積!加上一層 MLP 后,可以全連接地輸出同樣數(shù)量的特征圖,不必改變輸出的尺寸,卷積層之后又緊跟著神經(jīng)元激活函數(shù),所以在減少參數(shù)的同時(shí),網(wǎng)絡(luò)變深了,效果也進(jìn)而得以提升。2014 年,NIN 的“考試”來(lái)了。董健和林敏作為主力,以 NIN 作為主干網(wǎng)絡(luò),在 ImageNet 檢測(cè)子項(xiàng)“使用訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練”場(chǎng)景上獲得了冠軍。NIN 的勝利不止于此。當(dāng)時(shí)實(shí)驗(yàn)室的另外一個(gè)博士生劉洛麒,正在想辦法將深度學(xué)習(xí)應(yīng)用到人臉領(lǐng)域。有了 NIN 的加持,很快他就將當(dāng)時(shí)人臉識(shí)別和人臉檢測(cè)最權(quán)威的基準(zhǔn) LFW 和 FDDB 的性能,刷到了當(dāng)時(shí)世界最好的成績(jī)。
劉洛麒
同年,谷歌大腦團(tuán)隊(duì)推出的 GoogLeNet 也從 NIN 汲取靈感,采用 1x1 卷積,拿到了檢測(cè)任務(wù)中“使用額外訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練”場(chǎng)景的冠軍,他們自稱network in network in network。當(dāng)時(shí)谷歌大腦的總監(jiān) Vincent Vanhoucke 和大神Jeff Dean在賽后當(dāng)即給顏水成團(tuán)隊(duì)發(fā)了郵件表示祝賀。
不僅是 GoogLeNet,2015 年的冠軍 ResNet 也使用了 1x1 卷積。NIN的核心1x1卷積成為后來(lái)幾乎所有 CNN 模型變體的基礎(chǔ)模塊,極大地促進(jìn)了深度學(xué)習(xí)的發(fā)展。Network in Network 的名字,背后還有一個(gè)小故事。顏水成和林敏通過郵件來(lái)回溝通了好幾輪,其中有一個(gè)名字能縮寫成MIN,很貼合林敏的名字,但全名不是很直白,最后顏水成建議Network in Network, 兩人都覺得形象生動(dòng),就拍板下來(lái)了NIN(您)。后來(lái)2014比賽演講的標(biāo)題就設(shè)成了 NIN Good (您好)!投身深度學(xué)習(xí)浪潮的三年以來(lái),這是顏水成和他的學(xué)生們真正意義上的第一次勝利。
03技術(shù)落地大潮來(lái)臨
時(shí)間來(lái)到 2015 年。八年過去,顏水成在計(jì)算機(jī)視覺領(lǐng)域聲名鵲起,團(tuán)隊(duì)每年在視覺頂會(huì)上的文章接受量非常耀眼。在視覺之外,他在多媒體領(lǐng)域的研究成果同樣十分突出。從首次獲得 Pascal VOC 冠軍開始的四年里,顏水成團(tuán)隊(duì)開始收獲他們?cè)趪?guó)際多媒體頂級(jí)會(huì)議 ACM Multimedia (ACM MM)上的獎(jiǎng)項(xiàng)大滿貫:2010 年最佳論文獎(jiǎng)、2012 年最佳技術(shù)演示獎(jiǎng)、2013 年最佳論文獎(jiǎng)和最佳學(xué)生論文獎(jiǎng)。論文和獎(jiǎng)拿多了,自然會(huì)想做些不一樣的事情。首先做出技術(shù)落地嘗試的是夏威。
2012 年,一直盤算著創(chuàng)業(yè)的他,在打完分割任務(wù)的比賽后突發(fā)奇想,想將人體分割與分析(human parsing)技術(shù)用來(lái)落地,比如一鍵換衣、拍照搜衣服同款等。他專門跑去商學(xué)院修了一門創(chuàng)業(yè)課,帶著創(chuàng)業(yè)項(xiàng)目申請(qǐng)了新加坡的一個(gè) 20 萬(wàn)新幣的創(chuàng)業(yè)基金,但在倒數(shù)第二輪被斃掉了。沒拿到錢的夏威頗為失意,也在這時(shí)有了日后去硅谷創(chuàng)業(yè)的念頭。接著在第二年,顏水成帶著他的一位博士生黃君實(shí)去阿里巴巴訪問半年,并將他們的算法應(yīng)用在在阿里電商平臺(tái)上,協(xié)助第一個(gè)實(shí)現(xiàn)了拍照搜服飾同款的功能??吹郊夹g(shù)真的變成了商業(yè)系統(tǒng),他感覺打開了一片新的天地,也埋下了對(duì)技術(shù)落地的憧憬。
黃君實(shí)
2015 年,顏水成真正覺得,時(shí)候到了。
這一年是整個(gè)視覺領(lǐng)域的轉(zhuǎn)折點(diǎn)。孫劍在 MSRA 帶領(lǐng)何愷明、張祥雨、任少卿憑借 ResNet 在 ImageNet 奪冠,掀起了一波更大的深度學(xué)習(xí)浪潮。機(jī)器學(xué)習(xí)的研究路子徹底成了實(shí)驗(yàn)科學(xué),所謂“大力出奇跡”,誰(shuí)有數(shù)據(jù)、算力,誰(shuí)就是王道,而王道就掌握在工業(yè)界的少數(shù)幾個(gè)巨頭手中。一時(shí)間,許多學(xué)術(shù)界的頂尖學(xué)者開始奔向工業(yè)界,既是向往企業(yè)的“大力”,也是為了尋找技術(shù)落地的機(jī)會(huì)。吳恩達(dá)被余凱說服,在 2014 年去往百度任首席科學(xué)家。李飛飛則在 2016 年從斯坦福大學(xué)離職加入谷歌,孫劍也在這一年加盟曠視。有趣的是,吳恩達(dá)、余凱、李飛飛、孫劍等人與顏水成都是76年前后生人。他們經(jīng)歷了同樣的時(shí)代:大學(xué)期間經(jīng)歷了90年代互聯(lián)網(wǎng)浪潮的興起;攻讀博士時(shí)在AI低谷期的沉淀,反而成為了他們?cè)贏I時(shí)代到來(lái)時(shí)最寶貴的財(cái)富;當(dāng)在各自領(lǐng)域深耕數(shù)年,學(xué)術(shù)研究已經(jīng)達(dá)到了一個(gè)上限的時(shí)候,他們不約而同選擇在技術(shù)落地上進(jìn)行下一個(gè)突破。他們相互影響,成就了彼此。
就在這個(gè)時(shí)候,有“紅衣教主”之稱的奇虎 360 董事長(zhǎng)周鴻祎正在醞釀成立一個(gè) AI 研究院,并從北京向顏水成拋來(lái)了橄欖枝。幾乎每家老牌互聯(lián)網(wǎng)大廠,都在那時(shí)紛紛投資深度學(xué)習(xí),AI 研究院成為標(biāo)配。顏水成在視覺研究上的耀眼履歷自不必說,他的團(tuán)隊(duì)在比賽中多次奪冠,強(qiáng)大的技術(shù)研發(fā)與實(shí)踐能力是周鴻祎尤為欣賞的地方。而從顏水成的視角,他看中的是 360 的場(chǎng)景。他那時(shí)發(fā)現(xiàn),360 做智能硬件對(duì)視覺技術(shù)的需求很大,軟硬件結(jié)合會(huì)是視覺的一個(gè)大趨勢(shì)。此外,搜索、廣告、金融、直播等AI和大數(shù)據(jù)緊密結(jié)合的應(yīng)用場(chǎng)景,360也都兼而有之。這對(duì)于他和學(xué)生們來(lái)說,是一個(gè)大好機(jī)會(huì)。從學(xué)術(shù)界功成身退的顏水成就此北上,帶著學(xué)生投身業(yè)界第一站,開始了技術(shù)落地的故事。
如何在企業(yè)做 AI 研究院?顏水成定義了一個(gè)下限和上限。下限,是支持好內(nèi)部業(yè)務(wù),這也是研究院的立命所在。“哪里有 AI需求,我們就沖上去?!?這是顏水成所稱的“萬(wàn)金油打法”。上限,是用技術(shù)去驅(qū)動(dòng)甚至創(chuàng)造一個(gè)新業(yè)務(wù)和行業(yè),在彼時(shí)的360,這項(xiàng)新業(yè)務(wù)就是IoT。顏水成很快轉(zhuǎn)向“在商言商”的實(shí)用主義思維,將視覺研究置于商業(yè)邏輯的閉環(huán)內(nèi),與團(tuán)隊(duì)協(xié)同作戰(zhàn),打大仗。為打造智能硬件產(chǎn)品,顏水成與學(xué)生以及研究院的幾十位研究員們,度過了許多個(gè)加班加點(diǎn)的攻堅(jiān)之戰(zhàn)。到 2018 年,他們已將人臉識(shí)別、語(yǔ)音識(shí)別、SLAM 等技術(shù)落地在非常多產(chǎn)品上。這年的雙十一前夕,顏水成在 360 產(chǎn)品發(fā)布會(huì)上,推出 6 大“安全”智能硬件新品,以總價(jià)不足 3500 元的低價(jià)殺入了 IoT 市場(chǎng),業(yè)界驚呼“性價(jià)比逆天”。對(duì)于顏水成來(lái)說,這是一次了不起的轉(zhuǎn)身。
顏水成在2018年10月30日 360 產(chǎn)品發(fā)布會(huì)上
決策智能也是顏水成技術(shù)落地的場(chǎng)景之一。這年 12 月,360 金融在納斯達(dá)克敲響上市鐘,顏水成的團(tuán)隊(duì)在大數(shù)據(jù)智能風(fēng)控方面提供了支持。360 的廣告、推薦業(yè)務(wù)也由深度學(xué)習(xí)技術(shù)作支撐。
除了技術(shù)落地,技術(shù)本身的升華也未間斷。2017 年,顏水成帶領(lǐng) 360 與 NUS 的聯(lián)隊(duì)提出雙通道網(wǎng)絡(luò) DPN,在 ImageNet 挑戰(zhàn)賽上獲得冠軍,為這個(gè)舉辦了八年的賽事畫上了圓滿的句號(hào),同時(shí)也成為PASCAL VOC和ImageNet 兩項(xiàng)賽事收官之戰(zhàn)的雙料冠軍團(tuán)隊(duì)。這次的靈魂人物是顏水成的學(xué)生陳云鵬,DPN的提出者,后來(lái)他也拒絕了Facebook的offer跟隨顏水成來(lái)到中國(guó)。除了極高的準(zhǔn)確率之外,DPN 的最大特點(diǎn)是低能耗,將 ResNet 的計(jì)算量降低了 57%,在實(shí)測(cè)中提速高達(dá) 300%。這其實(shí)也是結(jié)合工業(yè)界落地需求的必然結(jié)果。IoT 產(chǎn)品對(duì)資源利用率要求非常高,DPN 作為一個(gè)更輕量級(jí)的視覺模型,讓 360 在視覺理解的賽道上邁出了更大一步。步入 2019 年,顏水成感覺在 360 使命已畢,決意開始新的征程。
2018 年師門聚會(huì):左起劉洛麒、董健、夏威、顏水成、陳強(qiáng)、黃君實(shí)、程斌(手機(jī)中照片為林敏)
他與學(xué)生們也就此暫別。
此時(shí),林敏已于 2017 年11 月舉家飛往加拿大,在深度學(xué)習(xí)“三巨頭”之一Yoshua Bengio 的Mila實(shí)驗(yàn)室做博士后,繼續(xù)學(xué)術(shù)上新的探索。陳強(qiáng)離開的腳步比顏水成稍快了一些。念鄉(xiāng)情的他回到老家上海,加入了“下沉市場(chǎng)三巨頭”之一趣頭條 ,在那里帶AI算法團(tuán)隊(duì)。彼時(shí)他相信,互聯(lián)網(wǎng)還有“增長(zhǎng)”這個(gè)故事可講。董健則在顏水成離開后繼續(xù)留在了 360。由于對(duì)工程和業(yè)務(wù)落地更感興趣,董健選擇離開研究院,轉(zhuǎn)而領(lǐng)導(dǎo)360智能工程部,負(fù)責(zé)公司級(jí)的AI基礎(chǔ)設(shè)施建設(shè)和中臺(tái)化AI能力輸出,支持搜索、推薦、廣告、金融和視覺等泛AI業(yè)務(wù)。而劉洛麒留在了360 AI 研究院,繼續(xù)負(fù)責(zé)計(jì)算機(jī)視覺在 IoT 和互聯(lián)網(wǎng)業(yè)務(wù)的落地。后來(lái)他加入美圖,領(lǐng)導(dǎo)美圖影像研究院(MT Lab),負(fù)責(zé)產(chǎn)品核心算法研發(fā),并在新一輪AI大模型浪潮中,研發(fā)出國(guó)內(nèi)首款懂美學(xué)的美圖視覺大模型MiracleVision。黃君實(shí)則在360信息流產(chǎn)品部磨煉一段時(shí)間之后,加入了美團(tuán)視覺智能中心,繼續(xù)探索他的產(chǎn)研之路。
畢業(yè)之后就創(chuàng)業(yè)的程斌,則開啟了二次創(chuàng)業(yè)之路,其所在公司Fasion.AI是國(guó)內(nèi)較早聚焦于AIGC及其商業(yè)化落地的初創(chuàng)團(tuán)隊(duì)。
畢業(yè)后沒有跟隨團(tuán)隊(duì)加入360但卻一直有著創(chuàng)業(yè)夢(mèng)的夏威,則在畢業(yè)答辯之前就帶著老師的祝福飛往舊金山灣區(qū)創(chuàng)業(yè)。他作為創(chuàng)始成員加入了華人留學(xué)生創(chuàng)辦的 CV 公司 Orbeus,擔(dān)任chief scientist,負(fù)責(zé)識(shí)別算法的研發(fā)。2015年底公司被亞馬遜收購(gòu)后,他隨之加入了AWS AI,擔(dān)任Principal Scientist,領(lǐng)導(dǎo)團(tuán)隊(duì)先后發(fā)布了AWS最早的幾款Cloud AI產(chǎn)品Rekognition,Textract等。
學(xué)生們各自求仁得仁,顏水成也重整行裝,準(zhǔn)備尋找技術(shù)落地的新土壤。2019 年 7 月,在老朋友朱瓏的盛情相邀下,顏水成來(lái)到了“AI四小龍”之一的依圖科技,出任 CTO,繼續(xù)讓 AI 技術(shù)在更多場(chǎng)景真正落地。那時(shí)的依圖在人臉識(shí)別競(jìng)賽 NIST-FRVT 上已蟬聯(lián)三年冠軍,而依圖的安防和醫(yī)療賽道,不僅能為顏水成將視覺落地提供場(chǎng)景,更與他對(duì)技術(shù)價(jià)值的想象十分吻合。
這一次,顏水成給自己定義了兩個(gè)命題,一是做好視覺研究,二是推動(dòng)技術(shù)與業(yè)務(wù)的結(jié)合,進(jìn)一步落地。在依圖的一年多時(shí)間里,他都努力在實(shí)踐這兩個(gè)命題。2020 年4月25 日,顏水成的恩師黃煦濤過世。悲傷之余,顏水成開始靜心思考如果再工作四十年,最應(yīng)該做什么。
他把答案落在了重回學(xué)術(shù)基礎(chǔ)研究上,此后他的幾次選擇都離不開這次深度的思考。2021年1月,顏水成重回新加坡,正式出任 Sea 集團(tuán)首席科學(xué)家,并負(fù)責(zé)從零建設(shè)和領(lǐng)導(dǎo) Sea 人工智能實(shí)驗(yàn)室(SAIL)。林敏、陳強(qiáng)、董健等人則開始了他們第二次的追隨,
不同的是,加入 Sea 后,他們是各自沿著不同的軌道繼續(xù)行駛。陳強(qiáng)和董健在工業(yè)界磨煉多年,加入了Shopee,現(xiàn)在仍在Shopee領(lǐng)導(dǎo)著業(yè)務(wù)線。一如既往學(xué)者范的林敏,則跟隨顏水成同在 SAIL,探索 AI For Science 應(yīng)用。顏水成提到這位學(xué)生總是夸贊不停,讓他去推動(dòng)一些新的方向。如今,林敏依舊在Sea擔(dān)任著AI首席研究員,繼續(xù)著他的學(xué)術(shù)研究之路。
2023年年初,昆侖萬(wàn)維創(chuàng)始人周亞輝聯(lián)系上顏水成,彼時(shí)的顏水成剛剛結(jié)束在 Sea的研究工作,準(zhǔn)備去智源研究院訪問一段時(shí)間。在顏水成眼中,智源研究院或許是中國(guó)最接近 Open AI 和 Deepmind 風(fēng)格的團(tuán)隊(duì),而恩師張宏江正是智源的創(chuàng)始人,他用「潛心磨劍」形容自己的這次游歷與訪問。歷時(shí)半年,在智源的訪問結(jié)束之后,顏水成再次整裝重新出發(fā)。而年初周亞輝的出現(xiàn),為這次重新出發(fā)更添了一份傳奇色彩,早在顏水成決定去智源訪問之時(shí),周亞輝便提前預(yù)定了需要顏水成出任「AI掌門」。
「我早就決定去智源訪問一段時(shí)間,您可能需要等?!?/p>
「沒問題。」
2023年9 月,顏水成正式加入昆侖萬(wàn)維,與周亞輝一起出任天工智能聯(lián)席 CEO,并兼任昆侖萬(wàn)維 2050 全球研究院院長(zhǎng)。如今,顏水成早已是新加坡工程院院士,同時(shí)當(dāng)選 AAAI Fellow、ACM Fellow、IEEE Fellow 和 IAPR Fellow 等諸多榮譽(yù),是中國(guó)計(jì)算機(jī)視覺領(lǐng)域的佼佼者。
并且,他已經(jīng)八次入選「湯森路透全球高被引學(xué)者」。毫無(wú)疑問,此時(shí)的顏水成選擇再次入局工業(yè)界,是帶著更大的底氣與實(shí)力。于顏水成而言,他想在企業(yè)研究院進(jìn)行長(zhǎng)期性研究,做出新突破,把握住這波 AI 浪潮帶來(lái)的新機(jī)遇。
這些年來(lái),顏水成和學(xué)生們每一次的選擇都并非是隨波逐流,而是對(duì)潮流的主動(dòng)把握。但這一次,顏水成有了新的思考,他想自己創(chuàng)造潮流。
在研究層面上,多年以來(lái),顏水成一直追求學(xué)術(shù)界和工業(yè)界的雙重滿足(Double Satisfactions),在技術(shù)層面一直追求走在AI的浪尖上,在他看來(lái)目前的浪尖是Foundation Models,也正是AI最令人興奮的時(shí)刻。
他始終認(rèn)為通用人工智能時(shí)代來(lái)臨,未來(lái)?yè)碛袩o(wú)限可能。在通用人工智能領(lǐng)域,從研究、研發(fā)到產(chǎn)品是完整的鏈條,缺一不可,只有將三者完全打通,研究才能發(fā)揮最大價(jià)值。
昆侖萬(wàn)維愿意將研究、研發(fā)、產(chǎn)品三線合一,無(wú)疑是顏水成實(shí)現(xiàn)潮流創(chuàng)造之夢(mèng)的絕佳平臺(tái)。此外,昆侖萬(wàn)維承諾提供的研究環(huán)境,在顏水成看來(lái),也是一個(gè)新的世外桃源之地。以前大量的AI PhD畢業(yè)生選擇離開了新加坡,一個(gè)核心原因是缺少像硅谷那樣支持最前沿AI基礎(chǔ)研究的企業(yè),昆侖萬(wàn)維2050研究院將是本地企業(yè)的起點(diǎn),這樣更多的新加坡畢業(yè)生可以選擇留下來(lái),同時(shí)也能吸引合適的研究者來(lái)到新加坡。昆侖萬(wàn)維2050研究院也將擔(dān)當(dāng)AI前沿研究的種子,更多的本地和海外企業(yè)如果跟進(jìn)建立Labs, 新加坡就會(huì)建立完善的生態(tài)圈,為扎根新加坡、面向東南亞市場(chǎng)的企業(yè)提供強(qiáng)大的技術(shù)和信心支撐。
目前,昆侖萬(wàn)維2050全球研究院還處于早期孵化階段,但顏水成的抱負(fù)十分遠(yuǎn)大:他希望建立一支既懂學(xué)術(shù)、又懂商業(yè),能夠真正把研究、研發(fā)和產(chǎn)品結(jié)合在一起的優(yōu)秀團(tuán)隊(duì),幫助昆侖萬(wàn)維打造業(yè)界領(lǐng)先的人工智能團(tuán)隊(duì),推動(dòng)天工大模型及AIGC業(yè)務(wù)邁向一個(gè)新高度,加速AI產(chǎn)品的研發(fā)、落地及商業(yè)化。確保昆侖萬(wàn)維2050全球研究走在通往通用人工智能(AGI)正確的路徑上,是顏水成在昆侖萬(wàn)維的新使命。關(guān)于方向,顏水成表示將逐步開展不同領(lǐng)域的研究:下一代Foundation Model的基礎(chǔ)研究和研發(fā);Agent的研發(fā)和智能體進(jìn)化的研究;生物智能等前沿技術(shù)領(lǐng)域的探索。他的重點(diǎn)的方向會(huì)主要圍繞下一代Foundation Model,研究方向也會(huì)從以前專注計(jì)算機(jī)視覺,更多地轉(zhuǎn)向CV+NLP,多模態(tài)的研究。
這一次,盡管學(xué)生們?cè)缫迅鞅紪|西,但傳承仍在持續(xù)。除了前文提及的董健、陳強(qiáng)、林敏仍在Shopee外,顏水成的學(xué)生遍布全球AI行業(yè),馮佳時(shí)現(xiàn)在是字節(jié)跳動(dòng)智能內(nèi)容創(chuàng)作基礎(chǔ)研究團(tuán)隊(duì)負(fù)責(zé)人;劉洛麒現(xiàn)在擔(dān)任著美圖影像研究院(MT Lab)負(fù)責(zé)人;程斌也繼續(xù)在創(chuàng)業(yè)道路上努力前行。顏水成現(xiàn)在則除了做研究之外,也在通過培養(yǎng)學(xué)生、指導(dǎo)他們?nèi)谫Y,讓學(xué)生們能夠通過創(chuàng)業(yè)的方式在AI行業(yè)發(fā)光發(fā)熱。回顧顏水成的學(xué)術(shù)與產(chǎn)業(yè)經(jīng)歷,獅城新加坡是一個(gè)重要據(jù)地。
2007年,他第一次踏入新加坡,曾給恩師黃煦濤發(fā)郵件請(qǐng)教“how to be a good professor”,得到的回答是“Just be yourself”。他把這句話分享給了學(xué)生們,并闡釋為“Confident、Unique、...”,懷著這種信念去挑戰(zhàn)世界級(jí)比賽、發(fā)表頂級(jí)論文,并毅然帶領(lǐng)學(xué)生們走向工業(yè)界。這些年兜兜轉(zhuǎn)轉(zhuǎn),顏水成心中的信念和愿景始終不變,“希望像李開復(fù)那一代人那樣做AI布道人,拉一些有號(hào)召力的人進(jìn)來(lái)?!?/p>
他說,這份使命和責(zé)任將永遠(yuǎn)支撐著他們繼續(xù)前行。
現(xiàn)在,顏水成可以重新出發(fā)了。
雷峰網(wǎng) 雷峰網(wǎng) 雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。