丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能學(xué)術(shù) 正文
發(fā)私信給叢末
發(fā)送

0

專(zhuān)訪商湯聯(lián)合創(chuàng)始人林達(dá)華:CV 才剛剛開(kāi)始,遠(yuǎn)沒(méi)到鼎盛時(shí)期

本文作者: 叢末 2019-11-05 00:22
導(dǎo)語(yǔ):只是增速放緩~


雷鋒網(wǎng) AI 科技評(píng)論:今年 ICCV 上,華人收錄論文數(shù)量首次超越了美國(guó),對(duì)于華人研究者而言,ICCV 2019 也成為了一場(chǎng)具備“轉(zhuǎn)折點(diǎn)”意義的國(guó)際學(xué)術(shù)頂會(huì)。而從現(xiàn)場(chǎng)參會(huì)情況來(lái)看,無(wú)論是參會(huì)者、展商,還是 Oral 報(bào)告和 Poster 上,刷臉率最高的也當(dāng)屬華人面孔。 

在這樣的華人高光背景色中,商湯科技無(wú)疑是本屆ICCV中的 “C 位”角色。作為一家從實(shí)驗(yàn)室走出來(lái)的 AI 公司,商湯科技在學(xué)術(shù)領(lǐng)域上一直都是一個(gè)出類(lèi)拔萃的存在,而在這場(chǎng)會(huì)議中,則可以用“獨(dú)占鰲頭”做形容:ICCV 2019中,商湯科技不僅有57篇論文入選,成為全球企業(yè)中收錄論文最多的企業(yè),還在ICCV的一眾競(jìng)賽項(xiàng)目上斬獲13項(xiàng)世界冠軍。

會(huì)議期間,雷鋒網(wǎng) AI 科技評(píng)論也有幸采訪到了商湯科技聯(lián)合創(chuàng)始人、港中文-商湯聯(lián)合實(shí)驗(yàn)室主任林達(dá)華教授,基于商湯科技以及其團(tuán)隊(duì)在ICCV 2019的論文成果,聊了聊商湯科技在 ICCV 上的表現(xiàn),以及商湯科技與聯(lián)合實(shí)驗(yàn)室的整體布局情況。

不僅如此,林達(dá)華教授本人作為深度學(xué)習(xí)與計(jì)算機(jī)視覺(jué)領(lǐng)域的資深科學(xué)家,也難得地在本次采訪中分享了一些他個(gè)人的研究經(jīng)歷和觀點(diǎn),并對(duì)華人今年在 ICCV 上的表現(xiàn)談了談自己的感受。

以下為 AI 科技評(píng)論與林達(dá)華教授的對(duì)話實(shí)錄。

專(zhuān)訪商湯聯(lián)合創(chuàng)始人林達(dá)華:CV 才剛剛開(kāi)始,遠(yuǎn)沒(méi)到鼎盛時(shí)期

林達(dá)華,香港中文大學(xué)資訊工程系助理教授,商湯科技聯(lián)合創(chuàng)始人,并擔(dān)任香港中文大學(xué)-商湯科技聯(lián)合實(shí)驗(yàn)室主任。加入香港中文大學(xué)前,林達(dá)華于2012年至2014年擔(dān)任芝加哥豐田科技研究院研究助理教授。林達(dá)華教授的研究領(lǐng)域涵蓋計(jì)算機(jī)視覺(jué)、機(jī)器學(xué)習(xí)、大數(shù)據(jù)分析等,近年來(lái)主要專(zhuān)注于深度學(xué)習(xí)及深度學(xué)習(xí)在高層次視覺(jué)理解、概率推斷、大數(shù)據(jù)分析領(lǐng)域的應(yīng)用。林達(dá)華教授在CVPR、ICCV、ECCV、NIPS、T-PAMI等計(jì)算機(jī)視覺(jué)與機(jī)器學(xué)習(xí)頂級(jí)會(huì)議與期刊上發(fā)表過(guò)逾百篇論文。他在貝葉斯非參建模方面的開(kāi)創(chuàng)性工作于2010年獲得NIPS的最佳學(xué)生論文獎(jiǎng)。他還曾獲ICCV 2009 、ICCV 2011最佳審稿人獎(jiǎng),指導(dǎo)香港中文大學(xué)研究團(tuán)隊(duì)參加ImageNet2016、ActivityNet2016、ActivityNet2017等國(guó)際競(jìng)賽,并獲得多個(gè)獎(jiǎng)項(xiàng)。他還擔(dān)任ECCV 2018、CVPR2019、AAAI2020領(lǐng)域主席。林達(dá)華教授2012年獲得美國(guó)麻省理工學(xué)院計(jì)算機(jī)科學(xué)博士學(xué)位,2007年獲得香港中文大學(xué)資訊工程碩士學(xué)位,2004年獲得中國(guó)科學(xué)技術(shù)大學(xué)電子工程與信息科學(xué)學(xué)士學(xué)位。

57篇論文!提出、定義并解決新問(wèn)題

AI科技評(píng)論:商湯科技在CVPR、ICCV 等計(jì)算機(jī)視覺(jué)領(lǐng)域的國(guó)際頂會(huì)上的表現(xiàn)一直都非常出色,其中今年的ICCV 更是中了57篇論文之多,那這些論文中,您認(rèn)為比較具有突破性意義的成果有哪些?

 林達(dá)華:這些論文中,有相當(dāng)一部分都在某個(gè)特定方向取得了顯著的進(jìn)展,有在應(yīng)用上的拓展,也有在核心方法上的創(chuàng)新。我這里主要選取我比較熟悉的兩個(gè)工作來(lái)介紹:

 一項(xiàng)工作是今年 ICCV 的一篇Oral論文 《CARAFE: Content-Aware ReAssembly of FEatures》,它解決了一個(gè)非常關(guān)鍵的問(wèn)題:檢測(cè)任務(wù)中需要將多個(gè)尺度的特征結(jié)合起來(lái)進(jìn)行分析。當(dāng)這些特征對(duì)齊到一個(gè)協(xié)同的分母上進(jìn)行融合時(shí),傳統(tǒng)方法是通過(guò)升采樣的方式來(lái)進(jìn)行融合,然而在這個(gè)過(guò)程中我們發(fā)現(xiàn),這種升采樣跟傳統(tǒng)的圖像升采樣有很大的區(qū)別,如果直接采用傳統(tǒng)的升采樣方法,最終的效果會(huì)受到很大的抑制。 

專(zhuān)訪商湯聯(lián)合創(chuàng)始人林達(dá)華:CV 才剛剛開(kāi)始,遠(yuǎn)沒(méi)到鼎盛時(shí)期

而在這篇論文中,我們提出了一個(gè)輕量級(jí)的通用升采樣算子 CARAFE,在特征升采樣的融合中可以最大限度地保留其中的重要特征,并且能夠廣泛地應(yīng)用到各種需要結(jié)合多尺度特征來(lái)進(jìn)行分析的任務(wù)中。CARAFE 雖然非常簡(jiǎn)單和輕量化,但在多種不同任務(wù)中都一致并很好地提升了模型的性能,我們未來(lái)會(huì)將這種方法進(jìn)行比較廣泛地應(yīng)用。 另一項(xiàng)工作則是我個(gè)人非常喜歡的一項(xiàng)關(guān)于舞蹈生成的工作,《Convolutional Sequence Generation for Skeleton-Based Action Synthesis》。

專(zhuān)訪商湯聯(lián)合創(chuàng)始人林達(dá)華:CV 才剛剛開(kāi)始,遠(yuǎn)沒(méi)到鼎盛時(shí)期

以前的舞蹈生成基本上生成的是一些小圖片或者非常短的小視頻,而長(zhǎng)視頻的生成對(duì)于計(jì)算機(jī)視覺(jué)而言一直都是非常大的挑戰(zhàn)。 

這項(xiàng)工作則提出通過(guò)圖的反卷積和持續(xù)反卷積的疊合,使用高斯過(guò)程來(lái)逐漸生成一個(gè)非常長(zhǎng)的任意時(shí)空尺度的視頻序列。這樣的話,這種方法其實(shí)就解決了視頻生成中的一個(gè)關(guān)鍵挑戰(zhàn),即如何生成長(zhǎng)時(shí)間或任意尺度的視頻序列,并且在此過(guò)程中能夠很好地保持序列在時(shí)間和空間上的結(jié)構(gòu)。我認(rèn)為這是一項(xiàng)非常有意義的工作,并且在未來(lái),這項(xiàng)工作對(duì)于增強(qiáng)現(xiàn)實(shí)、視頻內(nèi)容生成等任務(wù)可能都有非常廣泛的應(yīng)用潛力。  

AI科技評(píng)論:其中舞蹈生成這項(xiàng)工作具體是在什么背景下開(kāi)展的?過(guò)程中遇到過(guò)什么挑戰(zhàn)或者有趣的故事嗎? 

林達(dá)華:一年多以前,生成成為了計(jì)算機(jī)視覺(jué)領(lǐng)域一個(gè)特別受關(guān)注的方向,包括現(xiàn)在 ICCV 這個(gè)會(huì)上也有很多關(guān)于GAN 和生成的工作,但是其中大部分工作重點(diǎn)關(guān)注的還是空間結(jié)構(gòu)的生成,然而我們?cè)诮佑|和研究了大量關(guān)于視頻生成的工作后,發(fā)現(xiàn)現(xiàn)在的生成相關(guān)的工作對(duì)于時(shí)間結(jié)構(gòu)的把握還存在比較大的空白,這就驅(qū)動(dòng)我們開(kāi)始了這個(gè)研究項(xiàng)目,希望能夠填補(bǔ)該領(lǐng)域?qū)τ陂L(zhǎng)時(shí)間尺度的生成的研究空缺。 在這個(gè)研究的開(kāi)展中,我們遇到的挑戰(zhàn)其實(shí)還挺大的:

首先,視頻生成其實(shí)是一個(gè)非常新的領(lǐng)域,它的數(shù)據(jù)量遠(yuǎn)不如圖像那么充分,并且我們研究的還是非常長(zhǎng)時(shí)間尺度的視頻生成,這項(xiàng)生成任務(wù)本身的復(fù)雜性與該領(lǐng)域數(shù)據(jù)量不足就構(gòu)成了很大的矛盾點(diǎn); 

其次,持續(xù)的生成其實(shí)還有一個(gè)很大的特點(diǎn),就是一方面要尋找不隨時(shí)間變化的共同規(guī)律,另一方面又要保持多樣性,尋求這一點(diǎn)上的平衡也成為我們面臨的一個(gè)比較大的挑戰(zhàn)。所以在模型的結(jié)構(gòu)設(shè)計(jì)上,我們做了很多探索,最后才找到一個(gè)真正能夠有效克服這些困難的模型結(jié)構(gòu),就是以高斯過(guò)程驅(qū)動(dòng)的時(shí)空?qǐng)D卷積網(wǎng)絡(luò)。 

這項(xiàng)研究開(kāi)始之初,即便生成十秒的非常簡(jiǎn)單的動(dòng)作,都存在很大的困難,而現(xiàn)在我們的模型基本上能夠生成持續(xù)十分種的舞蹈,甚至可以根據(jù)音樂(lè)和其他的一些輸入作為條件做生成。這樣的成果,其實(shí)是我們經(jīng)歷了非常多的嘗試而獲得的。

 AI科技評(píng)論:商湯科技最近幾年在ICCV 上的表現(xiàn)一直不錯(cuò),從論文層面而言,除了數(shù)量上一直在增加,還有哪些方面的特點(diǎn)?

 林達(dá)華:能夠被 ICCV 收錄的論文當(dāng)然肯定存在一定的創(chuàng)新價(jià)值,但是大多數(shù)論文還是著眼于算法的局部提升或者針對(duì)某個(gè)算法或方法的局部提出一些新的架構(gòu)和設(shè)計(jì)方法,從而實(shí)現(xiàn)性能上的提升。

當(dāng)然,商湯科技和實(shí)驗(yàn)室也做了很多改進(jìn)算法或性能上的工作,比如我們?cè)诤芏啾荣愔心昧瞬簧俟谲姡褪俏覀冊(cè)谒惴ê托阅苌系膬?yōu)化成果的重要體現(xiàn)。 但如果仔細(xì)觀察商湯科技和聯(lián)合實(shí)驗(yàn)室發(fā)的很多論文,能夠發(fā)現(xiàn)這些論文和其他多數(shù)論文有著不一樣的特點(diǎn):我們很多工作都是在定義一個(gè)新的領(lǐng)域和新的問(wèn)題,并且提出了我們自己的解決方案。從這個(gè)層面去實(shí)現(xiàn)創(chuàng)新的工作,其實(shí)在整個(gè)會(huì)議中占的比例并不多,因?yàn)槲覀兺ㄟ^(guò)在實(shí)踐中接觸到很多業(yè)務(wù)第一線的真實(shí)問(wèn)題,進(jìn)而能夠提出很多學(xué)術(shù)界實(shí)驗(yàn)室所看不到的一些問(wèn)題。 

比如說(shuō)我前面提到的兩個(gè)工作,前者是我們對(duì)大量算法進(jìn)行抽象后提出的一個(gè)算子,實(shí)現(xiàn)了算法和方法上的創(chuàng)新;而舞蹈生成則是我們?cè)趯?shí)際需求的背景下提煉出來(lái)的一個(gè)研究方向,我們剛開(kāi)始做的時(shí)候,這個(gè)方向在學(xué)術(shù)上還是處于空白階段的新問(wèn)題。

此外我們做的包括電影分析、特定約束條件下的長(zhǎng)尾場(chǎng)景的理解等工作,都是我們?cè)跇I(yè)務(wù)場(chǎng)景中所遇到的一些特殊的挑戰(zhàn),學(xué)術(shù)界對(duì)這些特殊挑戰(zhàn)的探索實(shí)際上并不是很深入。 當(dāng)然我們提出這些新問(wèn)題的過(guò)程并不是完全被動(dòng)的,并不是來(lái)了個(gè)項(xiàng)目遇到了問(wèn)題所以要克服下,而是在大量的需求中判斷整個(gè)行業(yè)的主要的痛點(diǎn)在哪,進(jìn)而提煉和提出并定義這些新的問(wèn)題,驅(qū)動(dòng)研究團(tuán)隊(duì)來(lái)開(kāi)展長(zhǎng)遠(yuǎn)的探索,最終回應(yīng)整個(gè)行業(yè)的根本需求。 

AI科技評(píng)論:論文以外,今年ICCV商湯科技還舉辦了例如WIDER 挑戰(zhàn)賽、 ICCV Night 等一系列的活動(dòng),就您看來(lái),學(xué)術(shù)頂會(huì)上的成果和表現(xiàn)于包括商湯科技在內(nèi)的企業(yè)而言,有著怎樣的意義? 

林達(dá)華:關(guān)于這一點(diǎn),我認(rèn)為可以從以下幾個(gè)層次來(lái)說(shuō): 

第一,能夠體現(xiàn)了我們持續(xù)做原創(chuàng)技術(shù)的精神和初心。現(xiàn)在很多公司專(zhuān)注于應(yīng)用和業(yè)務(wù),通常是拿著現(xiàn)有的一些技術(shù)去解決一些實(shí)際問(wèn)題,那它解決問(wèn)題的層次和深度會(huì)受到一定局限。而商湯科技會(huì)投入很大的力量去構(gòu)建這種原創(chuàng)技術(shù)的核心競(jìng)爭(zhēng)力,在這個(gè)過(guò)程中會(huì)產(chǎn)生很多就學(xué)術(shù)本身而言就很有價(jià)值的新想法、新方法、新技術(shù)以及新挑戰(zhàn)。而商湯科技對(duì)于這些問(wèn)題的研究和成果,可以在學(xué)術(shù)會(huì)議上體現(xiàn)出來(lái),并反過(guò)來(lái)成為商湯科技持續(xù)做原創(chuàng)技術(shù)研究的牽引力量。 

第二,學(xué)術(shù)會(huì)議對(duì)于整個(gè)社區(qū)的交流而言,具有非常大的價(jià)值。實(shí)際上,學(xué)術(shù)研究中最關(guān)鍵的環(huán)節(jié)就是提出好的問(wèn)題。比如說(shuō)我們?cè)谔剿鬟^(guò)程中發(fā)現(xiàn)了一些新問(wèn)題,提出了一些解決方法,并以學(xué)術(shù)論文的方式發(fā)表出來(lái),當(dāng)展示給社區(qū)的其他學(xué)術(shù)研究者時(shí),能夠推動(dòng)整個(gè)學(xué)術(shù)界運(yùn)用更大、更廣泛的力量去共同解決這些問(wèn)題。最后,這其實(shí)還能夠反哺整個(gè)行業(yè)。 

第三,在會(huì)議中舉辦比賽,其實(shí)可以看做是我們?cè)趯で笮阅艿臉O限和探索方法的邊界方面的努力。這些比賽產(chǎn)生的方案,我們不一定會(huì)直接拿到業(yè)務(wù)場(chǎng)景中區(qū)應(yīng)用,但是可以讓我們探索到某項(xiàng)技術(shù)的邊界和根本困難在哪,對(duì)我們后續(xù)的開(kāi)發(fā)和探索都具有很好的指導(dǎo)意義。與此同時(shí),有一些方案其實(shí)可以通過(guò)一些工程化的工作來(lái)進(jìn)行簡(jiǎn)化壓縮,最后也可以成為應(yīng)用到業(yè)務(wù)中的效率和性能得到很好平衡的模型。  

從實(shí)驗(yàn)室走出來(lái)的商湯科技,天然擁有技術(shù)創(chuàng)新的基因

AI科技評(píng)論:這些論文有一部分出自香港中文大—商湯科技聯(lián)合實(shí)驗(yàn)室,那聯(lián)合實(shí)驗(yàn)室對(duì)于商湯科技而言是一個(gè)怎樣的存在呢? 

林達(dá)華:聯(lián)合實(shí)驗(yàn)室跟商湯科技的關(guān)系是一種非常緊密的合作關(guān)系,經(jīng)過(guò)過(guò)去幾年的合作,現(xiàn)在已經(jīng)構(gòu)建了帶有示范性意義的產(chǎn)學(xué)研結(jié)合的閉合雙向關(guān)系。具體而言:

一方面,商湯科技在實(shí)際的業(yè)務(wù)探索中會(huì)發(fā)現(xiàn)很多重要的挑戰(zhàn),針對(duì)其中一部分,商湯科技內(nèi)部團(tuán)隊(duì)已經(jīng)提出了很好的解決方案和技術(shù),而另一部分則是一些具有長(zhǎng)期學(xué)術(shù)價(jià)值的問(wèn)題,這些問(wèn)題通過(guò)合作交流能夠反饋到實(shí)驗(yàn)室這邊——對(duì)于實(shí)驗(yàn)室而言,找到有價(jià)值的問(wèn)題是最關(guān)鍵的環(huán)節(jié)。 

另一方面,實(shí)驗(yàn)室這邊由于不需要像商湯科技內(nèi)部團(tuán)隊(duì)一樣承擔(dān)業(yè)績(jī)壓力,能夠去研究一些長(zhǎng)期的、較高風(fēng)險(xiǎn)的探索性方向,如果最終能取得成功,也能夠非常有效地推動(dòng)商湯科技內(nèi)部去構(gòu)建新的解決方案。  

AI科技評(píng)論:成果從論文走向應(yīng)用落地,始終是當(dāng)下人工智能領(lǐng)域企業(yè)面臨的重要命題,在這一點(diǎn)上,商湯科技作為從實(shí)驗(yàn)室走出來(lái)的企業(yè),具備怎樣的優(yōu)勢(shì)? 

林達(dá)華:任何一個(gè)行業(yè)中的企業(yè),在學(xué)術(shù)成果的應(yīng)用落地方面都面臨著非常巨大的挑戰(zhàn)。成果從論文走向應(yīng)用落地,其中最重要的挑戰(zhàn)就是學(xué)術(shù)研究跟真正的業(yè)務(wù)實(shí)踐之間存在非常大的差距。學(xué)術(shù)界的很多實(shí)驗(yàn)室一般都是關(guān)著門(mén)做研究,研究目標(biāo)和跟實(shí)際的用戶(hù)和行業(yè)需求和痛點(diǎn)并不完全一致,并且存在的差距還比較大,所以脫離產(chǎn)業(yè)聯(lián)系的純學(xué)術(shù)研究,是很難真正與行業(yè)的痛點(diǎn)相匹配的。 

商湯科技從實(shí)驗(yàn)室走出來(lái),到現(xiàn)在做出來(lái)的一系列成績(jī),整個(gè)歷程非常不容易,對(duì)此我也感到非常自豪。 在具體的模式上,商湯科技和實(shí)驗(yàn)室之間一直遵循一種非常有效的合作模式,即我們實(shí)驗(yàn)室的學(xué)生在完成了研究成果后,可以到商湯科技去實(shí)習(xí)一段時(shí)間,并與商湯科技內(nèi)部的研究者進(jìn)行合作,在這個(gè)過(guò)程中,能夠產(chǎn)生兩個(gè)非常正面的意義: 

  • 一是可以讓我們實(shí)驗(yàn)室的同學(xué)和老師真正建立起技術(shù)的價(jià)值意識(shí),學(xué)會(huì)將學(xué)術(shù)成果落地到實(shí)際的系統(tǒng)中去,而不再單純發(fā)論文; 

  • 二是這些同學(xué)和老師本身就是做技術(shù)研究的,當(dāng)他們看到技術(shù)落地時(shí)會(huì)收獲到成就感,會(huì)有更大的動(dòng)力去后續(xù)的研究,與此同時(shí),他們自己作為技術(shù)的原創(chuàng)開(kāi)發(fā)者,在與商湯科技內(nèi)部研究者一同落地技術(shù)時(shí),會(huì)使得整個(gè)過(guò)程也更加順暢和迅速。 

總體而言,比起沒(méi)有實(shí)驗(yàn)室基因而需要找高校實(shí)驗(yàn)室合作的一般企業(yè)而言,我們從學(xué)術(shù)研究到業(yè)務(wù)落地的鏈條要短很多:

  • 首先,我們實(shí)驗(yàn)室和商湯科技從研究的源頭開(kāi)始,就緊密地結(jié)合在一起,并且會(huì)持續(xù)保持親密的溝通;

  • 其次,實(shí)驗(yàn)室做出成果以后,商湯科技也會(huì)利用很多機(jī)會(huì)來(lái)進(jìn)行應(yīng)用落地——這些其他企業(yè)與高校合作中存在的障礙在我們這里往往更容易突破。 

AI科技評(píng)論:現(xiàn)在無(wú)論是大廠還是初創(chuàng)企業(yè),都相繼成立了這樣的研究型實(shí)驗(yàn)室,與BAT 等大廠的對(duì)相關(guān)實(shí)驗(yàn)室相比,商湯聯(lián)合實(shí)驗(yàn)室具備哪些優(yōu)勢(shì)? 

林達(dá)華:我先說(shuō)優(yōu)勢(shì)吧,主要體現(xiàn)在四個(gè)方面: 

  • 第一,在計(jì)算機(jī)視覺(jué)這個(gè)領(lǐng)域的主流頂級(jí)學(xué)術(shù)會(huì)議上,我們能明顯地看到商湯科技的成果其實(shí)會(huì)更加豐富些,無(wú)論是競(jìng)賽成績(jī)、論文成績(jī)還是學(xué)術(shù)成果的影響力,都會(huì)更高,而這一點(diǎn)源自于商湯科技本身的技術(shù)創(chuàng)新基因和文化——我們更知道如何用科技創(chuàng)新的力量去驅(qū)動(dòng)業(yè)務(wù)場(chǎng)景上的核心競(jìng)爭(zhēng)力。

  • 第二,商湯科技跟學(xué)術(shù)界有天然而廣泛的聯(lián)系,很多承擔(dān)重要角色的負(fù)責(zé)人都是教授,因而它從學(xué)術(shù)界吸取最新的技術(shù)成果的鏈條要短很多。

  • 第三,我們自己的學(xué)生能夠直接進(jìn)入到商湯科技實(shí)習(xí),所以我們培養(yǎng)出來(lái)的人才既有學(xué)術(shù)研究能力,同時(shí)也在和商湯科技的合作中建立起了技術(shù)落地的思路,他們畢業(yè)后剛開(kāi)始工作就已經(jīng)能夠獨(dú)當(dāng)一面去開(kāi)拓一個(gè)新的業(yè)務(wù),并且知道如何將技術(shù)融進(jìn)業(yè)務(wù)場(chǎng)景中,這一人才優(yōu)勢(shì)其實(shí)是我們很核心的一個(gè)優(yōu)勢(shì)。

  • 第四,在計(jì)算機(jī)視覺(jué)這一領(lǐng)域,商湯科技入場(chǎng)很早,所以經(jīng)過(guò)前期這幾年的積淀,我們對(duì)于這個(gè)行業(yè)如何跟AI 更好地實(shí)現(xiàn)結(jié)合,會(huì)有更加深入的理解,這也是商湯科技天然的寶貴財(cái)富。  

AI科技評(píng)論:目前聯(lián)合實(shí)驗(yàn)室取得了哪些意義較為重大的成果?未來(lái)有哪些重點(diǎn)關(guān)注的方向? 

林達(dá)華:我們目前取得了較大意義的成果主要包括,第一個(gè)是首度超越了人眼的人臉識(shí)別算法;第二個(gè)是我們做的一系列超分辨率的工作,目前也是領(lǐng)先于谷歌等國(guó)際科技巨頭企業(yè)的;第三個(gè)是視頻理解相關(guān)的工作,例如我們提出的時(shí)序分段網(wǎng)絡(luò)等一系列技術(shù),現(xiàn)在也成為了業(yè)界廣泛采用的標(biāo)準(zhǔn)范式;第四個(gè)是在 3D 場(chǎng)景理解相關(guān)的工作,對(duì)于自動(dòng)駕駛等領(lǐng)域具有非常重要的意義。 

關(guān)于未來(lái)重點(diǎn)的方向,我認(rèn)為計(jì)算機(jī)視覺(jué)領(lǐng)域發(fā)展到現(xiàn)在,有一些東西已經(jīng)做得非常成熟,但對(duì)于整個(gè)行業(yè)和整個(gè)領(lǐng)域來(lái)說(shuō),目前所取得的成果還僅僅只是一個(gè)開(kāi)始,未來(lái)還有非常大的發(fā)展空間。就我看來(lái),未來(lái)幾年有以下幾個(gè)重要方向值得深入探索: 

第一,新的場(chǎng)景和新的數(shù)據(jù)形態(tài)。一方面,例如我們現(xiàn)在做的真正意義的長(zhǎng)時(shí)間電影和視頻理解,是跟傳統(tǒng)的動(dòng)作識(shí)別非常不一樣的。另一方面,例如現(xiàn)在我們要建設(shè)的智慧生活、智慧城市和智慧社區(qū)等綜合場(chǎng)景的 AI 技術(shù)應(yīng)用,其實(shí)涉及到很多不同任務(wù)與很多不同數(shù)據(jù)的交互,需要形成一個(gè)整體的分布來(lái)將原本孤立的任務(wù)和數(shù)據(jù)相互打通,真正讓 AI 技術(shù)從應(yīng)用到傳統(tǒng)的單個(gè)任務(wù)到能夠給整個(gè)場(chǎng)景賦能。 

第二,打破對(duì)數(shù)據(jù)的依賴(lài)?,F(xiàn)在的模型所取得的性能,實(shí)際上都是建立在對(duì)大量標(biāo)注數(shù)據(jù)的依賴(lài)的基礎(chǔ)之上的。比如說(shuō)算力,我們可以通過(guò)改善硬件來(lái)提升,但是人的標(biāo)注速度是受限于人本身的,所以未來(lái)要克服這一問(wèn)題,我們就要改變這種基于標(biāo)注數(shù)據(jù)的監(jiān)督學(xué)習(xí)訓(xùn)練范式,同時(shí)更積極地去使用能夠更廣泛獲得的未經(jīng)標(biāo)注的數(shù)據(jù)。未來(lái),比起算力,數(shù)據(jù)也是 AI 技術(shù)的發(fā)展的同樣重要的制約因素,只有打破這一制約,AI 的能力才能上升到一個(gè)新的水平。  

第三,這個(gè)領(lǐng)域之前關(guān)注得更多的是準(zhǔn)確率和性能,追求的指標(biāo)比較單一,然而 AI 技術(shù)要推廣到整個(gè)社會(huì)中作為基礎(chǔ)技術(shù)去應(yīng)用,還存在很多約束:

  • 首先是安全性,現(xiàn)在的模型其實(shí)很容易受到攻擊,是非常脆弱的,所以這是一個(gè)亟待解決的問(wèn)題;

  • 其次是如何在保護(hù)隱私的條件下有效地訓(xùn)練模型,現(xiàn)在大家也在積極地探索這一方向;

  • 還有是可解釋性,現(xiàn)在 AI 無(wú)論是應(yīng)用到自動(dòng)駕駛還是醫(yī)療領(lǐng)域中,我們?nèi)祟?lèi)還是不能完全放心,所以我們不僅要理解 AI 決策的邏輯,還要了解AI 在緊急場(chǎng)景中如何做出反應(yīng)——針對(duì)后面這一點(diǎn),我認(rèn)為可以嘗試用模擬器來(lái)提供這些場(chǎng)景的數(shù)據(jù)集從而訓(xùn)練模型。 

第四,未來(lái)對(duì)場(chǎng)景的視覺(jué)理解會(huì)逐漸從2D轉(zhuǎn)變到3D,我這次在 ICCV 上也看到了非常多相關(guān)的工作。  

AI科技評(píng)論:商湯科技在計(jì)算機(jī)視覺(jué)這一賽道上所面臨的競(jìng)爭(zhēng)既有來(lái)自大廠和其他獨(dú)角獸企業(yè),也有來(lái)自初創(chuàng)企業(yè),就您看來(lái),商湯科技在未來(lái)的發(fā)展中應(yīng)如何不斷提高自身的競(jìng)爭(zhēng)力和地位? 

林達(dá)華:首先一點(diǎn)是要加強(qiáng)基礎(chǔ)的核心技術(shù)的研發(fā)和建設(shè)。之前我們?cè)谟?jì)算機(jī)視覺(jué)的算法上已經(jīng)有了很深的積累,也取得了非常豐碩的成果,而未來(lái)除了這些上層算法外,我們還要加強(qiáng)整個(gè)系統(tǒng)層面的建設(shè),包括計(jì)算能力、數(shù)據(jù)能力等方面的核心能力建設(shè)。 

另外一個(gè)關(guān)鍵是人才!無(wú)論要做什么事情,最不可或缺、最首要的要素就是人才。商湯科技本身的文化能夠?yàn)槿瞬盘峁┹^好的發(fā)展空間,確實(shí)能夠吸引到很多優(yōu)秀的人才加盟商湯科技來(lái)共同推動(dòng) AI 的發(fā)展?,F(xiàn)在人才市場(chǎng)也確實(shí)非常激烈,未來(lái)商湯科技也會(huì)繼續(xù)加大力度為人才創(chuàng)造更好的發(fā)展空間。

與此同時(shí),我們會(huì)繼續(xù)拓展我們的生態(tài)合作?,F(xiàn)在商湯科技跟高校合作建立了很多聯(lián)合實(shí)驗(yàn)室,已經(jīng)有了較好的積淀,但是這方面的工作還在發(fā)展和成長(zhǎng),未來(lái)還有很大的空間,所以我們希望能夠跟包括學(xué)界和業(yè)界在內(nèi)的整個(gè)社區(qū)形成一個(gè)非常良性的、開(kāi)放的產(chǎn)學(xué)研合作生態(tài)。我認(rèn)為這對(duì)于商湯科技以及整個(gè)行業(yè)的發(fā)展而言,都具有長(zhǎng)遠(yuǎn)價(jià)值。  

CV 才剛剛開(kāi)始,未來(lái)大有可為

AI科技評(píng)論:拋開(kāi)商湯科技和聯(lián)合實(shí)驗(yàn)室,單就您個(gè)人而言,學(xué)術(shù)成果也非常亮眼,當(dāng)初是基于怎樣的契機(jī)選擇到工業(yè)界來(lái),并聯(lián)合創(chuàng)立了商湯科技? 

林達(dá)華:一開(kāi)始是湯曉鷗老師認(rèn)為計(jì)算機(jī)視覺(jué)已經(jīng)突破了應(yīng)用紅線,迎來(lái)了商業(yè)化的非常好的契機(jī),向我和王曉剛老師分享了他的遠(yuǎn)見(jiàn)和事業(yè)藍(lán)圖,當(dāng)時(shí)我們非常認(rèn)同,也愿意跟湯老師去共同創(chuàng)建這個(gè)事業(yè)。 

但是一開(kāi)始我是以教授的身份參與其中的,而隨著整個(gè)參與度的加深,后續(xù)也參與了商湯科技內(nèi)部一些研究項(xiàng)目的規(guī)劃和指導(dǎo),在這個(gè)過(guò)程中就逐漸開(kāi)始將強(qiáng)商湯科技內(nèi)部和實(shí)驗(yàn)室之間的合作和聯(lián)系,而這對(duì)于我本身的學(xué)術(shù)生涯而言也很有價(jià)值,正如我在前面提到的,給我的實(shí)驗(yàn)室提供了很多很有價(jià)值的問(wèn)題,這也是我們實(shí)驗(yàn)室能夠做出這么多成果的重要原因。 

AI科技評(píng)論:您現(xiàn)在既是商湯科技聯(lián)合創(chuàng)始人,又是港中文大—商湯科技聯(lián)合實(shí)驗(yàn)室主任,在具體的角色上,主要負(fù)責(zé)哪些方面的工作內(nèi)容呢? 

林達(dá)華:我的具體工作主要包括三個(gè)部分:第一個(gè)部分是在實(shí)驗(yàn)室指導(dǎo)學(xué)生做前沿研究;第二個(gè)部分是對(duì)商湯的一些研究團(tuán)隊(duì)進(jìn)行指導(dǎo),并在這個(gè)過(guò)程中將一些研究工作落地到商湯科技的業(yè)務(wù)中,與此同時(shí),我也會(huì)引導(dǎo)研究部門(mén)做一些前瞻性的工作;第三,我也在通過(guò)自身在學(xué)術(shù)界的聯(lián)系去積極幫助商湯科技和實(shí)驗(yàn)室拓展跟高校的生態(tài)合作。 

AI科技評(píng)論:在技術(shù)產(chǎn)業(yè)化方面,CV是走在人工智能其他領(lǐng)域前頭的方向,現(xiàn)如今 CV技術(shù)已經(jīng)大規(guī)模應(yīng)用,而像NLP等被認(rèn)為是人工智能接下來(lái)會(huì)產(chǎn)生大規(guī)模應(yīng)用的技術(shù)方向。那從產(chǎn)業(yè)應(yīng)用的角度來(lái)看,您認(rèn)為 CV是否已經(jīng)過(guò)了鼎盛時(shí)期? 

林達(dá)華:我認(rèn)為CV 這個(gè)領(lǐng)域才剛剛開(kāi)始,遠(yuǎn)沒(méi)到鼎盛時(shí)期。 CV 的潛在應(yīng)用領(lǐng)域非常廣泛,其在例如建設(shè)智慧生活、社區(qū)治理助理以及為國(guó)計(jì)民生的各個(gè)領(lǐng)域提供有效的信息等等方面都存在很廣泛的應(yīng)用潛力?,F(xiàn)在大家更多地關(guān)注CV 技術(shù)在安防、自動(dòng)駕駛等領(lǐng)域的應(yīng)用,這些應(yīng)用也讓大家看到了CV 技術(shù)的價(jià)值。 

而實(shí)際上,CV 的本質(zhì)其實(shí)就是從視覺(jué)的角度獲取世界中的各類(lèi)信息,再應(yīng)用到工作任務(wù)中?,F(xiàn)在CV 實(shí)現(xiàn)的大規(guī)模應(yīng)用還只是幾個(gè)點(diǎn),而未來(lái)還有更多得多的點(diǎn)能夠探索 CV 技術(shù)的應(yīng)用,而這就需要我們整個(gè)社區(qū)去真正深入到不同行業(yè)中去尋找到真正的痛點(diǎn)需求,并思考如何利用現(xiàn)有的CV 技術(shù)、AI 技術(shù)去幫助行業(yè),這整個(gè)過(guò)程都存在無(wú)限的可能性。 

現(xiàn)在CV 技術(shù)已經(jīng)得到應(yīng)用的幾個(gè)點(diǎn),可能看上去增長(zhǎng)速度放緩,好像是走到一定程度了,但是這并不代表CV 這個(gè)領(lǐng)域就沒(méi)有了空間。CV 現(xiàn)在的應(yīng)用潛力只釋放了一小部分,要真正應(yīng)用到更加廣闊的新的場(chǎng)景,還需要一些時(shí)間,但是不會(huì)太遠(yuǎn)。

華人學(xué)術(shù)研究缺乏原創(chuàng)性?要從發(fā)展的維度看待此問(wèn)題!

AI科技評(píng)論:其實(shí)不僅是商湯科技,整個(gè)華人研究者在 ICCV 等會(huì)議上的表現(xiàn)都非常出色,比如2017年ICCV 接收論文中,有 40%的第一作者都是華人,今年收錄論文數(shù)量甚至超過(guò)了美國(guó),但是今年在獎(jiǎng)項(xiàng)上的表現(xiàn)稍有遺憾,對(duì)于華人近年來(lái)在此類(lèi)國(guó)際頂會(huì)上的表現(xiàn),您如何評(píng)價(jià)?

林達(dá)華:華人在計(jì)算機(jī)視覺(jué)領(lǐng)域的影響力正在持續(xù)增長(zhǎng),這是毋庸置疑的。對(duì)于今年華人沒(méi)有獲得論文獎(jiǎng)項(xiàng),我認(rèn)為這件事情存在很強(qiáng)的偶然性,因?yàn)楂@獎(jiǎng)的就兩三篇,如果單憑某次會(huì)議的獲獎(jiǎng)?wù)撐娜ヅ袛嗳A人在這個(gè)社區(qū)中的影響力,我認(rèn)為信息是不足的,所以我們要看的還是整體的影響力,比如說(shuō)今年的Oral 論文,華人就占了很高的比重。

AI科技評(píng)論:其實(shí)在不少頂會(huì)上,一些前輩華人研究者都屢次提到華人研究者所存在的一大劣勢(shì),便是缺乏原創(chuàng),而原創(chuàng)性其實(shí)也是商湯科技特別強(qiáng)調(diào)的一個(gè)宗旨,您如何看待這一現(xiàn)象? 

林達(dá)華:我認(rèn)為任何一項(xiàng)技術(shù)的發(fā)展都會(huì)有一個(gè)變遷的趨勢(shì),國(guó)內(nèi)的相當(dāng)比例的研究一開(kāi)始都是應(yīng)用驅(qū)動(dòng)的,目前的這種現(xiàn)象其實(shí)是可以理解的。而當(dāng)整個(gè)行業(yè)開(kāi)始逐漸建立起來(lái)后,我們其實(shí)會(huì)將越來(lái)越多的力量投入到基礎(chǔ)研發(fā)中,這一趨勢(shì)其實(shí)在今年的國(guó)際學(xué)術(shù)頂會(huì)上就更加明顯地體現(xiàn)出來(lái)了。 

這些基礎(chǔ)研發(fā)一方面是核心模型和核心方法,比如說(shuō)今年華人的 ICCV 論文中還是有相當(dāng)比重在做基礎(chǔ)網(wǎng)絡(luò)結(jié)構(gòu)與核心訓(xùn)練方法的研究,另一方面是基礎(chǔ)系統(tǒng)例如芯片這些領(lǐng)域,現(xiàn)在國(guó)內(nèi)也進(jìn)行了大規(guī)模的投入,當(dāng)然要實(shí)現(xiàn)具有影響力的成果可能還需要一個(gè)時(shí)間周期。 所以我認(rèn)為應(yīng)該從發(fā)展的維度上來(lái)看待華人目前的原創(chuàng)性問(wèn)題,并且我也相信,再過(guò)一段時(shí)間,這些投入和研究會(huì)慢慢結(jié)出果實(shí)。

AI科技評(píng)論:您作為無(wú)論在學(xué)術(shù)界和工業(yè)界都有著豐富的履歷的科學(xué)家,從學(xué)術(shù)研究和職業(yè)選擇方面,對(duì)于后輩研究者們分別有哪些建議?

林達(dá)華:第一,一定不要盲目跟風(fēng),要選擇自己真正感興趣和愿意長(zhǎng)時(shí)間投入的方向。他如果因?yàn)槟硞€(gè)研究方向熱門(mén)就去試一試,而沒(méi)有想清楚自己真正感興趣和愿意長(zhǎng)時(shí)間投入的方向是什么,那他基本上做不出太好的成果,并且不一定能堅(jiān)持下去。 

第二,重視培養(yǎng)思維能力,不要被熱點(diǎn)方法帶著走。我在指導(dǎo)自己學(xué)生的時(shí)候,一直都強(qiáng)調(diào)不要跟著熱點(diǎn)方法走,而是要建立起尋找挑戰(zhàn)、提出問(wèn)題、定義問(wèn)題并解決問(wèn)題的思維,因?yàn)闊狳c(diǎn)方法其實(shí)變得非??欤蛔兊氖撬麄冏陨砭邆溥@種思維能力。當(dāng)然,將一些流行的方法用到自己的研究工作中肯定是可以的,但是他一開(kāi)始做某項(xiàng)研究的出發(fā)點(diǎn)不應(yīng)該是為了用某個(gè)熱點(diǎn)方法,而應(yīng)該是為了探索某個(gè)問(wèn)題的本質(zhì),這樣的話,無(wú)論技術(shù)路線如何發(fā)展和變遷,他都能夠一直站在創(chuàng)新的前沿。 

第三,在職業(yè)選擇上,要真正想清楚自己想要走的道路是什么,并且思考如果要走這條路,需要培養(yǎng)怎樣的素質(zhì),進(jìn)而有計(jì)劃地朝著某個(gè)方向鍛煉和培養(yǎng)自己需要具備的能力。如果選擇到學(xué)術(shù)界任職,那他可能要更多地培養(yǎng)自己尋找和定義問(wèn)題的能力,而不是簡(jiǎn)單地跟著導(dǎo)師發(fā)論文;如果選擇到工業(yè)界,那他就要培養(yǎng)自己觀察行業(yè)痛點(diǎn)、尋找和歸納客戶(hù)需求并規(guī)劃解決這些問(wèn)題的能力。

雷鋒網(wǎng) AI 科技評(píng)論報(bào)道。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

專(zhuān)訪商湯聯(lián)合創(chuàng)始人林達(dá)華:CV 才剛剛開(kāi)始,遠(yuǎn)沒(méi)到鼎盛時(shí)期

分享:
相關(guān)文章
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶(hù)安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)