AI 研習(xí)社大講堂已逾60期！近期精彩CV分享回顧

本文作者：楊曉凡

2018-09-08 01:11

導(dǎo)語：學(xué)術(shù)研究進(jìn)展的深度交流

雷鋒網(wǎng) AI 科技評論按：機(jī)器學(xué)習(xí)、人工智能領(lǐng)域的研究人員，以及任何學(xué)術(shù)研究人員，都關(guān)心這兩件事：分享、傳播自己的研究成果讓更多人知道，以及了解自己研究方向的最新進(jìn)展、結(jié)識更多的研究人員。雷鋒網(wǎng) AI 研習(xí)社大講堂就是一個供研究人員們分享自己成果、促進(jìn)廣泛溝通互動的直播平臺。

自 AI 大講堂去年 7 月上線以來，已經(jīng)有來自清華大學(xué)、北京大學(xué)、上海交通大學(xué)、香港科技大學(xué)、 MIT、UC Berkeley、悉尼科技大學(xué)等知名國內(nèi)外高校的嘉賓進(jìn)行直播分享，甚至還舉辦了線下論文分享會，迄今已完成了 68 期，覆蓋影響讀者過萬人。不僅嘉賓自己的研究成果被直播觀眾以及讀者們了解，也讓科技愛好者們、學(xué)生們、其它研究人員們增進(jìn)了對人工智能相關(guān)思維、知識、應(yīng)用的認(rèn)識，為國內(nèi)人工智能長期持續(xù)發(fā)展的氛圍出一份力。

人工智能相關(guān)的各個研究方向中，最為豐富也最為熱門的當(dāng)屬計算機(jī)視覺（CV）了，其中的熱門任務(wù)包括圖像分類、對象檢測、圖像分割、圖像生成、圖像描述生成等等。下面我們匯總了近期（2018 年以來）9 期精彩的計算機(jī)視覺方向分享回顧。

第 45 期，圖像分割的經(jīng)典算法。
分享嘉賓：劉漢唐，浙江大學(xué)計算機(jī)系博士生。
圖像分割是計算機(jī)視覺中一個經(jīng)典并且基礎(chǔ)的問題，對于理解圖像非常關(guān)鍵。圖像分割有很多應(yīng)用場景，比如無人駕駛、地圖重建、圖像美化等等。深度學(xué)習(xí)使得圖像分割有了巨大的發(fā)展，本次分享會介紹深度學(xué)習(xí)中圖像分割的經(jīng)典算法。
第 50 期，基于強(qiáng)化學(xué)習(xí)的時間行為檢測自適應(yīng)模型。
分享嘉賓：黃靖佳，北京大學(xué)深圳研究生院信息工程學(xué)院二年級博士生。
視頻中的行為檢測是當(dāng)下的熱點研究任務(wù)，該任務(wù)要求從一段未經(jīng)修剪的（untrimmed）視頻中找出目標(biāo)行為發(fā)生的時間區(qū)間。由于目標(biāo)行為可能發(fā)生的時間點以及目標(biāo)行為的持續(xù)時間均是不確定的，使得在完成這項任務(wù)時往往需要花費(fèi)大量的計算資源對不同時間尺度（長度），不同起點的視頻片段進(jìn)行判斷。為了避免這種低效的檢測方法，我們提出了一種可以自適應(yīng)調(diào)整檢測窗口大小及位置的方法，對視頻進(jìn)行高效的檢測。
第 58 期，基于課程學(xué)習(xí)的強(qiáng)化多標(biāo)簽圖像分類算法。
分享嘉賓：何詩怡，北京大學(xué)計算機(jī)視覺碩士，優(yōu)必選悉尼AI研究院學(xué)生。
與單標(biāo)簽圖像分類相比，多標(biāo)簽圖像分類是一種更符合真實世界客觀規(guī)律的方法，尤其在圖像和視頻的語義標(biāo)注，基于內(nèi)容的圖像檢索等領(lǐng)域有著廣泛的應(yīng)用。因此，本次公開課，何詩怡將分享她用強(qiáng)化學(xué)習(xí)解決多標(biāo)簽圖像分類問題的方法和經(jīng)驗
第 59 期，深度學(xué)習(xí)在點云分割中的應(yīng)用。
分享嘉賓：王薇月，南加州大學(xué)計算機(jī)系在讀博士。
隨著激光雷達(dá)，RGBD相機(jī)等3D傳感器在機(jī)器人，無人駕駛領(lǐng)域的廣泛應(yīng)用，深度學(xué)習(xí)在三維點云數(shù)據(jù)的研究在近兩年取得了廣泛關(guān)注。點云分割、識別、檢測成為學(xué)術(shù)界、工業(yè)界的熱門話題之一。是在本次公開課中，講者將分享其關(guān)于點云分割的最新工作。
第 60 期，基于殘差密集網(wǎng)絡(luò)的圖像超分辨率（CVPR 2018 亮點論文）。
分享嘉賓：張宇倫，美國東北大學(xué)計算機(jī)工程在讀博士，Adobe 公司深度學(xué)習(xí)研究實習(xí)生
圖像超分辨率技術(shù)作為底層計算機(jī)視覺任務(wù)，有著廣泛的應(yīng)用場景，比如：手機(jī)圖像增強(qiáng)，視頻監(jiān)控，醫(yī)療影像，衛(wèi)星圖像，低分辨率人臉識別。因此，圖像超分辨率技術(shù)吸引了眾多來自學(xué)術(shù)界與工業(yè)界的研究興趣。但是，當(dāng)前圖像超分辨率技術(shù)仍然面臨一些難題，比如，對高放大倍數(shù)的圖像超分辨，難以恢復(fù)丟失的細(xì)節(jié)；對已經(jīng)恢復(fù)出的細(xì)節(jié)，也有著模糊等效應(yīng)，其質(zhì)量有待提升。因此，本次公開課，張宇倫同學(xué)設(shè)計一種新的網(wǎng)絡(luò)結(jié)構(gòu)，得到更強(qiáng)的表達(dá)能力，不僅將之前方法難以恢復(fù)的細(xì)節(jié)恢復(fù)出來了，而且，結(jié)果更清晰。最終，在不同圖像退化模型下都達(dá)到了當(dāng)前較好的結(jié)果。
第 61 期，網(wǎng)格曲面的神經(jīng)網(wǎng)絡(luò) (CVPR 2018 oral: Surface Networks)。
分享嘉賓：姜仲石，紐約大學(xué)科朗數(shù)學(xué)研究所(NYU Courant) 二年級博士生。
網(wǎng)格是幾何數(shù)據(jù)的常用高效表示, 在幾何曲面構(gòu)建的機(jī)器學(xué)習(xí)方法對計算機(jī)圖形學(xué)，3D計算機(jī)視覺以及幾何分析和處理有著重要的意義。
第 63 期，任中正：利用合成數(shù)據(jù)的跨領(lǐng)域的多任務(wù)視覺特征學(xué)習(xí)。
分享嘉賓：任中正，現(xiàn)UIUC攻讀計算機(jī)博士。
現(xiàn)在的神經(jīng)網(wǎng)絡(luò)可以通過監(jiān)督學(xué)習(xí)學(xué)到很好的遷移學(xué)習(xí)本領(lǐng)，然而卻需要百萬級別的手工標(biāo)注數(shù)據(jù)。自監(jiān)督(self-supervised)任務(wù)就是一種為了取代標(biāo)注數(shù)據(jù)的方式。然而已有的自監(jiān)督方法大部分是單任務(wù)，導(dǎo)致模型容易在這個任務(wù)上過擬合。任博士分享了用合成數(shù)據(jù)做多任務(wù)特征學(xué)習(xí)的工作，以及如何使用domain adaptation來讓學(xué)到的特征更好的遷移到真實世界的視覺任務(wù)上。
第 64 期，Direction-aware Spatial Context Features for Shadow Detection。
分享嘉賓：胡梟瑋，香港中文大學(xué)二年級博士生。
陰影檢測是計算機(jī)視覺中基礎(chǔ)并富有挑戰(zhàn)性的問題。檢測陰影區(qū)域，為進(jìn)一步獲取圖像中的光照情況、物體的形狀與位置，以及攝像機(jī)的參數(shù)提供了可能，同時陰影的存在為目標(biāo)的檢測與跟蹤帶來了障礙。檢測陰影區(qū)域需要理解圖像全局的語義信息，本文提出通過方向性地分析圖像空間上下文信息來理解陰影，同時設(shè)計了DSC模型用于檢測、去除陰影，并在兩個陰影檢測數(shù)據(jù)集以及兩個陰影去除數(shù)據(jù)集上都達(dá)到了頂尖的性能。這篇論文已被CVPR 2018收錄，并做口頭報告(Oral)。
第 68 期，室內(nèi)場景的結(jié)構(gòu)化重建。
分享嘉賓：劉晨，圣路易斯華盛頓大學(xué)計算機(jī)系在讀博士。
隨著增強(qiáng)現(xiàn)實，家務(wù)機(jī)器人等應(yīng)用的普及，室內(nèi)場景重建研究正在得到越來越廣泛的關(guān)注。與傳統(tǒng)底層密集重建方法不同，講者的研究集中在分析重建場景中的高層結(jié)構(gòu)化信息。在本次公開課中，講者將分享其結(jié)構(gòu)化重建的最新工作。

大講堂系列直播分享持續(xù)進(jìn)行中。更多精彩研究成果分享、更多往期內(nèi)容匯總，請繼續(xù)關(guān)注雷鋒網(wǎng)相關(guān)內(nèi)容。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

楊曉凡

讀論文為生

日常笑點滴，學(xué)術(shù)死腦筋

發(fā)私信

當(dāng)月熱門文章

AI 研習(xí)社大講堂已逾60期！近期精彩CV分享回顧

第 45 期，圖像分割的經(jīng)典算法。

第 50 期，基于強(qiáng)化學(xué)習(xí)的時間行為檢測自適應(yīng)模型。

第 58 期，基于課程學(xué)習(xí)的強(qiáng)化多標(biāo)簽圖像分類算法。

第 59 期，深度學(xué)習(xí)在點云分割中的應(yīng)用。

第 60 期，基于殘差密集網(wǎng)絡(luò)的圖像超分辨率 （CVPR 2018 亮點論文）。

第 61 期，網(wǎng)格曲面的神經(jīng)網(wǎng)絡(luò) (CVPR 2018 oral: Surface Networks)。

第 63 期，任中正：利用合成數(shù)據(jù)的跨領(lǐng)域的多任務(wù)視覺特征學(xué)習(xí)。

第 64 期，Direction-aware Spatial Context Features for Shadow Detection。

第 68 期，室內(nèi)場景的結(jié)構(gòu)化重建。

AI 研習(xí)社大講堂已逾60期！近期精彩CV分享回顧

第 45 期，圖像分割的經(jīng)典算法。

第 50 期，基于強(qiáng)化學(xué)習(xí)的時間行為檢測自適應(yīng)模型。

第 58 期，基于課程學(xué)習(xí)的強(qiáng)化多標(biāo)簽圖像分類算法。

第 59 期，深度學(xué)習(xí)在點云分割中的應(yīng)用。

第 60 期，基于殘差密集網(wǎng)絡(luò)的圖像超分辨率（CVPR 2018 亮點論文）。

第 61 期，網(wǎng)格曲面的神經(jīng)網(wǎng)絡(luò) (CVPR 2018 oral: Surface Networks)。

第 63 期，任中正：利用合成數(shù)據(jù)的跨領(lǐng)域的多任務(wù)視覺特征學(xué)習(xí)。

第 64 期，Direction-aware Spatial Context Features for Shadow Detection。

第 68 期，室內(nèi)場景的結(jié)構(gòu)化重建。