0
本文作者: 我在思考中 | 2022-06-24 11:01 |
作者 | 王玥
新奧爾良當?shù)貢r間6月21日上午8:30,計算機視覺領域公認三大頂級會議之一CVPR 2022開幕。
CVPR開幕式伊始,由大會主席Jiri Matas致辭,并介紹了本次大會的4位主席及5位程序主席。
值得一提的是,本次大會有兩位華人主席,分別是主席權龍(Long Quan,上排右二)與程序主席華剛(Gang Hua,下排左二)。
接下來主席Jiri Matas介紹了CVPR 2022的投稿情況:
本屆CVPR一共收到8161份論文投稿,接受論文2064份,截止2022年6月20日有9981位出席者注冊,且實地出席與網(wǎng)絡出席幾乎各占50%。
接下來程序主席華剛介紹道,CVPR的投稿和接收的論文呈現(xiàn)出每年15%的漲勢。華剛博士暢想道,隨著這樣的漲勢,也許有朝一日地球上每個人都會投稿一篇論文(笑)。
本屆CVPR投稿的8161篇論文由23389位作者投遞,其中44.59%的作者來自中國,20.75% 的作者來自美國。
華剛博士繼續(xù)介紹道,本屆接收了2064篇論文,接收率為25.3%。
考慮到網(wǎng)絡出席與實體出席參半的情況,本屆CVPR將以混合方式舉行。其中將實體會議將舉行344場5分鐘時長的口頭報告以及2064個海報研討。
本屆CVPR的300位AC(Area Chair)來自于北美、歐洲、亞洲、澳大利亞及南美。其中有55位女性,101位首次擔任AC一職。
由于此前孫劍博士因病去世,本次CVPR特地設置了懷念孫劍博士環(huán)節(jié),由程序主席華剛帶領全場緬懷這位杰出學者。
圖注:大會緬懷孫劍博士頁面
孫劍博士于1976年10月出生,曾任微軟亞研院首席研究員,此前他曾兩次獲CVPR最佳論文獎。
2016年7月,孫劍正式加入曠視,任首席科學家、曠視研究院院長,主導曠視技術研發(fā)。在他的帶領下,曠視研究院推出了多項具有代表性的工作。
Google Scholar數(shù)據(jù)顯示,孫劍博士論文引用量達到286002次,h-index為121。
圖注:孫劍博士的Google Scholar頁面
程序主席華剛博士介紹道,作為CV領域的知名學者,孫劍博士研究成果碩果累累。如果要說出孫劍博士的三篇論文代表作,那么第一篇他認為應該是"Stereo matching using belief propagation"。
論文鏈接:https://ieeexplore.ieee.org/abstract/document/1206509
第二篇則是他帶領團隊完成的“去霧”論文“Single Image Haze Removal Using Dark Channel Prior",也正是這篇論文獲得了亞洲第一個CVPR最佳論文獎。
論文鏈接:https://pubmed.ncbi.nlm.nih.gov/20820075/
第三篇則是“Deep Residual Learning for Image Recognition”。正是這篇論文提出了他最為人所熟知的成就——與何愷明等團隊成員攜手創(chuàng)造出的殘差網(wǎng)絡ResNet。ResNet在2015年提出之后,拿下過ImageNet冠軍,并斬獲了CVPR 2016最佳論文獎。
殘差神經網(wǎng)絡的主要貢獻是發(fā)現(xiàn)了“退化現(xiàn)象(Degradation)”,并針對退化現(xiàn)象發(fā)明了 “快捷連接(Shortcut connection)”,極大的消除了深度過大的神經網(wǎng)絡訓練困難問題。正是由于ResNet,神經網(wǎng)絡的深度首次突破了100層、最大的神經網(wǎng)絡甚至超過了1000層。
論文鏈接:https://arxiv.org/abs/1512.03385
在華剛博士介紹后,大會上播放了孫劍博士的親友及同事們所制作的紀念視頻,借以懷念這位良師與益友。
本屆黃煦濤紀念獎(Thomas Huang Memorial Award)由 李飛飛獲得。
黃煦濤紀念獎以計算機視覺領域泰斗黃煦濤命名,其設立是為了表彰在計算機視覺領域長期提供服務、研究和指導的杰出人士。
論文鏈接:https://arxiv.org/abs/2112.03907
最佳學生論文榮譽提名的是《Ref-NeRF:Structured View-Dependent Appearance for Neural Radiance Fields》。
神經輻射場(NeRF)是一種流行的視圖合成技術,其能夠將場景表示為一個連續(xù)的體積函數(shù),由多層感知機參數(shù)化,提供每個位置的體積密度和視相關的輻射亮度。雖然基于NeRF的技術擅長于表示具有平滑變化的視相關外觀的精細幾何結構,但它們往往不能準確地捕捉和再現(xiàn)光滑表面的外觀。而這篇論文通過引入Ref-NeRF來解決這個限制問題,Ref-NeRF取代了NeRF的參數(shù)化視相關的出射輻亮度與反射輻亮度的表示,并使用一組空間變化的場景屬性來構造這個函數(shù)。
代碼地址:https://github.com/tjiiv-cprg/epro-pnp
獲得最佳學生論文的是《EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose Estimation》,可以見到這篇論文全部由華人作者合作完成。
其中,第一作者Hansheng Chen來自同濟大學。
這篇論文稱,通過n點透視(Perspective-n-Points, PnP)從單個RGB圖像中定位3D物體是計算機視覺中一個長期存在的問題。在這篇論文中,作者提出了EPro-PnP,這是一種用于廣義的端到端姿態(tài)估計的概率PnP層,這種PnP層輸出在SE(3)流形上的姿態(tài)分布,本質上將分類Softmax引入連續(xù)域。
論文鏈接:https://openaccess.thecvf.com/content/CVPR2022/papers/Sheinin_Dual-Shutter_Optical_Vibration_Sensing_CVPR_2022_paper.pdf
而最佳論文榮譽提名的是《Dual-Shutter Optical Vibration Sensing》。
在這篇論文中,作者團隊提出了一種新穎的方法,可以使用額定僅為130Hz的傳感器感知多場景中的高速震動(高達63kHz)。
論文鏈接:https://arxiv.org/abs/2112.03424
代碼地址:https://github.com/petrhruby97/learning_minimal
本屆CVPR獲得最佳論文獎的是《Learning to Solve Hard Minimal Problems》。
這篇論文提出了一種在RANSAC框架下求解困難幾何優(yōu)化問題的方法。原來的幾何優(yōu)化問題放寬會產生具有許多偽解的最小問題,而這篇論文提出的方法避免了計算大量的偽解。
視頻鏈接:
雷峰網(wǎng)雷峰網(wǎng)(公眾號:雷峰網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。