3
本文作者: 奕欣 | 2017-07-27 11:40 | 專題:CVPR 2017 |
雷鋒網(wǎng) AI 科技評論按:截至發(fā)稿前,四篇榮獲 CVPR 2017 最佳論文的作者已經(jīng)分別做了口頭報告,而在到場聆聽報告的所有人當中,有一位略顯特別的聽眾——他便是本屆 CVPR 的大會主席、微軟研究院首席研究員張正友博士。在報告結(jié)束后,張正友主席與雷鋒網(wǎng) AI 科技評論進行了一次對話。
張正友,ACM Fellow (國際計算機學會院士)和 IEEE Fellow (國際電氣電子工程師學會院士),是微軟人工智能及研究事業(yè)部首席研究員和研究經(jīng)理,加入微軟美國本部已近二十年。1990年獲得巴黎第十一大學博士學位,在法國國家計算機和自動化研究院(INRIA)學習工作近十二年。張正友博士是世界著名的計算機視覺和多媒體技術(shù)的專家,在立體視覺、三維重建、運動分析、圖像配準、攝像機自標定、人臉表情識別等方面都有開創(chuàng)性的貢獻。他發(fā)明的平板攝像機標定法在全世界被普遍采用,被稱之為“張氏方法”。
與密切關(guān)注論文頒獎結(jié)果的老師同學們不一樣的是,張正友博士對「最佳論文」并沒有那么看重。他認為,這與論文所產(chǎn)生的影響力(impact)并不能同一而論?!肝覀兛梢曰乜催^去十年 CVPR 或是 ICCV 的最佳論文,幾乎沒有一篇能獲得 test of time award,」張正友博士表示,每年的最佳論文很大程度是由當年的熱門選題決定的,雖然由資深的教授和研究員擔綱評估,但畢竟是少數(shù)幾個人的看法。這些論文雖然都是很不錯的論文,但多年以后,它們的引用次數(shù)不一定是最高的,也不一定能「經(jīng)得起時間考驗」,獲得像 Longuet-Higgins 這樣的獎項。
正如今年的 Longuet-Higgins 所授予的 Test of Time 論文《Object Retrieval with Large Vocabularies and Fast Spatial Matching》一樣,當年的最佳論文并不歸屬于它。而張正友博士的親身經(jīng)歷同樣是最好的例證——憑借 1999 年在 ICCV 上發(fā)表的關(guān)于攝像機標定的文章《Flexible Camera Calibration by Viewing a Plane from Unknown Orientations》及后續(xù)在 IEEE T-PAMI 上發(fā)表的文章《A Flexible New Technique for Camera Calibration》,張正友博士在 2013 年榮獲由 IEEE 模式分析與機器智能技術(shù)委員會(PAMI TC)授予的 Helmholtz Test of Time 獎。值得一提的是,當年他將這篇 ICCV 論文投遞給 CVPR,卻沒被錄用。
「要靜得下心,要沉得住氣,」是張正友博士在 IJCV Lobster Night 上演講的中心思想。而他自己的研究工作,也嚴格遵循著這一原則。從 1988 年到 2002 年,14 年來,張正友博士一直按著每兩年選擇一個課題的節(jié)奏,對業(yè)界重要的問題進行深入細致的研究,而他每兩年的研究成果幾乎每個都在計算機視覺界產(chǎn)生了比較大的影響。同時,張正友博士也評論道,他個人并不反對學生對熱點話題(hot topic)的關(guān)注,也理解他們有著每年多出幾篇文章的壓力,但希望他們能從行業(yè)的真正需求出發(fā),將目光放得長遠一些。
作為過來人,張正友博士感慨道,如今的學生與以前的學習方式迥乎不同。以前由于條件限制,學生的每一行代碼都需要自己從頭開始編寫,但也正因為這樣,學生對推導的每一步都非常了解,基礎(chǔ)也相對扎實;而如今互聯(lián)網(wǎng)資源非常豐富,學生往往沒有花足夠的時間理解算法背后的原理,也沒有耐心關(guān)注基礎(chǔ)問題的研究。
「我覺得同學們沒有必要為了多發(fā)表幾篇文章而犧牲了思考這些問題的機會。雖然能在熱點研究領(lǐng)域做些改進使其在數(shù)據(jù)集上呈現(xiàn)比較好的結(jié)果,發(fā)表文章相對容易,但像深度學習這樣的熱點總會過去。如果沒有獨到的貢獻,明年還有人知道你的工作嗎?」
時光荏苒,曾經(jīng)作為論文投遞者和會議參與者的張正友博士,如今已經(jīng)成為了 CVPR 2017 的大會主席,以重要推動者的身份組織著本次大會。根據(jù)本次大會的官方資料,CVPR 2017 的與會人數(shù)達到 4950 人,達到了歷史高峰;本次論文有效投遞數(shù)為 2620 篇,收錄 783 篇,投遞數(shù)目比去年增加了40%。
自然,這對于會務(wù)的組織者而言是一個不小的挑戰(zhàn):由于投遞的論文數(shù)量過多,為了在規(guī)定時間內(nèi)完成評審任務(wù),組委會不得不緊急增加一些評審人;針對去年CVPR因為人數(shù)劇增暴露出的后勤保障混亂、中間休息的咖啡不足、展會和 posters 空間擁擠等問題,組委會為這次 CVPR 做了很長的準備,在會議中心預留了6000人的空間,并雇傭了一個專業(yè)的支持展會的承包商。組委會齊心協(xié)力辦一場出色的 CVPR,不僅是為了促進計算機視覺領(lǐng)域在人工智能領(lǐng)域的交流;也是一次 CV 圈展現(xiàn)自我的機會。雖然參加 CVPR 的人數(shù)從去年的 3650 人增加到了今年的 4950 人,但整個會議進展非常順暢,大家的反饋也非常滿意。
而在這次會議中,AI 科技評論的一個明顯感受是華人面孔非常多;關(guān)于這一點,張正友博士表示,由于今年自己擔任大會主席,劉燕西博士和吳郢博士擔任程序委員會主席,因此在區(qū)域主席的選擇上,也有意識地增加了華人的比重,希望能夠提升華人在學術(shù)領(lǐng)域的影響力。在組委會的其它位置,比如企業(yè)關(guān)系主席,也盡可能安排能干的華人擔任。就像吳郢博士在 IJCV Lobster Night 上的發(fā)言所說,大部分的論文作者中,至少會出現(xiàn)一個亞洲名字;口頭報告中涌現(xiàn)越來越多的亞洲面孔;而贊助商也有很多來自亞洲國家。中國作為亞洲的重要大國,華人自然也是這一群體的中堅力量。
然而,張正友博士也發(fā)現(xiàn),雖然華人在學術(shù)會議里的地位和力量不可小視,但當這些優(yōu)秀的華人學生畢業(yè)之后,能留在學術(shù)界持續(xù)做貢獻的人并不多,很多會轉(zhuǎn)投工業(yè)界繼續(xù)做研究或是創(chuàng)業(yè)。以往計算機視覺的學生很難找到工作,而現(xiàn)在,隨著它的持續(xù)發(fā)展繁榮,學生們也成為了工業(yè)界關(guān)注和爭奪的對象,投身工業(yè)界也成為了順理成章的事情。以 CVPR 2017 為例,本屆會議的贊助商達到 127 家,總贊助費超過 85.9 萬美金。這也從側(cè)面體現(xiàn)出了工業(yè)界對學術(shù)人才的龐大需求。不過張正友博士也認為,這種「流失」實際上也與個人的選擇有關(guān),「做研究的目的,一方面是為了增加人類的知識,發(fā)掘新的方法;另一個還是要對社會產(chǎn)生影響,在工業(yè)界工作算得上是其中一種方式吧?!?/p>
張正友博士對計算機視覺的未來充滿了信心,也呈現(xiàn)非常樂觀的態(tài)度。他認為,無論從論文的投遞數(shù)目,還是展商對學術(shù)會議的高度關(guān)注來看,都反映出計算機視覺是一個非常具有前景的領(lǐng)域。「深度學習也不只是大數(shù)據(jù)的游戲,有人已經(jīng)開始研究如何將深度學習和幾何概念和物理信息結(jié)合。此外,計算機視覺也已經(jīng)與很多領(lǐng)域有了交叉,比如為了理解圖像,我們需要結(jié)合語言進行處理。而在未來,各個學科會以更加多樣化的形式融合?!雇瑯拥?,未來屬于富有創(chuàng)新力量的老師和同學們,未來的研究趨勢和浪潮,將由他們來引領(lǐng)和推動。
今天,CVPR 2017 已經(jīng)進入尾聲,我們也期待下一年的 CVPR 能夠給我們帶來更多驚喜。更多資訊,敬請關(guān)注 CVPR,關(guān)注雷鋒網(wǎng) AI 科技評論。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章