丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能學術 正文
發(fā)私信給楊曉凡
發(fā)送

0

生成的圖像數(shù)據(jù)集效果不好?也許你需要考慮內(nèi)容分布的差異

本文作者: 楊曉凡 2019-04-30 17:47
導語:圖像風格相似遠遠不是全部

生成的圖像數(shù)據(jù)集效果不好?也許你需要考慮內(nèi)容分布的差異

雷鋒網(wǎng) AI 科技評論按:大家都知道深度學習模型的表現(xiàn)會隨著訓練數(shù)據(jù)增加而提高,所以為了不斷提高模型表現(xiàn),模型本身的設計和訓練數(shù)據(jù)擴增方面的研究也都非常多。對于圖像相關的任務,傳統(tǒng)上有基于變換的數(shù)據(jù)擴增方法,雷鋒網(wǎng) AI 科技評論曾經(jīng)介紹過谷歌式的暴力收集、有 Facebook 利用用戶上傳圖像的標簽,也有蘋果的生成并微調(diào)。生成數(shù)據(jù)的方法當然是最理想的,畢竟許多任務中所有有關的圖像加起來也沒有多少,而且生成數(shù)據(jù)的同時也直接獲得了真實標簽。但生成數(shù)據(jù)的方法也有嚴重的問題,那就是生成數(shù)據(jù)集和真實數(shù)據(jù)集的數(shù)據(jù)分布之間會有差異,這些差異限制了生成數(shù)據(jù)方法的效果。

對生成數(shù)據(jù)集和真實數(shù)據(jù)集差異的探究目前也有不少成果,比如學習不同任務通用的圖像特征、學習圖像風格遷移等,這樣可以讓生成數(shù)據(jù)集中的圖像看上去更像真實圖像。不過這篇論文的作者們認為,圖像風格的差異其實只是很小的因素,更重要的差異在于圖像內(nèi)容的差異,而且生成的圖像應當對新的任務有幫助。以往的圖像生成方法只能覆蓋有限的場景、有限的物體、有限的變化,對真實世界物體的多變性和屬性的分布刻畫不足;而且作者們提出,以 KITTI 數(shù)據(jù)集為例,它的數(shù)據(jù)是在德國采集的,但也許別的研究人員使用這個數(shù)據(jù)集訓練的系統(tǒng)是想要在日本使用的,場景內(nèi)容一定會有所不同;甚至服務的任務目標也可以不同。這都是現(xiàn)有的數(shù)據(jù)生成方法沒有解決,甚至沒有考慮的方面。如果完全在虛擬環(huán)境中復制重現(xiàn)的話,資金和時間成本也都非常高昂。

生成的圖像數(shù)據(jù)集效果不好?也許你需要考慮內(nèi)容分布的差異

Meta-Sim 生成的數(shù)據(jù)集能夠縮小真實和生成數(shù)據(jù)之間的分布,而且能為下游任務進行優(yōu)化

所以在論文《Meta-Sim: Learning to Generate Synthetic Datasets》中,作者們旗幟鮮明地提出,他們的研究目標是自動生成大規(guī)模標注數(shù)據(jù)集,而且這個數(shù)據(jù)集是對下游任務有幫助的(數(shù)據(jù)集中的內(nèi)容分布能夠符合目標使用場景)。作者們提出的方法是 Meta-Sim,它會學習到關于新合成的場景的生成式模型,而且可以通過一個圖形引擎同步獲得訓練用的圖形和對應的真實標簽值。作者們接著用神經(jīng)網(wǎng)絡對數(shù)據(jù)集生成器進行參數(shù)化,使得它能夠學會修改從場景內(nèi)容分布概率中獲得的場景結構圖的屬性,以便減小圖像引擎輸出的圖像和目標數(shù)據(jù)集分布之間的差異。如果要模仿的真實數(shù)據(jù)集帶有一個小的有標注驗證集的話,作者們的方法還可以額外針對一個元目標進行優(yōu)化,也就是說可以針對當前數(shù)據(jù)集任務的下游任務進行優(yōu)化。實驗表明,與人工設計的場景內(nèi)容分布概率相比,他們提出的方法可以極大提高內(nèi)容生成質量,可以在下游任務上定性以及定量地得到驗證。更多具體細節(jié)可以參見論文原文。

這篇論文的作者們來自英偉達、多倫多大學、Vector 人工智能學院以及MIT。

項目主頁參見: https: //nv-tlabs.github.io/meta-sim/ 

論文地址:https://arxiv.org/abs/1904.11621 

雷鋒網(wǎng) AI 科技評論報道

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。

生成的圖像數(shù)據(jù)集效果不好?也許你需要考慮內(nèi)容分布的差異

分享:
相關文章

讀論文為生

日常笑點滴,學術死腦筋
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說