0
本文作者: AI研習(xí)社-譯站 | 2018-02-05 11:32 |
這里是,雷鋒字幕組編譯的 Two Minute Papers專欄,每周帶大家用碎片時間閱覽前沿技術(shù),了解AI領(lǐng)域的最新研究成果。
原標(biāo)題 High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs
翻譯 | 劉寧 校對 | 凡江 整理 | 凡江
本期所介紹的內(nèi)容是——從語義圖上獲得高分辨率圖片。語義圖是一幅彩色圖片,圖上的不同色塊代表不同種類物體,如行人、汽車、交通標(biāo)志、建筑物等。
只需要在輸入的語義圖上修改相應(yīng)標(biāo)簽,就能把混凝土路面變成土路,把樹替換成建筑等等。
通常,我們采用光線模擬程序或光柵化來產(chǎn)生語義圖。但是AI研究者提出:為什么我們要使用光柵,而不是編寫一個可以自己合成圖像的學(xué)習(xí)算法?
下面的生成對抗網(wǎng)絡(luò)將一張語義圖作為輸入,并由此生成了一張高分辨率的逼真的圖像。之前的技術(shù)多數(shù)只能生成粗糙的低分辨率的圖片,看起來也不真實。而這個研究卻生成了2k乘1k分辨率的圖像,已經(jīng)很接近全高清的照片。
當(dāng)我們想手動編輯一張真實的照片里的內(nèi)容時,傳統(tǒng)的方法需要具備Photoshop等專業(yè)工具的技能。即使是很簡單的編輯也要耗費大量精力,因為人眼是非常難以欺騙的。而語義圖方法的優(yōu)點就是,不需要太多專業(yè)技能就可以很容易實現(xiàn)編輯。例如,我們可以通過將供選的物體填充到語義標(biāo)注圖中來控制生成的圖片。
這項技術(shù)不僅僅適用于室外交通圖片,它還可以對人臉細(xì)節(jié)進(jìn)行編輯。例如,可以用此方法簡單地添加胡子。把這項技術(shù)和之前的pix2pix和CRN技術(shù)做了比較,我們可以看出新技術(shù)生成的圖片的質(zhì)量,圖像在分辨率上也有明顯提高。
巧妙的一點在于,語義圖不僅僅用于標(biāo)識,它還生成了一幅邊界圖,使算法輸出分割得更好的圖片。
生成的邊界圖像和語義標(biāo)簽一樣非常有用。另一個技巧是創(chuàng)建多個鑒別器網(wǎng)絡(luò),并在不同精度的圖像上使用它們。
論文&代碼 原址 https://tcwang0509.github.io/pix2pixHD/
更多文章,關(guān)注雷鋒網(wǎng),添加雷鋒字幕組微信號(leiphonefansub)為好友
備注「我要加入」,To be a AI Volunteer !雷鋒網(wǎng)雷鋒網(wǎng)
相關(guān)文章:
從電影到游戲,你也能用GAN畫高清3D地形模型 | 2分鐘論文
從冬天回到夏天,英偉達(dá)的遷移網(wǎng)絡(luò)能派上用場 | 2分鐘論文
愛P才會贏,英偉達(dá)用GANS弄了個高清人臉合成項目 | 2分鐘論文
生成式對抗網(wǎng)絡(luò)GAN有哪些最新的發(fā)展? | 2分鐘讀論文
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。