0
本文作者: AI研習社-譯站 | 2017-10-27 16:28 |
雷鋒網(公眾號:雷鋒網)AI研習社【本期論文】
Optimizing the Latent Space of Generative Networks
生成網絡潛優(yōu)化
近期,生成對抗網絡(GAN)在機器學習研究方面取得了新的進展。我們可以直接合成動物新的圖像,從圖像中創(chuàng)建3D圖形,或者根據(jù)我們對圖像的編輯來創(chuàng)建新的產物。
生成對抗網絡意味著有兩個神經網絡在相互競爭相互比賽。生成網絡嘗試生成越來越多逼真的圖像,并將這些圖像傳遞給判別網絡,而判別網絡嘗試判斷真實的圖像與偽造的圖像之間的區(qū)別。
在這個過程中 兩個神經網絡一起進行學習和提高,知道它們能力越來越強(達到穩(wěn)態(tài))。
但是,互相訓練這些網絡并非一帆風順——我們不知道過程是否收斂,或者是否達到非合作博弈均衡。非合作博弈均衡是指,兩個行為者相信他們已經找到了一個最佳的策略,同時也考慮到了其他行為人可能的決定,但他們也不會對改變他們自己的策略有興趣。
正如游戲中經典場景:兩名被定罪的嫌疑人正在考慮他們是否應該相互勾結,但其中一方不知道對方決定采取的是什么樣的行動。
人工智能和游戲理論有相似之處,但是更厲害的地方在于:在這里,我們嘗試建立一個不需要處理這種情況的系統(tǒng),這種方式簡稱為生成潛優(yōu)化,簡稱GLO。
以下將介紹只通過使用生成網絡來欺騙判別網絡。如果你修讀過字體設計專業(yè),你久知道這是一個非常復雜的領域。但是,如果我們想創(chuàng)建一個新的字體類型,我們通常只關心是幾個特性,比如他們要如何彎曲,再或者就像我們處理一種簡單描述襯線字體那樣,同樣的原則也可以應用于人臉、動物以及你能想象的到的大多數(shù)課題。這意味著有許多復雜的,包含大量信息的概念。
這些概念其中大部分信息可以只通過少量功能的簡單描述來捕獲,這是通過將該高維數(shù)據(jù)投影到低維隱藏空間來完成的。
這個潛在空間有助于消除對抗性優(yōu)化,使得該系統(tǒng)更加容易訓練。主要的優(yōu)點是它仍然保留了生成對抗網絡具有吸引力的屬性,這意味著它可以從學習的數(shù)據(jù)集合中合成新的樣本。
如果學到鳥的概念,就能合成新的鳥類,它可以在數(shù)據(jù)點之間執(zhí)行連續(xù)插值。這意味著我們可以在兩種選擇之間產生中間狀態(tài),它也能夠在任意數(shù)量的數(shù)據(jù)點之間執(zhí)行簡單的算術運算。
例如,如果A是戴有太陽鏡的男性,B是沒有太陽眼鏡的男性,C是女性。那么A-B+C將產生戴有太陽鏡的女性。它也可以用于超分辨率,當然還有其他很多方面。
? 觀看論文解讀大概需要 4 分鐘
閱讀論文:https://arxiv.org/abs/1707.05776
經驗豐富的同學知道,對于生成對抗網絡,有很多關于如何通過更多細節(jié)合成高分辨率圖像的研究。這意味著,這又是一項令人興奮,使人視野更加開闊的工作。但這并不能與GAN后續(xù)工作進行比較,畢竟GAN還建立在更為成熟的研究的基礎之上。
雷鋒網AI研習社出品系列短視頻《 2 分鐘論文 》,帶大家用碎片時間閱覽前沿技術,了解 AI 領域的最新研究成果。歡迎關注雷鋒網雷鋒字幕組專欄,獲得更多AI知識~感謝志愿者對本期內容作出貢獻。
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。