丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能開(kāi)發(fā)者 正文
發(fā)私信給skura
發(fā)送

0

DeepMind 發(fā)布 VQVAE-2,圖片生成效果超越 BigGAN

本文作者: skura 2019-06-12 10:46
導(dǎo)語(yǔ):相關(guān)的論文已被 ICLR2019 接收為 oral 論文

雷鋒網(wǎng) AI 科技評(píng)論按,近日,DeepMind 的研究人員宣布,VQVAE-2 問(wèn)世了!

VQ-VAE 是 Vector Quantised-Variational Auto Encoder 的簡(jiǎn)寫,此次的 VQ-VAE2 是 DeepMind 基于第一代 VQ-VAE 研究出來(lái)的改進(jìn)模型。相關(guān)的論文已被 ICLR2019 接收為口頭報(bào)告論文,DeepMind 研究員 Suman Ravuri 做了精彩的現(xiàn)場(chǎng)演講。

論文 ARIXV 鏈接:http://arxiv.org/abs/1906.00446

論文摘要如下:

DeepMind 發(fā)布 VQVAE-2,圖片生成效果超越 BigGAN

我們探討了矢量量化變分自動(dòng)編碼(VQ-VAE)模型在大規(guī)模圖像生成中的應(yīng)用。為此,我們對(duì)VQ-VAE 中使用的自回歸先驗(yàn)進(jìn)行了縮放和增強(qiáng),目的是生成比以前具有更高相關(guān)度和保真度的合成樣本。我們使用簡(jiǎn)單的前饋編解碼器網(wǎng)絡(luò),這讓我們的模型對(duì)于編碼\解碼速度至關(guān)重要的應(yīng)用非常有用。此外,VQ-VAE 僅僅只需要在壓縮潛在空間中對(duì)自回歸模型進(jìn)行采樣,這比在像素空間中的采樣在速度上快一個(gè)數(shù)量級(jí),對(duì)于大型圖像尤其如此。我們證明了一個(gè) VQ-VAE 的多尺度層次組織,加上強(qiáng)大的先驗(yàn)潛在代碼,能夠在多種數(shù)據(jù)集(如 ImageNet)上生成質(zhì)量與最先進(jìn)的生成對(duì)抗網(wǎng)絡(luò)相媲美的樣本,同時(shí)不受 GAN 的已知缺點(diǎn),如模式崩潰、多樣性的缺乏等的影響。

DeepMindAI 的這一研究表明,當(dāng)用于訓(xùn)練分類器(數(shù)據(jù)增強(qiáng))時(shí),GAN 生成在看起來(lái)真實(shí)的樣本的能力有限。初始分?jǐn)?shù)與分類表現(xiàn)呈負(fù)相關(guān)。

論文的三位作者之一,DeepMind 的研究人員 Aaron van den Oord 在 twitter 上表示,這是一個(gè)在分層壓縮潛在空間中的強(qiáng)大自回歸模型,在創(chuàng)建示例時(shí),任何模式中都沒(méi)有遇到崩潰問(wèn)題。

更多示例和細(xì)節(jié)如下:

DeepMind 發(fā)布 VQVAE-2,圖片生成效果超越 BigGAN

他們使用一個(gè)分層的 VQVAE,將圖像壓縮成一個(gè)潛在空間,相對(duì)于 ImageNet 來(lái)說(shuō),這個(gè)空間要小 50 倍,相對(duì)于 FFHQ 面來(lái)說(shuō),這個(gè)空間要小 200 倍。PixelCNN 僅對(duì)最新的產(chǎn)品進(jìn)行建模,使其能夠?qū)⑵淠芰τ糜谌纸Y(jié)構(gòu)和最明顯的特征上。

DeepMind 發(fā)布 VQVAE-2,圖片生成效果超越 BigGAN

他們 256 像素的兩級(jí) ImageNet VQVAE 中的樣本如下:

DeepMind 發(fā)布 VQVAE-2,圖片生成效果超越 BigGAN

結(jié)果,他們發(fā)現(xiàn),這些樣本在多樣性方面比競(jìng)爭(zhēng)對(duì)手的方法生成的樣本要好得多。

DeepMind 發(fā)布 VQVAE-2,圖片生成效果超越 BigGAN

對(duì)于百萬(wàn)像素的人臉(1024x1024),他們使用了三級(jí) VQVAE 模型。

DeepMind 發(fā)布 VQVAE-2,圖片生成效果超越 BigGAN

更多的樣本和高分辨率未壓縮圖像可以在這里找到:https://t.co/EGaUMHA7FN?amp=1

DeepMind 發(fā)布 VQVAE-2,圖片生成效果超越 BigGAN

感興趣的童鞋可以下載相關(guān)論文,開(kāi)始愉快地學(xué)習(xí)吧~

via:https://mobile.twitter.com/avdnoord/status/1135900129402208257

雷鋒網(wǎng)雷鋒網(wǎng)

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知

DeepMind 發(fā)布 VQVAE-2,圖片生成效果超越 BigGAN

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)