丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給AI研習社-譯站
發(fā)送

0

使用 Gan 網(wǎng)絡生成名人照片

本文作者: AI研習社-譯站 2018-08-24 14:17
導語:生成式對抗網(wǎng)絡是一類用于無監(jiān)督學習算法的人工算法

雷鋒網(wǎng)按:本文為 AI 研習社編譯的技術博客,原標題 Celebrity Face Generation using GANs,作者為 SHIVAM BANSAL。

翻譯 | 江舟      校對 | 吳曉曼      整理 | MY


生成式對抗網(wǎng)絡(GANs)是深度學習中最熱門的話題之一。生成式對抗網(wǎng)絡是一類用于無監(jiān)督學習算法的人工算法,由兩個神經(jīng)網(wǎng)絡組成的系統(tǒng)實現(xiàn)

  1. 生成器

  2. 鑒別器

兩個神經(jīng)網(wǎng)絡都在零和游戲框架中相互競爭。生成式對抗網(wǎng)絡(GANs)是一組模型,他們基本上學習創(chuàng)建與其給出的輸入數(shù)據(jù)類似的合成數(shù)據(jù)。

使用 Gan 網(wǎng)絡生成名人照片

鑒別器的任務是確定給定圖像是否看起來自然(即是來自數(shù)據(jù)集的圖像)還是看起來它是人工創(chuàng)建的。生成器的任務是創(chuàng)建與原始數(shù)據(jù)分布類似的自然外觀圖像,這些圖像看起來足夠自然以欺騙鑒別器網(wǎng)絡。首先給生成器一個隨機噪聲,使用它產(chǎn)生假圖像,然后將這些假圖像與原始圖像一起發(fā)送到鑒別器。

鑒別模型的任務是確定給定圖像看起來是自然的(來自數(shù)據(jù)集的圖像)還是人工創(chuàng)建的。這基本上是一個二元分類器,它采用普通卷積神經(jīng)網(wǎng)絡(CNN)的形式。生成器的任務是創(chuàng)建與原始數(shù)據(jù)分布類似的自然外觀圖像。

生成器試圖蒙騙鑒別器,而鑒別器試圖不被生成器蒙騙。當模型通過交替優(yōu)化訓練時,兩種方法都被改進到“假圖像與數(shù)據(jù)集圖像無”法區(qū)分的點。

生成對抗式網(wǎng)絡的數(shù)學方程:

使用 Gan 網(wǎng)絡生成名人照片

我們可以認為這個方程由兩部分組成,第一部分是從原始數(shù)據(jù)分布中采樣的數(shù)據(jù),第二部分是從噪聲數(shù)據(jù)分布中采樣的數(shù)據(jù)。


第一部分

鑒別者總是希望最大化其圖像分類的正確率。這里的圖像是從原始數(shù)據(jù)分布中采樣的,原始數(shù)據(jù)分布是真實數(shù)據(jù)本身。D(x)是顯示圖像是真實的概率,所以鑒別器總是想要最大化 D(x),因此 log(D(x))應該最大化并且在這一部分內容中必須最大化。


第二部分

'z'是隨機噪聲樣本,G(z)是使用噪聲樣本生成的圖像。這個術語的解釋和之前很相似。生成器總是希望最大化鑒別器被生成的圖像蒙騙的概率。這意味著,生成器想要最大化 D(G(z)),因此它應該最小化 1-D(G(z))也意味著(1-D(G(z)))最小化。


使用 GANs 生成名人圖像

使用 Gan 網(wǎng)絡生成名人照片

名人圖片數(shù)據(jù)集:

CelebA 數(shù)據(jù)集是超過 200,000 個帶注釋的名人面部圖像的集合。因為在這個博客中,我只是想生成面孔所以我沒有考慮注釋。

1)獲取數(shù)據(jù): 

使用 Gan 網(wǎng)絡生成名人照片

我創(chuàng)建了 helper.py 文件,你可以通過該文件下載 CelebA 數(shù)據(jù)集圖像。在運行此代碼片段時,它將下載 CelebA 數(shù)據(jù)集。(源代碼鏈接如下)。

2)預處理圖像:

由于我僅在面部圖像上工作,為獲得良好的效果所以我將其調整到 28 * 28。我裁剪了圖像中不包含圖像部分的部分。

使用 Gan 網(wǎng)絡生成名人照片

由于生成式對抗網(wǎng)絡很難訓練(你可以查看此鏈接,以了解為什么生成式對抗網(wǎng)絡的訓練如此困難?)

為了獲得準確的結果,我們應該擁有一個良好的 GPU(4GB 或更高版本),通過運行此代碼片段,你可以了解是否使用自己的 GPU 安裝了 tensorflow。

使用 Gan 網(wǎng)絡生成名人照片

3)模型輸入和網(wǎng)絡結構

我將圖像的寬,高,channel 和噪聲參數(shù)作為模型的輸入,隨后生成器也會使用它們生成假圖像。

生成器結構:

使用 Gan 網(wǎng)絡生成名人照片

在解卷積層之后,生成器結構具有致密層和全連接層(除輸出層外每一層都有批量標準化,leaky ReLu 和 dropout)。生成器將隨機噪聲向量 z,之后把它重塑為 4D 形狀并把它傳遞給一系列上采樣層。每個上采樣層都代表一個轉置卷積運算,即反卷積運算。

所有轉置卷積的深度從 1024 一直減少到 3,它表示 RGB 彩色圖像。最后一層通過雙曲正切(tanh)函數(shù)輸出 28x28x3 張量。


鑒別器結構:

使用 Gan 網(wǎng)絡生成名人照片

鑒別器的工作是識別哪個圖像是真實的,哪個是假的。鑒別器也是具有批量歸一化、lekeay Relu 的 4 層 CNN(輸入層除外)。鑒別器接收輸出圖像(大小為 28 * 28 * 3)并對其進行卷積。最后,鑒別器使用 Logistic Sigmoid 函數(shù)顯示用于表示圖像是真或假的輸出概率。

當鑒別器看到圖像中的差異時,它將梯度信號發(fā)送到生成器,此信號從鑒別器流向生成器。


4)生成器損失和鑒別器損失: 

鑒別器從訓練圖像和生成器兩者接收圖像,因此在計算鑒別器的損失時,我們必須增加由于真實圖像和假圖像造成的損失。兩個網(wǎng)絡被同時訓練,所以我們需要將生成器和鑒別器都進行優(yōu)化。如果圖像是真實的,我們希望從鑒別器輸出接近 1 的概率,如果圖像是假的,則輸出接近 0 的概率。

使用 Gan 網(wǎng)絡生成名人照片


訓練和結果

......

想要繼續(xù)閱讀,請移步至我們的AI研習社社區(qū):https://club.leiphone.com/page/TextTranslation/777

更多精彩內容盡在 AI 研習社。

不同領域包括計算機視覺,語音語義,區(qū)塊鏈,自動駕駛,數(shù)據(jù)挖掘,智能控制,編程語言等每日更新。

雷鋒網(wǎng)雷鋒網(wǎng)(公眾號:雷鋒網(wǎng)(公眾號:雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))))


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。

使用 Gan 網(wǎng)絡生成名人照片

分享:
相關文章

知情人士

AI研習社(yanxishe.com)譯站頻道,傳播前沿人工智能知識,讓語言不再成為學習知識的門檻。(原雷鋒字幕組)
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說