丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能開發(fā)者 正文
發(fā)私信給汪思穎
發(fā)送

0

完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制

本文作者: 汪思穎 2017-09-01 18:16
導(dǎo)語:幫助初學(xué)者開啟全新視角

雷鋒網(wǎng) AI科技評(píng)論按:本文作者何之源,原文載于知乎專欄AI Insight,AI科技評(píng)論獲其授權(quán)發(fā)布。

本文主要是利用圖片的形式,詳細(xì)地介紹了經(jīng)典的RNN、RNN幾個(gè)重要變體,以及Seq2Seq模型、Attention機(jī)制。希望這篇文章能夠提供一個(gè)全新的視角,幫助初學(xué)者更好地入門。

一、從單層網(wǎng)絡(luò)談起

在學(xué)習(xí)RNN之前,首先要了解一下最基本的單層網(wǎng)絡(luò),它的結(jié)構(gòu)如圖:

完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制

輸入是x,經(jīng)過變換Wx+b和激活函數(shù)f得到輸出y。相信大家對這個(gè)已經(jīng)非常熟悉了。

二、經(jīng)典的RNN結(jié)構(gòu)(N vs N)

在實(shí)際應(yīng)用中,我們還會(huì)遇到很多序列形的數(shù)據(jù):


完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制

如:

  • 自然語言處理問題。x1可以看做是第一個(gè)單詞,x2可以看做是第二個(gè)單詞,依次類推。

  • 語音處理。此時(shí),x1、x2、x3……是每幀的聲音信號(hào)。

  • 時(shí)間序列問題。例如每天的股票價(jià)格等等

序列形的數(shù)據(jù)就不太好用原始的神經(jīng)網(wǎng)絡(luò)處理了。為了建模序列問題,RNN引入了隱狀態(tài)h(hidden state)的概念,h可以對序列形的數(shù)據(jù)提取特征,接著再轉(zhuǎn)換為輸出。先從h1的計(jì)算開始看:

完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制

圖示中記號(hào)的含義是:

  • 圓圈或方塊表示的是向量。

  • 一個(gè)箭頭就表示對該向量做一次變換。如上圖中h0和x1分別有一個(gè)箭頭連接,就表示對h0和x1各做了一次變換。

在很多論文中也會(huì)出現(xiàn)類似的記號(hào),初學(xué)的時(shí)候很容易搞亂,但只要把握住以上兩點(diǎn),就可以比較輕松地理解圖示背后的含義。

h2的計(jì)算和h1類似。要注意的是,在計(jì)算時(shí),每一步使用的參數(shù)U、W、b都是一樣的,也就是說每個(gè)步驟的參數(shù)都是共享的,這是RNN的重要特點(diǎn),一定要牢記。

完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制

依次計(jì)算剩下來的(使用相同的參數(shù)U、W、b):

完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制

我們這里為了方便起見,只畫出序列長度為4的情況,實(shí)際上,這個(gè)計(jì)算過程可以無限地持續(xù)下去。

我們目前的RNN還沒有輸出,得到輸出值的方法就是直接通過h進(jìn)行計(jì)算:

完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制

正如之前所說,一個(gè)箭頭就表示對對應(yīng)的向量做一次類似于f(Wx+b)的變換,這里的這個(gè)箭頭就表示對h1進(jìn)行一次變換,得到輸出y1。

剩下的輸出類似進(jìn)行(使用和y1同樣的參數(shù)V和c):

完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制

OK!大功告成!這就是最經(jīng)典的RNN結(jié)構(gòu),我們像搭積木一樣把它搭好了。它的輸入是x1, x2, .....xn,輸出為y1, y2, ...yn,也就是說,輸入和輸出序列必須要是等長的

由于這個(gè)限制的存在,經(jīng)典RNN的適用范圍比較小,但也有一些問題適合用經(jīng)典的RNN結(jié)構(gòu)建模,如:

  • 計(jì)算視頻中每一幀的分類標(biāo)簽。因?yàn)橐獙γ恳粠M(jìn)行計(jì)算,因此輸入和輸出序列等長。

  • 輸入為字符,輸出為下一個(gè)字符的概率。這就是著名的Char RNN(詳細(xì)介紹請參考:The Unreasonable Effectiveness of Recurrent Neural Networks,地址:http://karpathy.github.io/2015/05/21/rnn-effectiveness/。Char RNN可以用來生成文章,詩歌,甚至是代碼,非常有意思)。

三、N VS 1

有的時(shí)候,我們要處理的問題輸入是一個(gè)序列,輸出是一個(gè)單獨(dú)的值而不是序列,應(yīng)該怎樣建模呢?實(shí)際上,我們只在最后一個(gè)h上進(jìn)行輸出變換就可以了:

完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制

這種結(jié)構(gòu)通常用來處理序列分類問題。如輸入一段文字判別它所屬的類別,輸入一個(gè)句子判斷其情感傾向,輸入一段視頻并判斷它的類別等等。

四、1 VS N

輸入不是序列而輸出為序列的情況怎么處理?我們可以只在序列開始進(jìn)行輸入計(jì)算:

完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制

還有一種結(jié)構(gòu)是把輸入信息X作為每個(gè)階段的輸入:

完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制

下圖省略了一些X的圓圈,是一個(gè)等價(jià)表示:

完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制

這種1 VS N的結(jié)構(gòu)可以處理的問題有:

  • 從圖像生成文字(image caption),此時(shí)輸入的X就是圖像的特征,而輸出的y序列就是一段句子

  • 從類別生成語音或音樂等

五、N vs M

下面我們來介紹RNN最重要的一個(gè)變種:N vs M。這種結(jié)構(gòu)又叫Encoder-Decoder模型,也可以稱之為Seq2Seq模型。

原始的N vs N RNN要求序列等長,然而我們遇到的大部分問題序列都是不等長的,如機(jī)器翻譯中,源語言和目標(biāo)語言的句子往往并沒有相同的長度。

為此,Encoder-Decoder結(jié)構(gòu)先將輸入數(shù)據(jù)編碼成一個(gè)上下文向量c:

完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制

得到c有多種方式,最簡單的方法就是把Encoder的最后一個(gè)隱狀態(tài)賦值給c,還可以對最后的隱狀態(tài)做一個(gè)變換得到c,也可以對所有的隱狀態(tài)做變換。

拿到c之后,就用另一個(gè)RNN網(wǎng)絡(luò)對其進(jìn)行解碼,這部分RNN網(wǎng)絡(luò)被稱為Decoder。具體做法就是將c當(dāng)做之前的初始狀態(tài)h0輸入到Decoder中:

完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制

還有一種做法是將c當(dāng)做每一步的輸入:

完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制

由于這種Encoder-Decoder結(jié)構(gòu)不限制輸入和輸出的序列長度,因此應(yīng)用的范圍非常廣泛,比如:

  • 機(jī)器翻譯。Encoder-Decoder的最經(jīng)典應(yīng)用,事實(shí)上這一結(jié)構(gòu)就是在機(jī)器翻譯領(lǐng)域最先提出的

  • 文本摘要。輸入是一段文本序列,輸出是這段文本序列的摘要序列。

  • 閱讀理解。將輸入的文章和問題分別編碼,再對其進(jìn)行解碼得到問題的答案。

  • 語音識(shí)別。輸入是語音信號(hào)序列,輸出是文字序列。

  • …………

六、Attention機(jī)制

在Encoder-Decoder結(jié)構(gòu)中,Encoder把所有的輸入序列都編碼成一個(gè)統(tǒng)一的語義特征c再解碼,因此, c中必須包含原始序列中的所有信息,它的長度就成了限制模型性能的瓶頸。如機(jī)器翻譯問題,當(dāng)要翻譯的句子較長時(shí),一個(gè)c可能存不下那么多信息,就會(huì)造成翻譯精度的下降。

Attention機(jī)制通過在每個(gè)時(shí)間輸入不同的c來解決這個(gè)問題,下圖是帶有Attention機(jī)制的Decoder:

完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制

每一個(gè)c會(huì)自動(dòng)去選取與當(dāng)前所要輸出的y最合適的上下文信息。具體來說,我們用 完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制 衡量Encoder中第j階段的hj和解碼時(shí)第i階段的相關(guān)性,最終Decoder中第i階段的輸入的上下文信息 完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制 就來自于所有 完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制 的加權(quán)和。

以機(jī)器翻譯為例(將中文翻譯成英文):

完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制

輸入的序列是“我愛中國”,因此,Encoder中的h1、h2、h3、h4就可以分別看做是“我”、“愛”、“中”、“國”所代表的信息。在翻譯成英語時(shí),第一個(gè)上下文c1應(yīng)該和“我”這個(gè)字最相關(guān),因此對應(yīng)的 完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制 就比較大,而相應(yīng)的 完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制 就比較小。c2應(yīng)該和“愛”最相關(guān),因此對應(yīng)的 完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制 就比較大。最后的c3和h3、h4最相關(guān),因此 完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制 、 完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制 的值就比較大。

至此,關(guān)于Attention模型,我們就只剩最后一個(gè)問題了,那就是:這些權(quán)重 aij 是怎么來的?

事實(shí)上, aij同樣是從模型中學(xué)出的,它實(shí)際和Decoder的第i-1階段的隱狀態(tài)、Encoder第j個(gè)階段的隱狀態(tài)有關(guān)。

同樣還是拿上面的機(jī)器翻譯舉例, a1j 的計(jì)算(此時(shí)箭頭就表示對h'和 完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制 同時(shí)做變換):

完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制

a2j 的計(jì)算:

完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制

a3j的計(jì)算:

完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制

以上就是帶有Attention的Encoder-Decoder模型計(jì)算的全過程。

七、總結(jié)

本文主要講了N vs N,N vs 1、1 vs N、N vs M四種經(jīng)典的RNN模型,以及如何使用Attention結(jié)構(gòu)。希望能對大家有所幫助。

可能有小伙伴發(fā)現(xiàn)沒有LSTM的內(nèi)容,其實(shí)是因?yàn)長STM從外部看和RNN完全一樣,因此上面的所有結(jié)構(gòu)對LSTM都是通用的,想了解LSTM內(nèi)部結(jié)構(gòu)的可以參考這篇文章:Understanding LSTM Networks(地址:http://colah.github.io/posts/2015-08-Understanding-LSTMs/),寫得非常好,推薦閱讀。

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

完全圖解RNN、RNN變體、Seq2Seq、Attention機(jī)制

分享:
相關(guān)文章

編輯

關(guān)注AI學(xué)術(shù),例如論文
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說