丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能開發(fā)者 正文
發(fā)私信給AI研習(xí)社
發(fā)送

0

當(dāng) AI 邂逅藝術(shù):機(jī)器寫詩綜述

本文作者: AI研習(xí)社 編輯:賈智龍 2017-05-12 17:50
導(dǎo)語:用RNN寫詩,是什么效果?

引言

什么是藝術(shù)?
機(jī)器的作品能否叫藝術(shù)?
機(jī)器能否取代藝術(shù)家?

這些問題,相信不同的人,會有不同的答案。很多人認(rèn)為機(jī)器生成的作品只是簡單的模仿人類,沒有創(chuàng)造性可言,但是人類藝術(shù)家,不也是從模仿和學(xué)習(xí)開始的嗎?本文是為 PaperWeekly 寫的一篇機(jī)器詩歌生成的綜述文章,希望能增進(jìn)大家對這個領(lǐng)域的了解。

詩歌是人類文學(xué)皇冠上的明珠。我國自《詩經(jīng)》以后,兩千年來的詩篇燦若繁星。讓機(jī)器自動生成詩歌,一直是人工智能領(lǐng)域一個有挑戰(zhàn)性的工作。

基于傳統(tǒng)方法的詩歌生成

機(jī)器詩歌生成的工作,始于 20 世紀(jì) 70 年代。傳統(tǒng)的詩歌生成方法,主要有以下幾種:

  • Word Salada(詞語沙拉):是最早期的詩歌生成模型,被稱作只是簡單將詞語進(jìn)行隨機(jī)組合和堆砌而不考慮語義語法要求。

  • 基于模板和模式的方法:基于模板的方法類似于完形填空,將一首現(xiàn)有詩歌挖去一些詞,作為模板,再用一些其他詞進(jìn)行替換,產(chǎn)生新的詩歌。這種方法生成的詩歌在語法上有所提升,但是靈活性太差。因此后來出現(xiàn)了基于模式的方法,通過對每個位置詞的詞性,韻律平仄進(jìn)行限制,來進(jìn)行詩歌生成。

  • 基于遺傳算法的方法:周昌樂等 [1] 提出并應(yīng)用到宋詞生成上。這里將詩歌生成看成狀態(tài)空間搜索問題。先從隨機(jī)詩句開始,然后借助人工定義的詩句評估函數(shù),不斷進(jìn)行評估,進(jìn)化的迭代,最終得到詩歌。這種方法在單句上有較好的結(jié)果,但是句子之間缺乏語義連貫性。

  • 基于摘要生成的方法:嚴(yán)睿等 [2] 將詩歌生成看成給定寫作意圖的摘要生成問題,同時加入了詩歌相關(guān)的一些優(yōu)化約束。

  • 基于統(tǒng)計機(jī)器翻譯的方法:MSRA 的何晶和周明 [3] 將詩歌生成看成一個機(jī)器翻譯問題,將上一句看成源語言,下一句看成目標(biāo)語言,用統(tǒng)計機(jī)器翻譯模型進(jìn)行翻譯,并加上平仄押韻等約束,得到下一句。通過不斷重復(fù)這個過程,得到一首完整的詩歌。

基于深度學(xué)習(xí)技術(shù)的詩歌生成

傳統(tǒng)方法非常依賴于詩詞領(lǐng)域的專業(yè)知識,需要專家設(shè)計大量的人工規(guī)則,對生成詩詞的格律和質(zhì)量進(jìn)行約束。同時遷移能力也比較差,難以直接應(yīng)用到其他文體(唐詩,宋詞等)和語言(英文,日文等)。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,詩歌生成的研究進(jìn)入了一個新的階段。

RNNLM

基于 RNN 語言模型 [4] 的方法,將詩歌的整體內(nèi)容,作為訓(xùn)練語料送給 RNN 語言模型進(jìn)行訓(xùn)練。訓(xùn)練完成后,先給定一些初始內(nèi)容,然后就可以按照語言模型輸出的概率分布進(jìn)行采樣得到下一個詞,不斷重復(fù)這個過程就產(chǎn)生完整的詩歌。Karpathy 有一篇文章,非常詳細(xì)的介紹這個:The Unreasonable Effectiveness of Recurrent Neural Networks

Chinese Poetry Generation with Recurrent Neural Networks

RNNPG 模型 [5],首先由用戶給定的關(guān)鍵詞生成第一句,然后由第一句話生成第二句話,由一,二句話生成第三句話,重復(fù)這個過程,直到詩歌生成完成。模型的模型由三部分組成:

  • Convolutional Sentence Model(CSM):CNN 模型,用于獲取一句話的向量表示。

  • Recurrent Context Model (RCM):句子級別的 RNN,根據(jù)歷史生成句子的向量,輸出下一個要生成句子的 Context 向量。

  • Recurrent Generation Model (RGM):字符級別 RNN,根據(jù) RCM 輸出的 Context 向量和該句之前已經(jīng)生成的字符,輸出下一個字符的概率分布。解碼的時候根據(jù) RGM 模型輸出的概率和語言模型概率加權(quán)以后,生成下一句詩歌,由人工規(guī)則保證押韻。

模型結(jié)構(gòu)如下圖:

當(dāng) AI 邂逅藝術(shù):機(jī)器寫詩綜述

模型生成例子如下圖:

當(dāng) AI 邂逅藝術(shù):機(jī)器寫詩綜述

Chinese Song Iambics Generation with Neural Attention-based Model

模型 [6] 是基于 attention 的 encoder-decoder 框架,將歷史已經(jīng)生成的內(nèi)容作為源語言,將下一句話作為目標(biāo)語言進(jìn)行翻譯。需要用戶提供第一句話,然后由第一句生成第二句,第一,二句生成第三句,并不斷重復(fù)這個過程,直到生成完整詩歌。
基于 Attention 機(jī)制配合 LSTM,可以學(xué)習(xí)更長的詩歌,同時在一定程度上,可以保證前后語義的連貫性。

模型結(jié)構(gòu)如下圖:

當(dāng) AI 邂逅藝術(shù):機(jī)器寫詩綜述

模型生成例子如下圖:

當(dāng) AI 邂逅藝術(shù):機(jī)器寫詩綜述

Chinese Poetry Generation with Planning based Neural Network

模型 [8] 不需要專家知識,是一個端到端的模型。它試圖模仿人類開始寫作前,先規(guī)劃一個寫作大綱的過程。整個詩歌生成框架由兩部分組成:規(guī)劃模型和生成模型。

規(guī)劃模型:將代表用戶寫作意圖的 Query 作為輸入,生成一個寫作大綱。寫作大綱是一個由主題詞組成的序列,第 i 個主題詞代表第 i 句的主題。

生成模型:基于 encoder-decoder 框架。有兩個 encoder, 其中一個 encoder 將主題詞作為輸入,另外一個 encoder 將歷史生成的句子拼在一起作為輸入,由 decoder 生成下一句話。decoder 生成的時候,利用 Attention 機(jī)制,對主題詞和歷史生成內(nèi)容的向量一起做打分,由模型來決定生成的過程中各部分的重要性。

前面介紹的幾個模型,用戶的寫作意圖,基本只能反映在第一句,隨著生成過程往后進(jìn)行,后面句子和用戶寫作意圖的關(guān)系越來越弱,就有可能發(fā)生主題漂移問題。而規(guī)劃模型可以使用戶的寫作意圖直接影響整首詩的生成,因此在一定程度上,避免了主題漂移問題,使整首詩的邏輯語義更為連貫。

總體框架圖如下:

當(dāng) AI 邂逅藝術(shù):機(jī)器寫詩綜述

生成模型框架圖如下:

當(dāng) AI 邂逅藝術(shù):機(jī)器寫詩綜述

詩歌圖靈測試:給定一個題目,讓機(jī)器和人分別做一首詩 ,由人來區(qū)分哪首詩是人寫的。實(shí)驗(yàn)結(jié)果也很有意思,對普通人來說,已經(jīng)無法區(qū)分詩是由機(jī)器生成的還是人生成的,下面是一組測試的例子:

當(dāng) AI 邂逅藝術(shù):機(jī)器寫詩綜述

現(xiàn)代概念詩歌生成例子:

當(dāng) AI 邂逅藝術(shù):機(jī)器寫詩綜述

i, Poet: Automatic Poetry Composition through Recurrent Neural Networks with Iterative Polishing Schema

模型 [7] 基于 encoder-decoder 框架。encoder 階段,用戶提供一個 Query 作為自己的寫作意圖, 由 CNN 模型獲取 Query 的向量表示。decoder 階段,使用了 hierarchical 的 RNN 生成框架,由句子級別和詞級別兩個 RNN 組成。

句子級別 RNN:輸入句子向量表示,輸出下一個句子的 Context 向量。

字符級別 RNN:輸入 Context 向量和歷史生成字符,輸出下一個字符的概率分布。當(dāng)一句生成結(jié)束的時候,字符級別 RNN 的最后一個向量,作為表示這個句子的向量,送給句子級別 RNN。

這篇文章一個比較有意思的地方,是想模擬人類寫詩反復(fù)修改的過程,加入了打磨機(jī)制。反復(fù)迭代來提高詩歌生成質(zhì)量。

總體框架圖如下:

當(dāng) AI 邂逅藝術(shù):機(jī)器寫詩綜述

Generating Topical Poetry

模型 [9] 基于 encoder-decoder 框架,分為兩步。先根據(jù)用戶輸入的關(guān)鍵詞得到每句話的最后一個詞,這些詞都押韻且與用戶輸入相關(guān)。再將這些押韻詞作為一個序列,送給 encoder, 由 decoder 生成整個詩歌。這種機(jī)制一方面保證了押韻,另外一方面,和之前提到的規(guī)劃模型類似,在一定程度上避免了主題漂移問題。

模型框架圖如下:

當(dāng) AI 邂逅藝術(shù):機(jī)器寫詩綜述

生成例子如下:

當(dāng) AI 邂逅藝術(shù):機(jī)器寫詩綜述

SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient

模型 [10] 將圖像中的對抗生成網(wǎng)絡(luò),用到文本生成上。生成網(wǎng)絡(luò)是一個 RNN,直接生成整首詩歌。而判別網(wǎng)絡(luò)是一個 CNN。用于判斷這首詩歌是人寫的,還是機(jī)器生成的,并通過強(qiáng)化學(xué)習(xí)的方式,將梯度回傳給生成網(wǎng)絡(luò)。
模型框架圖如下:

當(dāng) AI 邂逅藝術(shù):機(jī)器寫詩綜述

總結(jié)

從傳統(tǒng)方法到深度學(xué)習(xí),詩歌生成技術(shù)有了很大發(fā)展,甚至在一定程度上,已經(jīng)可以產(chǎn)生普通人真假難辨的詩歌。但是目前詩歌生成技術(shù),學(xué)習(xí)到的仍然只是知識的概率分布,即詩句內(nèi),詩句間的搭配規(guī)律。而沒有學(xué)到詩歌蘊(yùn)含思想感情。因此盡管生成的詩歌看起來有模有樣,但是仍然感覺只是徒有其表,缺乏一絲人的靈性。
另外一方面,詩歌不像機(jī)器翻譯有 BLEU 作為評價指標(biāo),目前仍然依賴人工的主觀評價,缺乏可靠的自動評估方法,因此模型優(yōu)化的目標(biāo)函數(shù)和主觀的詩歌評價指標(biāo)之間,存在較大的 gap,也影響了詩歌生成質(zhì)量的提高。在圍棋博弈上,以 AlphaGo 為代表的機(jī)器已經(jīng)超過了人類頂尖選手,但是在詩歌生成上,離人類頂尖詩人水平,尚有很長的路要走。

參考文獻(xiàn)

[1] 一種宋詞自動生成的遺傳算法及其機(jī)器實(shí)現(xiàn)
[2] i,Poet: Automatic Chinese Poetry Composition through a Generative Summarization Framework under Constrained Optimization
[3] Generating Chinese Classical Poems with Statistical Machine Translation Models
[4] Recurrent neural network based language model
[5] Chinese Poetry Generation with Recurrent Neural Networks
[6] Chinese Song Iambics Generation with Neural Attention-based Model
[7] i, Poet: Automatic Poetry Composition through Recurrent Neural Networks with Iterative Polishing Schema
[8] Chinese Poetry Generation with Planning based Neural Network
[9] Generating Topical Poetry
[10] SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient

雷鋒網(wǎng)按:本文原作者蕭瑟,原載于作者的知乎專欄


深度學(xué)習(xí)之神經(jīng)網(wǎng)絡(luò)特訓(xùn)班

20年清華大學(xué)神經(jīng)網(wǎng)絡(luò)授課導(dǎo)師鄧志東教授,帶你系統(tǒng)學(xué)習(xí)人工智能之神經(jīng)網(wǎng)絡(luò)理論及應(yīng)用!

課程鏈接:http://www.mooc.ai/course/65

加入AI慕課學(xué)院人工智能學(xué)習(xí)交流QQ群:624413030,與AI同行一起交流成長


雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

當(dāng) AI 邂逅藝術(shù):機(jī)器寫詩綜述

分享:
相關(guān)文章

編輯

聚焦數(shù)據(jù)科學(xué),連接 AI 開發(fā)者。更多精彩內(nèi)容,請訪問:yanxishe.com
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說