论文部分内容阅读
中国传统诗歌是我国古代文化的一项重要的遗产。它有很多不同的类型,例如唐诗和宋词。每种类型的诗歌都必须遵循特定的结构,押韵和平仄。中国传统诗歌的自动生成是自然语言处理领域中一项非常有挑战性的工作。本文提出了一种基于规划的诗歌生成方法:先规划诗歌的主题("说什么"),再生成诗歌的具体内容("怎么说")。具体来说,给定由关键词,句子甚至文档组成的用户写作意图文本,第一步是使用诗歌规划模型来决定每句的子主题,即给每句分配一个主题词。规划模型将用户的写作意图转换成了一个与主题相关的子主题序列。诗歌生成模型则基于每一行分配的子主题和之前已经生成的内容来逐行地进行诗歌生成,它在基于注意力机制的编码器-解码器神经网络模型上做了改进以保证可以同时编码子主题和之前已经生成的内容。本文工作的主要贡献概括如下:·首先,本文尝试模拟人类的创作过程,将人类创作中的规划思想引入到诗歌生成中,提出了一种可以明确规划诗歌主题的诗歌生成方法。同时在基于注意力机制的编码器-解码器神经网络模型的基础上做了改进,使其可以同时支持编码诗歌子主题和历史生成内容并逐行进行诗歌生成。·其次,本文提出了将基于规划的诗歌生成模型应用到特定诗歌生成任务的具体方法。·最后,本文进行了模型评估实验,实验结果表明本文提出的模型不仅超过目前最好的诗歌生成方法,而且生成的诗歌质量在某种程度上可以媲美人类诗人。