论文部分内容阅读
在基于文本生成的信息隐藏算法研究中,如何在保证生成文本质量的同时提高隐藏容量是主要存在的挑战.为此本文提出一种基于宋词生成的构造式信息隐藏算法.首先对宋词文本数据进行预训练,然后基于自回归语言模型搭建宋词生成模型;其次根据宋词词牌固有的格式信息设计格律模块,在宋词生成阶段,需要向生成模型输入该格律模块,并通过符号集设计、编码等综合作用,生成宋词诗句.在利用宋词生成模型进行秘密信息隐藏的过程中,对格律模块进行重构,通过平仄韵词牌、词牌格式模板、关键字、韵律及押韵字符的不同选择,有效实现秘密信息的隐藏.信息提取是隐藏的逆过程,且提取过程不需要利用宋词生成模型,仅需根据模板和词典库来进行索引即可,提高了信息提取的效率.实验结果表明,本文提出的算法能够生成格式严格、韵律清晰、句子完整性高的宋词,且生成的宋词文本的信息隐藏容量均值可达21比特/句、安全性高,整体性能优于已报道的主流算法.