论文部分内容阅读
近年来,互联网的快速发展带起了网络文学创作的热潮,造成文学作品信息爆炸性增长,文学作品传播更为迅速。与此同时,也带来了一系列版权纠纷问题,传统版权管理机制流程繁琐、效率低,且维权证据不足,在版权纠纷中,难以为创作者提供有效的维权证据。为了及时应对版权纠纷和减少创作者利益损失,迫切需要建立完善的文学作品版权保护系统,实现对版权的有效保护,为创作者提供充足的维权证据,维护创作者版权利益。区块链(Blockchain)技术不仅能够防止版权信息被篡改,而且可以对版权信息溯源查询,有效解决了版权纠纷过程中维权证据不足的问题,因此区块链技术逐渐应用于文学作品版权保护系统研究。目前已有一些基于区块链的版权保护系统研究,但在版权信息存储过程中,多利用区块链存储作品的数字指纹等摘要信息,数字指纹验证所需的内容等信息并不上链存储,这造成数字指纹验证数据的准确性难以保证,仅靠链上数据无法提供充足的维权证据;并且由于区块链是单向连接的链式结构,在区块链溯源过程中,只能依靠区块哈希值对区块逐个溯源,溯源效率低;在数字指纹提取之前缺少对作品内容的相似度审核机制,这使得作品的原创性难以保证。因此,本文利用双链技术对数字指纹验证数据完整存储;采用溯源Hash技术对数字指纹记录进行跨区块溯源,提高区块链溯源效率;同时,将改进的Simhash算法用在作品的相似度审核中,完善版权审核机制。本文所做的工作如下。(1)通过分析基于双链的区块链版权保护系统的具体需求,设计了基于双链的区块链版权保护系统的总体架构,实现了基于双链的区块链版权保护系统。(2)针对数字指纹验证数据存储不全的问题,在版权认证存储模块中,提出了基于双链的版权数据存储方法。该方法采用版权记录链和作品内容链相结合的方式完整存储数字指纹验证数据,前者存储版权认证、交易等记录,后者存储作品内容记录,通过对不同容量的作品进行上链时间测试,证明了该方法在保证数字指纹验证数据完整存储的同时,也保证了版权认证的高效性。(3)针对依靠区块哈希值进行版权溯源效率低的问题,在版权记录溯源验证模块中,提出了跨区块溯源的方法。该方法利用智能合约技术建立了抗干扰、自动化的交易机制,为交易记录添加溯源Hash,为每个作品建立逻辑存储链,实现了版权记录的跨区块溯源,通过具体实例分析证明,该方法避免了对无关区块的溯源,简化了溯源流程,提高了溯源效率。(4)针对版权审核机制不完善的问题,在版权审核模块中,提出了基于改进Simhash算法的版权审核方法。该方法结合TF-IDF技术和余弦相似度算法对Simhash算法进行改进,采用改进的Simhash算法对作品内容进行相似度审核,并对改进后的算法进行了性能测试,测试结果表明改进后的算法在准确率和召回率上有明显提升,完善了版权审核机制,有效地过滤了侵权作品。