论文部分内容阅读
专利文献作为技术信息最有效的载体,囊括了全球90%以上的最新技术成果,对于知识产权的保护起着至关重要的作用。随着目前专利数量的不断增长以及专利侵权诉讼的日益频繁,专利侵权检索已成为情报科学领域的研究热点之一。传统的专利侵权检索主要是通过构建检索式从专利检索系统中检索相关专利,然后人工筛选出具有侵权风险的专利,不仅耗时耗力还容易受主观因素的影响。因此,研究具有自动检索疑似侵权专利的智能检索算法具有重要的现实意义。本文在介绍了专利侵权检索所涉及的侵权判定、文本预处理、相似度计算等基础上,重点研究了专利侵权检索系统的核心,即疑似侵权专利检测算法。论文就当前专利侵权检索研究中存在的特征选择不合理、权利要求书信息利用不充分等问题提出相应的解决方案。本文的主要工作如下:(1)针对中文专利侵权检索过程中关键词特征表达能力弱等问题,提出了一种基于三元组特征覆盖度计算的侵权专利检测方法。该方法将专利权利要求抽取为三元组特征的集合,并结合词向量技术和HowNet计算三元组特征间的语义相似度。通过对专利技术特征集合覆盖度算法的改进,有效提高了对疑似侵权专利的识别能力。实验结果表明,该方法取得较好的检索效果和准确率。(2)针对依存句法分析器稳定性差而影响三元组特征抽取以及方法类专利检索准确率低等问题,提出了一种基于句子相似度计算的侵权专利检测算法。该算法以句子作为最小计算单元,对权利要求书进行树状结构化构建,并结合侵权判定规则设计了一种树匹配算法,对树状权利要求书进行侵权程度的计算。通过与现有的侵权检索算法进行实验对比表明,该算法具有一定的优势。(3)在Java平台下,采用面向对象的思想,设计并实现了具有数据库更新、预处理、初步检索、侵权检测等功能的中文疑似侵权专利智能检索系统。其中侵权检测模块实现了本文所提出的两种检测方法,其余模块也对传统的方法进行了改进。