基于Doc2Vec的专利文件相似度检测方法的对比研究

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:fulingshu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]专利相似度检测(Similarity Measurement)可从宏观上辅助制定国家创新战略规划,发现国内外的热点及应对其他国家的专利流氓,从微观上为专利发明人、专利审查员、专利权人提供辅助支撑。[方法/过程]提出基于深度学习的Doc2Vec专利相似度分析方法,基于未进行清洗的专利语料库,采用深度学习的Doc2Vec模型,随机挑选了专利,研究了专利相似度检测问题,并和传统的相似度检测模型进行对比研究。[结果/结论]实验结果表明,基于深度学习的Doc2Vec模型和TF-IDF模型对于处理不做数据清洗的专利语料的结果有相近性,该方法对分析人员的专利领域知识要求较低,不需要对专利数据进行基于专利领域知识的数据清洗,同时可为专利侵权、专利查新提供新的智能工具支撑,降低研究门槛和工作量,提升研究效率。
其他文献
介绍了通过确定南湃水电站混凝土面板堆石坝的填筑设计标准、填筑参数及控制、坝体填筑的质量控制、试验检测等工序达到了对坝体填筑实体质量进行控制的过程,大坝填筑质量良
绿色发展是生态文明建设的核心价值观念,也是当今世界经济的发展趋势。数据显示,在今后5年内,绿色产业投资每年需求2万亿元以上,需要撬动大量的社会资本。在此背景下,绿色投
2017年,四川省城市空气质量创近年来最好水平,在气候条件与往年相仿的情形下实现了“两降一升”:全省PM10平均浓度为67.7微克/米3,同比下降7.5%:未达标城市PM2.5平均浓度为48.1微克/米3,
全书分为:第一篇重要技术进展概论,第二篇持久性有机污染物,第三篇食品中致癌物,第四篇食品中有机金属化合物的检测技术,第五篇其他重要有机污染物(共二十三章)。该书全面总结了
随着社会的快速发展和经济水平的不断提高,在信息化较为发达的今天,普通理工科院校大学生思想政治教育存在着明显的不足和弊端。结合本校实际情况以及多年工作经验,描述了当
随着营改增的全面铺开,传统服务行业的部分营业税账务处理需相应转变为增值税账务处理,但是由于相关政策法规的滞后性,导致实务中出现了分歧。以企业经营租赁为例,出租方预收
利用红外热像仪对60例健康女性进行乳腺红外热扫描,获得乳腺体表的温度分布.结果表明:健康女性左右乳腺的体表温度基本呈对称分布,且具有高度的正相关,相关系数大于0.9.左乳
目的测量中国汉族人群股骨内外髁相关参数,并通过回归分析探究其与下肢长度的关系,为国人膝关节假体的设计以及膝关节手术提供参数依据。方法采集多中心标本。2012年10月至20
目的观察氯化钴(Cobalt chloride,CoCl2)模拟低氧对体外培养的人牙周膜成纤维细胞(periodontal ligament cells,PDLCs)增殖与成骨分化的影响。方法体外培养鉴定人牙周膜成纤维细
<正>双胎妊娠孕晚期并发症多,新生儿窒息、病死率高,积极预防双胎妊娠孕晚期并发症, 选择有利的分娩时机及方式,对提高双胎围产期存活率有重要意义。现就1992年1月至2005 年9
会议