基于领域本体的专利地图研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:w7kny6194i
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
专利文献是具有经济价值、技术价值的战略性信息。据世界知识产权组织统计,全世界90%以上的发明创造信息都是首先通过专利文献反映出来的,90%~95%的研发成果包含在专利文献中。专利地图是一种重要的专利分析工具,能够将大量专利文献通过搜寻、筛选、分类、归纳及分析等步骤进行消化,并用直观的图表呈现出来,有助于启发技术人员的思路,激发新的创意,进而发现新的技术领域。   国内外的专利地图研究及相关软件有很多,这些软件在形成专利地图的关键性过程“专利文本相似度度量”上,大都采用基于向量空间模型的文本相似度算法。考虑到专利文献的覆盖面广,低频词、生僻词较多,单纯依靠向量空间模型来进行专利文本相似度计算,达到的效果有限。为此有必要引入领域本体,对专利文献进行语义层面上的分析。本文的主要研究和贡献如下:   (1)在探讨和分析各种本体构建方法的基础上,遵循本体构建的一般原则,归纳出构建领域本体的步骤,并借鉴WordNet已有的结构,利用现有的本体构建工具,构建了生物医药方向的领域本体。   (2)提出了基于领域本体的文本相似度算法,该方法利用改进的Lesk词语消岐算法对专利文本中的大量专业术语进行消歧,选择合适的语义,再利用领域本体中语义的层次关系计算词汇语义相似度。同时以此为基础,使用匈牙利相似矩阵算法计算文本相似度。实验表明,该方法能显著提高文本相似度计算精度。   (3)在上述内容的基础上,本文讨论了专利地图可视化技术,提出了以专利相似度和IPC分类号为横纵坐标的散点结构专利地图;以词汇语义和词频为基础生成了技术效应专利地图,并实现了专利地图的可视化。   (4)最后,将本文设计的技术方案应用于基因疫苗领域的专利文献分析,对专利地图的实用性和科学性进行实证研究。  
其他文献
具有无标度特性的复杂网络即为无标度网络,此种网络的度分布满足幂律分布,即概率上具有自相似性。所谓自相似性,是指函数形态在不同放大倍数上的性状相似;所谓标度不变性,指
聚类分析是数据挖掘领域的一个热点课题,目前国内外学者已提出许多算法,这些算法依据其自身不同的特性可适用于不同的应用环境。其中传统基于密度的聚类算法以其良好的可伸缩
在计算机视觉领域,智能的对视频中群体异常行为进行检测成为广泛关注的热点问题。这一方向在智能交通、安防监控、人机交互等方面有着理论与应用双重价值。本文研究的是基于时
基于地球不是平的,且不是静止的这一普遍认知,GIS正从二维向三维,静态向动态发展,所以动态三维GIS必然是GIS的重要发展方向。目前三维GIS只对地球的静态进行表达,缺乏对动态
大学生综合素质发展评价是高校学生管理的重要内容之一,传统的描述性的定性评价方法已经不能适应现代教育管理的需要。本文以浙江工商职业技术学院工学院的省级示范院校课题
一般来说,填方高度大于6m的渠道称之为高填方渠道。高填方渠道广泛分布于南水北调中线工程中。由于南水北调中线工程跨区域广、填方高度大,工程地质条件复杂,高填方渠段会出
人类社会从工业经济时代进入知识经济时代之后,知识在人们的生活中扮演着越来越重要的角色。知识管理与知识管理系统的重要性越来越被业界所认识,然而目前的知识管理系统只是
自动指纹识别系统(AFIS)通过特殊的转换设备和图像处理技术,对指纹进行采集、分析和比对,可以迅速、准确地鉴别出个人身份。通常AFIS包含三个处理阶段:指纹采集、指纹预处理以
随着互联网的发展,它已经逐步地深刻改变了我们的生活,渗透到了人类社会的各个角落,尤其移动互联网时代使互联网又经历了一次飞跃性的发展。互联网不仅与个人生活相关,更是成
仿人机器人的研究代表了机器人学的尖端水平,是一门发展迅速的综合性的前沿学科,涉及数学、计算机、机械制造、运动学等学科,是人类的最高科技梦想之一。仿人机器人具有人类外形