基于数据挖掘技术的专利信息分析及应用研究

被引量 : 13次 | 上传用户:dsmhjs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
专利信息是最新的科技发展水平的集合,具有内容新颖、覆盖面广、实用可靠、信息量大等显著特点,在国家政府机构的决策、技术创新、资源的配置、科技项目的规划、行业的发展方向、企业的经营决策等各方面都拥有巨大的价值及潜在价值。传统的统计分析方法已经不能满足人们开发利用专利信息资源的需求,集成了多种学科技术的数据挖掘成为了专利信息分析法的必然发展趋势。数据挖掘技术是解决数据丰富而知识贫乏的有效途径,是信息科学研究领域的重要研究课题之一,相关的研究和应用能够提高决策支持的能力,在数据库研究中是一个富有应用前景的领域。数据挖掘已经广泛应用于诸多领域以解决许多商业问题,并且取得了良好的社会效应。由于专利信息的特殊性——同时具有外部特征项和内部特征项,既有需要进行定量分析的外部指标,又有需要定性分析的文本内容,所以作为数据挖掘技术重要技术手段的关联分析和文本聚类有着非常广泛的应用前景。关联规则挖掘是从大量的、不准确的、嘈杂的现实数据中挖掘出隐含在其中的、潜在的有价值的相关信息和知识的过程。文从Agrawal等人第一次提出了基于商业数据库的项集之间的关联关系研究问题以来,很多研究人员对挖掘数据中潜在的关联规则问题进行了大量的更加深入的研究。本聚类首先需要对文本进行预处理,通过分词、特征选择或特征抽取等过程将文本转化成计算机可处理的格式化数据如文本向量,然后使用聚类算法进行聚类。层次聚类方法对给定的数据集进行层次似的分解,直到某种条件满足为止。相较于另一种较为常见的聚类算法——以k-means和k-medoids为代表的划分方法而言,层次聚类法不需要预先指定聚类的个数,更有利于在不清楚数据属性的情况下进行文本聚类。在数据挖掘技术的应用方面,本文面向专利信息挖掘应用的实际需求,分析了专利文献的应用及其用途,研究了专利技术、专利文献的自身特点,以及专利文献蕴涵的丰富的技术信息、法律信息和商业信息,寻找将数据挖掘技术应用到专利文献中的途径。并以混合动力电动汽车领域在中国境内专利申请情况为主要背景,在行业研究的基础上,利用数据挖掘技术中的关联规则挖掘和文本聚类分析相结合的方法对丰田自动车株式会社在华申请的所有专利进行了深入分析,将数据挖掘的方法和知识理论应用到实际系统中,实现了专利文本信息与技术主题指标相结合,并为今后的专利信息挖掘工作提出了几点建议。
其他文献
永定招宝生态农庄是生态农业、循环农业与休闲观光旅游相结合的一个典型代表。本文通过访谈法和问卷调查法对永定招宝生态农庄进行深入的调查,并对农庄的发展进行了SWOT分析,
目的:通过实验,验证四逆散及其不同配伍干预实验性溃疡性结肠炎(ulcerative colitis,UC)的效用,探讨四逆散不同配伍干预实验性UC的机制。材料与方法:1四逆散不同配伍干预实验
无碴轨道板垫层使用的乳化沥青水泥砂浆(简称CA砂浆)是高速铁路建设施工的关键材料之一,其性能要求非常高,必须对其生产工艺进行详细试验和研究。本课题在总结国内外相关试验
船舶自动识别系统(AIS)以自组织时分多址技术(SOTDMA)为核心技术,是一个集现代通信技术、计算机网络技术等于一身的新型助航和信息应用系统,我国从2003年开始AIS系统的建设,
数字式频谱分析仪是一种实现电信号频谱测量的电子测量仪器。频谱分析仪不但可以用于信号失真度、调制度、谱纯度、频率稳定度和交调失真等信号参数的测量,而且可用以测量放
分析了铝渣回收的现状,介绍了引进的The Press法铝渣处理技术及其工作原理,阐述了改进后研制的热铝炉渣压渣机的结构、工艺和技术特点,并作了经济效益分析。
目的探讨综合护理对泌尿外科术后疼痛的临床效果。方法将泌尿外科收治的216例手术患者分为两组,对照组108例,为2013年2~8月就诊的患者,实施普通护理,观察组108例,为2013年9月
太阳射电爆发是一种常见的天文现象,是由太阳部分区域发生剧烈活动时引发的一种电磁波的变化,通常与太阳内部电子抛射有关。剧烈的太阳射电爆发对地球有着严重的影响,包括改
在变幻莫测的市场中,当事人的交易行为充满了各种不可预料的风险。交付作为实现交易的最终步骤,在实践中往往是发生争议的焦点。因此,研究合同法中的交付,有着重要意义。交付
光镜下观察了大亚湾地区红树林及海岸 2 0种植物叶片气孔的结构特征及部分植物气孔器的发育过程 .结果表明 :大部分植物仅下表皮具气孔 ;气孔类型有无规则、平列、环绕、横列