技术结构及其在技术成熟度中的应用研究

来源 :中国科学技术信息研究所 | 被引量 : 0次 | 上传用户:yhmlivefor48
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文章通过对现有技术成熟度评估相关研究的国内外现状进行考察,对技术结构、技术术语和技术关系抽取以及技术成熟度三方面进行归纳总结,并以此为背景阐述了研究技术结构的意义,认为现有宏观的结构无法很好地解释技术的成熟度,需要从微观层面解读某项技术的要素及要素间的关系,由此解释技术的结构。因此,文章从技术术语和技术术语关系的角度来阐述技术结构,探讨了利用技术结构分析技术成熟度的可行性。  首先,主要介绍了本文研究内容所要涉及的相关技术。包括命名实体识别、技术术语抽取、技术关系抽取,并对数据进行了预处理工作,为本文的技术路线做了一个梳理,为后续研究进行了数据的清洗和准备。  其次,开发了化合物和生物实体识别系统,并用已标注好的化合物相关专利文档进行了实验。本文将命名实体识别问题视作序列标注问题进行处理,采用条件随机场的方法,选取了十个特征进行化合物实体和生物实体的命名实体识别。另外,结合布朗聚类作为条件随机场模型训练的一个特征,提升了命名实体识别的实验效果。同时,针对数据集的类别数量不平衡情况进行了过采样和欠采样处理,极大提升了实体类别的识别效果。此外,系统还利用了一些开源的自然语言处理工具包,为了使之符合专利语料的要求,系统在代码上做了一些修改,增加相应的规则。同时运用十折交叉验证的方法进行训练、测试和评价,得到69.0%的F1值,并对实验结果中出现的FP结果进行了错误说明。  第三,阐述了关系抽取的相关内容,并在相应的实验语料上做了说明。在实验中,本文使用了布朗聚类的结果作为上下位关系,另外采用了MiniBatchKMeans方法,对一些网络扩展数据进行了多层聚类,提升了聚类的效果和可解释性。另外,构造了用于关系抽取的核函数,由SSTK核与向量核组合而成,进行关系抽取。  最后,试探性地用基于技术术语和术语关系的技术结构来对训练语料的结果进行了技术成熟度的解释,作为是为技术成熟度的研究进的扩展,为技术提供了一个基于技术结构的细节层面的解释。
其他文献
  本文对学科导航库的定义、特征,学科导航库与其它相关概念的异同进行了分析;在第二章,对国内外学科导航库的研究现状进行了综述;在第三章,对我国高校图书馆建设学科导航库的必
近十年前,冯惠玲教授以其博士论文《拥有新记忆——电子文件管理研究》拉开了中国档案学界对电子文件研究的序幕。该文从认识电子文件、原始性、证据性、无纸收藏、双重鉴定等
知识经济的出现,促使人们的知识观逐渐转变。知识观转型时期,我国高校图书馆如何适应新理念、新情况,为教学和科研服务,是高校图书馆共同面临的创新课题。本文从“思想政治教育、
本文主要以改善网络教学服务为目标,重点分析了网络教育的服务性质,综合运用客户关系管理中客户生命周期的理念,将网络教育的服务对象划分为潜在学习者和学习者。针对潜在学
信息是人类社会生活的基本要素之一,其中科技信息是推动人类社会发展的关键因素。专利文献作为科技信息最有效的载体,涵盖了全球90%以上的最新科技信息,在国家科技战略制定中发挥
  本文主要论述了用户满意战略在图书馆中的应用。首先从图书馆面临的网络环境入手,分析了网络环境下图书馆用户研究的新特点。接着论述了引入用户满意战略的必要性和可行性
知识型企业作为知识经济中的朝阳企业,已成为管理者、学者研究和关注的对象,而知识作为知识型企业的主要和关键资产,对其进行有效地共享和利用就成为当今知识型企业所亟待解决的
新课程《品德与生活》、《品德与社会》已如火如荼地开展了,我们对于新课程的认识也逐渐由最初的迷茫、无措而在实践中逐渐清晰、丰满起来。之所以要对小学品德教学进行新课程
今年举办的第十三届全国美展,也是媒体的一个热点.但其中有的人觉得没有必要劳民伤财去办全国美展.为什么大家看不到全国美展的好处,认为全国美展也出不了好的成果?虽然每次
期刊
始于80年代后期的数字参考咨询服务是在计算机网络的兴起和数字化资源极大丰富的背景下应运而生的。它冲破了传统参考咨询服务的时间和空间限制,运用网络技术实现图书馆员对