基于深度学习的命名实体识别技术研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:bafjeght
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面对日益剧增的互联网数据,人们需要一种有效的方式来帮助从海量的无序数据中抽取、整理出有用的信息与知识。随着这种需求的递增和科研工作者不断努力探索,知识库在学术界和工业界逐渐被使用和进一步研究。知识库系统是一种框架,将信息以结构化的形式存储和关联,使之能够更好地服务于类似搜索、问答和推荐等应用。本文应用深度学习来进行命名实体识别,开展的工作如下:  (1)根据特征在语义表达上的深浅关系,使用了传统命名实体识别常用的浅层特征、主题分布向量特征和深层特征来产生新的特征表示。这三种特征从语义上由浅及深,可更好地覆盖文本的语义空间。  (2)提出了基于条件随机场和递归神经网络为一体的实体识别模型,使用条件随机场从文本中抽取命名实体,同时得到实体的相关特征。接着结合之前的主题分布特征和词向量特征作为输入,利用递归伸进网络学习得到实体的向量特征,最后使用softmax回归对实体类型进行识别。  (3)将本文算法与其他方法在OntoNote5.0数据集上进行了的实验对比。通过对实验结果对比,呈现了本文所设计算法的有效性及合理性,并做了相关的分析。另外,还将本文提出的命名实体识别方法应用到TAC-KBP2015竞赛和工程项目中。
其他文献
随着互联网和移动互联网的高速发展,电子商务日趋火热。电子商务激烈地市场竞争带来了网上店铺装修,快速货品上新的巨大需求。传统电子商务中,店铺装修,货品上新需要大量美工的参
随着移动互联网和手机智能系统的发展,基于移动智能系统的企业移动化办公的需求日益突出。针对企业移动化办公的特点和需求进行了解和分析,本文提出了基于IOS平台的企业信息移
互联网与移动通信网络的技术融合推动了传统通信增值业务的变革。一方面,随着融合通信网络的发展,数据传输逐步高速宽带化的同时网络侧也具备了更为强大的媒体处理能力,提供
随着能源危机,环境污染等问题的逐渐加重,人们开始寻找新的生活方式,新生活方式必须具有绿色环保、节能减排等特点,物联网技术正是在这样的背景下诞生的。我们以物联网技术为基础
近些年来,手机用户数量飞速增加,全球过半的人都在使用着移动通信服务。在移动用户中,越来越多的用户开始通过移动网络进行网上冲浪,移动互联网的发展大潮已经到来。全球的社区网
随着云计算技术的不断进步,为了满足快速变化的业务需求,越来越多的企业信息化系统使用云计算平台作为其实现基础。授权是企业信息化系统安全管理中不可或缺的重要环节。本文重
稀疏模型是一种重要的方法模型,在机器学习和计算机视觉等领域有着广泛的应用。信号在稀疏模型中被表达为一组基(被称为“字典”)的少量元素(被称为“原子”)的线性组合,其中,字典对
随着互联网的兴起,网络广告成为各大门户网站、搜索引擎、社交网络的主要赢利方式。网络广告就是在网站上使用广告横幅、文本链接、多媒体的方式,在网络上刊登或发布广告,通过互
随着NGN网络的迅速发展,Voip技术更是日新月异,它能够适应不断发展的复杂的IP网络和PSTN网络,并使他们达到无缝联接和融合,能为用户提供多彩的语音及媒体业务。然而,随着Inte
随着我国对教育的逐渐重视,越来越多的家长希望让孩子将来有一个良好的人生平台,家教作为课外补习一种最有力的辅导方式,正受到越来越多的关注。目前,网络家教业务正处于高度发展