基于主题模型和卷积神经网络的命名实体识别研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:martinlt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的快速发展产生了海量数据,海量数据中的信息蕴含巨大价值,其中800%以上是文本数据,人们迫切需要一种方法来处理这些文本数据,命名实体识别技术可以将关键实体从文本中识别出来,具有很高的应用价值,但是目前的命名实体识别方法存在一些不足:(1)输入特征不能很好地表现出输入数据的特性,制约模型效果;(2)得到的标签序列前后顺承关系较弱,影响模型准确率。本文针对这些问题,进行了一系列的研究,本文的研究成果主要包括如下几个方面:1.针对输入特征难以表述输入数据的特性,制约模型效果的问题,设计了一种基于主题模型的命名实体识别方法。首先该方法训练主题模型得到词语-主题概率分布,然后将得到的词语-主题概率作为基于主题模型的特征表示,辅助命名实体模型训练。一方面,可以解决全局性特征缺乏问题;另一方面,由于辅助特征的引入,可以将模型初始化为较好效果,从而减少了前期的训练过程,减少模型训练时间。实验结果表明,改进后的模型能达到较好的效果。2.针对标签序列前后顺承关系较弱,影响模型准确率的问题,在基于主题模型的命名实体识别方法基础之上,引入卷积神经网络,设计了一种基于CNN的命名实体识别方法。该方法利用卷积神经网络局部连接和权值共享的特点,融合了局部信息,使模型学习到的标签序列前后顺承关系更加明显,实验结果表明改进后的模型效果进一步提高。
其他文献
<正>"图式"1在康德(Immanuel Kant)之前,还没有获得特殊的意义,康德把这一词语引入哲学,使它出现在先验哲学的语境中,从而成为一个具有专门意义的哲学概念,并以"五个点"(图1)
目的:研究钙离子通道抑制剂miconazole对破骨细胞对羟基磷灰石涂层的吸收的影响。方法:在羟基磷灰石涂层表面诱导破骨细胞,破骨细胞形成后,分别加入不同浓度的miconazole细胞培养
一个优秀的班集体一定有着良好的班风,而良好的班风的形成与班级精神、纪律制度、舆论风险、道德情感有着密切联系。
<正>项目名称:长沙天心阁简牍文化广场项目地点:湖南长沙结构机电:湖南大学设计研究院有限公司建筑面积:18 632m2广场面积:8 474m2设计时间:2008建成时间:2012简牍博物馆文化
通过对裂缝类病害表征的仔细判别和成因的深度调研,分析裂缝类病害的特点;结合不同处置策略的机械、人工、材料使用费用建立多属性决策系统,对处治策略进行客观评价,并对处治策略
为了明确高速公路隧道断面尺寸变化对工程造价的影响,为工程方案优化提供决策参考,文中针对4种常用建筑限界的高速公路两车道浅埋暗挖隧道,在支护参数保持不变的情况下,考虑