基于强化学习的命名实体识别算法研究

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:whqqqqqqq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本信息是互联网中海量数据的主要表现形式之一,也是人类目前获取知识的最普遍途径。这类数据往往表现出非结构化和语义多样化等特点,因此对文本进行知识抽取是自然语言处理技术的关键难题。命名实体识别就是信息抽取领域中一个基础任务。现有的命名实体识别模型可以分为基于统计的方法和基于深度学习的方法。前者需要人工抽取特征模板进行模式匹配,后者主要通过深度神经网络进行端到端的文本语义解析,从而实现自动标注。与此同时,深度学习的发展增强了强化学习的表达能力,使其在游戏、控制系统上取得了一定的进展。在这个背景下,本文主要研究了强化学习在命名实体识别任务上的应用,主要工作如下:(1)针对标注全局性的要求,本文设计了面向命名实体识别的马尔科夫决策过程(MDP)。与Maes等人的工作不同在于:本文利用神经网络对MDP状态进行语义建模,改善了传统MDP模型手工抽取特征的不足。在基于策略梯度求解的实验中,本文总结了算法的高方差、低经验利用率等缺陷,进一步提出了本文的核心问题:如何求解MDP模型使其具有找到接近全局最优标注序列的能力?(2)针对(1)中的核心问题,本文提出了新颖的基于策略价值网络的模型,称为MM-NER。MM-NER是第一个将蒙特卡洛树搜索(MCTS)增强型MDP应用于命名实体识别的工作。在训练过程,策略价值网络输出标签概率和标注准确度的评估,从而指导MCTS搜索出更具全局意识的标注序列。在推断过程,使用策略价值网络可以使时间复杂度从维特比算法的复杂度O(T|A|2)降低到O(T|A|)。(3)针对命名实体识别中一词多义的问题,本文利用预训练的Bert语言模型进一步增强MDP状态的动态语义表示。在两个命名实体识别数据集上的实验结果,证明了拥有多步向前探索机制的MM-NER在命名实体识别任务上具有显著优势。
其他文献
个人知识管理这个概念自从被提出以来,一直受到各行各业的人们的重视。目前的研究成果大部分是针对教师或研究生的个人知识管理,学科结构较为单一,研究内容较为陈旧,不足以解
目的 探讨中药复方联合常规治疗对恶性肿瘤化疗期间骨髓抑制及细胞因子的影响。方法 选取80例恶性肿瘤患者为研究对象,按照随机数字表法划分为对照组与观察组。对照组患者采
为探讨寒富苹果树主枝适宜的拉枝角度,以2年生自根砧寒富为试材,研究不同拉枝角度对树体生理特性和果实品质的影响.结果表明:寒富拉枝角度120°时果实单果质量和硬度最高,
“女汉子”是近几年很热的一个汉语流行语,目前尚无统一定义,但一般是指行为和性格偏向男性的女性。大众媒体对女汉子进行了大量报道,且刻画了一种正面形象,现实生活中也有不
近年来,诸如“民族风”、“赌博风”等一类新型表达共同构成的汉语“X风”词族逐渐流行于人们的生活中。但是,前人对其研究甚少,且存在一些研究盲点:或未进行理论上的探讨,或
为有效提高碳酸盐岩沉积相(岩相)模拟的精度,以巴西Jupiter油田为例,在岩心、测井及地震资料综合分析的基础上,通过多条件约束建立该地区碳酸盐岩台地沉积正演模型,以此作为
移动通信网络应用需求变化越来越快,推动技术演进迅速发展。5G技术已经处在标准化进程中,按照ITU-R的进程计划,2020年5G会大规模商用。为了更好地服务物联网和增强移动宽带应
六世赛仓大师是当代著名的佛学家和藏学家。米拉日巴佛阁是安多藏区著名的藏传佛教寺院之一,其建筑的思想风格熔铸了六世赛仓大师藏传佛教诸派和谐共存的思想内涵,是大师宗派和
坚持党在全面推进依法治国中的领导,是由中国共产党肩负率领中华民族投入赶超式的竞争、实现把中国由落后的农耕文明转变为现代商工文明状态的历史任务决定的,也因为中国共产
本文分析了电子信息的证据资格问题,就电子证据独立的证据地位提出了自己的见解。在确认电子证据的证据能力的基础之上,还对法庭在运用电子证据时应审查判断的内容和决定采信