基于深度学习和指代消解的中文人名识别

来源 :数据与计算发展前沿 | 被引量 : 0次 | 上传用户:hzzaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]命名实体识别是自然语言处理领域的一项基本任务,实体包括人名、地名和组织名等,与其他实体相比,人名与职务、职务变更及人称代词有关.人名的实体识别中,人名语料的残缺及人称指代不明等问题,成为处理中的难点、痛点.基于此观察,本文提出一种融合指代消解的序列标注方法来改进人名识别,这可以有效缓解人名识别中人名语料不完善的问题,并且可以解决人称代词指代不明、人力耗费量大等问题.[方法]具体地,首先利用职务变更进行数据增强,可以有效解决实际应用中标注数据不足的问题.接着为了更好地学习上下文特征,本文使用语言预训练模型B E RT和双向长短时记忆网络结合的方式,并利用条件随机场建模来标签序列的关系.最后,针对文本中的人称代词,加入指代消解算法,进一步改进人名识别.[结果]在公共数据集和本文提出的数据集上的实验结果均表明本文提出方法的有效性.
其他文献
本刊讯(通讯员李晓光)据外媒综合报道,随着全球地震勘探投资削减,以油气勘探技术服务业务为主的物探技术服务公司CGG、TGS和PGS纷纷开展了CCS/CCUS监测业务,希望利用其在地球科学数据资源方面的优势,助力油气运营商实现碳减排目标,争取2050年,油气行业实现净零排放.
[目的]在自然语言处理领域,文本分类是十分重要的基础研究,可以应用于许多下游任务中,例如文章检索、推荐系统、问答系统等.受到知识图谱在文本推理领域发挥作用的启发,本文探索了将知识图谱应用于文本分类任务的方法,在降低对标注训练数据依赖的同时利用知识图谱的推理能力提升文本分类的效果.[方法]本文提出了基于知识图谱的图匹配文本分类算法.具体而言,依据分类目标,为每一个类别构建了该类别的知识图谱,模型基于类别知识图谱中的语义和连接信息对文本与各个类别的相关性进行推理,综合各个知识图谱的推理评估结果.[结论]为了证
[目的]在深度学习框架中,为了实现大规模深度学习计算,异构的OpenCL计算模型通过充分利用不同厂商生产的不同类型硬件设备和计算资源成为提升学习效率的重要途径.因此将深度学习框架例如MXNet等迁移至OpenCL计算模型上以提高其对大规模深度学习的适配性.在对MXNet深度学习框架的迁移过程中,深度学习计算中较为普遍的多维线性数据处理相关操作的迁移则是本文需要讨论的主要问题.[方法]通过系统地比较CUDA计算模型和OpenCL计算模型的运行机制,将已兼容CUDA计算模型的MXNet深度学习框架中对多维线性
采用熵值法、耦合协调度模型与ArcGIS分析2009—2018年浙江城市生态文明子系统耦合协调性及其空间演变.结果表明:浙江城市生态环境得到较好保护,生态经济与社会有序提升,生态文化成为制约因素;整体子系统耦合协调性实现低级向中级转变;浙江城市生态文明子系统得分与耦合协调性均呈现两点突出、环杭州湾与沿海尚可、浙西南内陆偏低的特征.最后,提出拥抱长三角大湾区、扩大核心城市辐射、补齐生态文化短板及因地制宜开展生态文明的建议.
[目的]整合多种教学资源,并在此场景下设计和实现一种高效准确的搜索策略,帮助用户获取丰富的教学内容.[应用背景]教学资源类型众多,数量庞大,用户对于准确检索的需求日益增长,仅基于ElasticSearch进行搜索的效果不尽人意.[方法]在对用户输入的Query进行预处理和分词后,通过ER-BERT语义相似度模型在Query库中匹配出n条近似结果,将其输入到ElasticSearch并构建相关度计算公式,最后按照综合评估的最终得分将匹配结果进行排序.[结果]利用知识图谱技术整合复杂的教学资源,并在此基础上实
本刊讯(通讯员梁玲?王璐)综合外媒报道,2021年卡塔尔、澳大利亚和美国合计液化天然气(LNG)出口量达到2.41×108 t,占全球出口总量的63.0%.根据全球贸易数据跟踪系统(Global Trade Tracker)数据测算,2021年卡塔尔依然是全球最大的LNG出口国,出口量8341×104 t,同比增长10.0%;第2位澳大利亚LNG出口量8142×104 t,同比增长4.3%;第3位美国LNG出口量7572×104 t,同比增长51.8%.澳大利亚LNG出口量逐年稳步增长,可能已达到出口峰值
4月1日上午,学校党委书记朱立杰、党委副书记高俊山率校工会、党委组织部一行6人慰问我校封控驻校一线教职工.rn朱立杰与封控驻校的教职工们亲切交谈.她代表学校党委对封控驻校一线教职工表示亲切问候,对大家的辛勤工作给予了充分肯定.她表示,在驻校同志和校外教职员工的共同努力下,学校疫情防控、线上教学、日常管理等各项工作高效、有序推进.她指出,当前疫情防控形势依旧严峻,全校上下要进一步提高政治站位,不能有丝毫松懈,要慎终如始、一如既往地履职尽责、担当作为,全力以赴夺取疫情防控工作的最后胜利.
[目的]近些年来国内外量子计算技术及其应用研究发展迅速,尤其是在量子计算机软硬件系统研发及优越性试验方面取得了积极进展,本文旨在充分展现量子计算技术在材料、化学、生物医药等领域的应用及未来发展前景.[方法]重点围绕变分量子本征求解(VQE)量子算法及量子化学模拟近似计算,对近些年国内外量子计算研究团队在化学、生物及材料等领域的研究进展以及量子化学近似计算在材料化学等众多领域取得的研究成果进行综合分析.[结果]可以看出当前国内外量子计算研究团队在化学反应预测、药物分子筛选及新材料研发等创新领域的探索研究不断
在火驱过程中,原油燃烧产生大量尾气,在埋存尾气的同时开展尾气回注来提高原油采收率.利用数值模拟技术,在建立精细地质模型的基础上,优化注采参数,进行火驱尾气回注砾岩油藏的研究.结果表明,回注火驱尾气可有效提高油藏开发效果,提高采收率4.42%,超过95%的尾气被埋存在地下;而注气后继续水驱仍可提高采收率3.39%,88%的尾气被埋存,火驱尾气得到最大程度埋存.在提高油藏采收率的同时,解决了火驱尾气排放问题,实现资源的合理利用,具有良好的经济效益和社会效益.
3月8日下午,学校在综合办公楼411会议室召开“十四五”规划征求意见布置会.学校党委常委、副校长耿世刚出席会议.各机构负责人参加会议.会议由发展规划处处长冯雨峰主持.rn冯雨峰就《河北环境工程学院“十四五”发展规划(征求意见稿)》的起草工作进行说明.耿世刚对征求意见工作作出安排部署.他指出,“十四五”规划对我校发展具有深远的意义,“十四五”期间所要完成的三大任务对我校“三步走”发展战略的顺利推进具有决定性影响,本科教学工作合格评估是我校升本之后的第一次大考.