基于部分标签数据和经验分布的命名实体识别

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:zhucaiguai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,基于数据驱动的命名实体识别方法在新闻、生物医疗等领域上取得了很大的成功,然而许多领域缺少标签,且人工标注成本高昂。为了降低标注成本,该文尝试使用含有噪声的部分标签数据进行命名实体识别,提出了一种基于部分标签数据和经验分布的方法。首先介绍基于部分标签数据的建模方法,然后引入标签经验分布的假设,通过将经验分布加入模型,有效降低了数据中的噪声。最后分别在植物病虫害数据集和优酷视频数据集上进行测试,结果表明,该方法优于其他方法。
其他文献
一、对美术新课程标准的理解  自实施新课程以来,学校组织教师采取多种方式,认真学习,结合课改以前的教学理念所采用的教学方法,比较对照、深刻领会、更新观念。美术学科具有与其他学科不同的特点,对新课程标准的理解有以下几点:  1.美术课程突出体现基础性、普及性和发展性,使美术教育面向全体学生,不同的学生在美术教育上得到不同的发展。美术内容是现实的、有意义的、富有挑战性的,更加有利于学生主动地进行观察、
中国菜有着自身的历史传承,海外中国人想念它,而外国人对于中国菜的接受程度越来越高。川菜是中国八大菜系之一,对于川菜菜名的翻译,目前有一些较好的研究。考察了英国和美国的十
该文探究手术操作术语归一化方法的构建。首先,分析手术操作术语归一化数据集的特点;其次,调研术语归一化的相关方法;最后,结合调研知悉的技术理论方法和数据集特征,建立手术
弯曲菌属于一种重要的人兽共患病原菌,其和肠道系统感染类疾病密切相关。人类感染这种病原菌轻则引起急性胃肠炎等肠胃疾病,严重时也会导致格林巴利综合征(Guillain-Barre syndr
基于农产品冷链物流业的快速发展,从人才需求的角度思考,对广州地区高校农产品冷链物流课程设置情况进行了调查,并对调查结果进行了总结归纳。“,”Based on the rapid developm
古文句读不仅需要考虑当前文本的语义和语境信息,还需要综合历史文化常识,对专家知识有较高要求。该文提出了一种基于深层语言模型(BERT)的古汉语知识表示方法,并在此基础上
栽培科技在农业生产过程中合理、有效地运用能够起到对农业生产效率和质量进一步提高、对农产品产量进一步提升的积极作用。农业科技人员要针对广大农民使用农业栽培科技给予
天然膳食植物纤维泛指不能被任何直接消化的多种含糖类和高碳水化合物及多种木质素的食物总称, 由一种水溶性天然膳食植物纤维和非天然水溶性两种膳食植物纤维混合组成。SDF
当前影响世界经济复苏的因素有很多,最主要的有六个方面。第一,欧洲部分国家的主权债务危机问题。虽然欧盟联合国际货币基金组织建立了7500亿欧元 At present, there are ma
通过调节粮糟比、增加排酸时间、改变量水加入方式、提高曲药粉碎度,使入窖水分降低了约5 个百分点,控制在52%-54% 范围,并对发酵生产的原酒的理化指标、感官特征和色谱数据进行