基于联合模型的中文社交媒体命名实体识别

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:itowna
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,对中文社交媒体中命名实体进行识别具有重要的意义,传统的做法是采用监督学习方法,局限于标注数据的稀缺。然而,通用领域中有足够的语料库且社交媒体中的海量未标注的文本可以用于提高命名实体识别的效果。论文提出了一个联合模型,利用通用领域语料库和社交网络领域中未标注的文本进行训练。该联合模型由两个模型组成,一个是跨领域学习模型另外一个是半监督学习模型。跨领域学习基于领域的相似性学习通用领域的信息。半监督学习通过主动学习目标域内未标注的信息。该联合模型提高了命名实体识别的效果,且大大减小了人工标注语料工作。
其他文献
<正> 如果有人问你:从第六届中国国际花卉园艺展览会上看到什么?你回答:花。如果有人问你:从书本上看到什么?你回答:字。 请问:你对这两个问题的回答,能感到满意吗?显然是否
制造业企业是我国经济发展的重要力量,技能人才是制造业企业宝贵的人力资本.但是我国制造业企业面临技能型人才短缺和流失的现状.本文以企业技能人才为研究对象,对民营制造业
<正>从重庆市中心的解放碑驱车50分钟左右,经过繁华的城区,穿过华福路,就能抵达九龙坡区铜罐驿天主堂(铜罐驿镇陡石塔村)。教堂距今已有118年,整个教堂房屋占地面积3647m~2,
为了分析交叉口处左转及右转机动车对行人过街交通的干扰和影响,合理控制交叉口行人过街信号,应用交通流冲突理论、间隙接受理论,推导了行人穿越机动车道的人数及等待通行人
洛克是英国经验主义的奠基者,他在《人类理解论》中详细地论述了感觉经验认识论要优于理性主义的基本思想。本文从洛克认识论的历史和理论背景、洛克认识论的主要内容、反思洛
本文以A企业技术员工为研究对象,通过问卷调查得到196份有效问卷,采用探索性因子分析、回归分析方法,发现员工离职的因素包括薪酬状况、职业成长度、组织关系、安全与保障、
税制改革引起的利润跨期转移是吸引学术界和实务界共同关注的问题。以往研究中,学者们往往通过财务报表数据间接测度利润转移程度,此种做法隐含的假设前提是会计与税收之间的
今年以来,科学普及成为热词,习近平总书记在全国科技创新大会讲话中强调,“科技创新、科学普及是实现创新发展的两翼,要把科学普及放在与科技创新同等重要的位置”。国家发布的《
报纸
石墨烯是一种新型单层碳原子材料,文中介绍了这种材料的特性,探讨了在电子领域中以其作为制造新型晶体管材料来替代CMOS的可行性,给出了制作石墨烯晶体管的方案并进行了仿真
学前教育是一项特殊的事业,所有的幼师都站在每一个儿童的发展起点,扮演着他们的人生导师的角色,因此,作为教师,必须要具备较高的综合专业素质,加强与时代的融合,致力于教育