特征选择在人名识别中的应用

来源 :电脑开发与应用 | 被引量 : 0次 | 上传用户:mawenxing8155
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
命名实体识别是文本信息处理中的一个研究热点,人名是命名实体的重要组成部分。本文主要讨论中文文本中人名识别的问题。所要识别的人名包括汉语人名、类汉语人名(如韩国人名、越南人名等)以及人名译名。在本文中,我们将其统一称为汉语人名。 由于最大熵模型具有简洁、通用和易于移植的特点,使用该模型在英文中进行命名实体识别已取得一定成效。本文结合中文文本中人名的特点,将对使用最大熵模型进行人名识别进行介绍,重点介绍特征选择方法。1 系统描述1.1 最大熵模型 对于给定的训练样本,最大熵模型应该选择一个与训练样本
其他文献
近几年来,金融部门内部各类违法犯罪的经济案件屡发不断,并且作案人数越来越多,层次越来越高,手段越来越新,金额越来越大。它不仅给国家和人民造成极大的损失,而且也严重地损
第一章总则第一条为保证安全保卫工作各项规章制度的落实,做到有章必循,违章必究,有效防止刑事案件、涉枪案件和治安灾害事故发生,保护国家资金和职工人身安全,根据《中国农
目的探讨支撑喉镜联合视频膀胱镜治疗声带息肉的临床疗效。方法对218例声带息肉患者实施支撑喉镜联合视频膀胱镜手术,术后1、3、6个月复查,总结手术效果。结果218例手术患者中,
目的探讨厄贝沙坦氢氯噻嗪联合美托洛尔治疗老年重症心力衰竭中的效果。方法选择某院2015年1月至2017年6月收治的重症心力衰竭患者100例,按照随机数字表法分为观察组和对照组
分析了自行炮驾驶模拟器的特点和组成,重点设计了视景仿真软件.根据多年的仿真经验,搭配出较为高效的仿真软件开发平台.该仿真软件具有通用性,可用于其他地面运动车辆的驾驶
目的 探讨子宫动脉栓塞(TUAE)在剖宫产瘢痕妊娠(CSP)和宫颈妊娠(CP)中的应用效果。方法 选择某院2013-01—2016-12收治的CSP和CP患者共60例,随机分为观察组和对照组,各30例。对照组
随着我国外资金融机构不断增加,外资金融机构的监管也日益成为为国人所关心的热门话题。冷静分析国际银行监管动态及发展趋势,认真研究我国对外资银行监管的基本思路、具体对
一、制定诉讼方案由于诉讼过程是由若干个阶段组成的,包括起诉和受理、审理前准备、开庭审理、执行等,各个阶段都有不同的任务,因此,金融机构在提起诉讼前,要为自己在各个阶
新春伊始,在3月份召开的九届人大一次会议上,李鹏总理提出要"使居民住房建设成为新的经济增长点"。中国人民银行行长戴相龙也指出了今年金融工作的重点是建立和完善居民住房
农业银行恩施市支行)