基于姓氏驱动的中国姓名自动识别方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:tianyibian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文章基于姓氏驱动和上下文信息,利用从真实姓名样本库和文本语料库中得到的大量统计数据,提出了一种中国姓名识别的分级加权筛选模型,利用基于这一模型的识别算法和冲突解决策略,实现中国人名的自动识别。通过从《人民日报》随机抽取的500个含有人名的句子进行测试,表明:中国姓名召回率达89.2%,精确率达93.15%。
其他文献
为了使公共利益受到违法行政行为侵害时获得司法的救济,英国较早就建立了颇具特色的行政公益诉讼制度,并在实践中取得了成功的经验。为适应我国社会主义市场经济发展和建设政
该文在大规模标注语料的基础上统计分析了中文姓名前置词频率、中文姓氏用字频率、中文名字用字频率、中文姓名后置词频率。利用这些统计数据在词语粗分的基础上实现了中文姓
随着经济发展的突飞猛进,资本市场对企业的吸引力日益增加。进入资本市场可以给企业带来资金,带来名誉。然而随着IPO企业的不断增多,问题也随之涌现出来。过度包装、欺诈上市
流动性是债券市场的生命力所在,也是衡量债券市场质量的重要指标,充足的债券市场流动性对我国债券市场的持续健康发展意义重大,同时也是投资者能够自由买卖的保障。从上世纪7
重农抑商是封建正统经济思想的一条重要原则,从商鞅变法规定的奖励耕战,到汉朝的重农措施,直到清初恢复经济的调整,都是重农抑商政策的体现。重农抑商思想一直贯穿了我国封建
<正>近日,由中国科学院大连化学物理研究所醇类燃料电池及复合电能源研究中心研究员孙公权担任首席专家的某部项目"甲醇燃料电池系列"通过验收。该项目于2012年12月立项,2014
<正>苏教版小学语文教材中编排了五篇说理性的文章。小学阶段的议论文教什么,如何教?我想,让学生在学习的过程中明理启智是说理性文章教学的目标之一,但更重要的是,这类文章
随着我国经济发展和"十一五""十二五"计划的开展,各地产业结构面临着严峻的问题。产业结构的自然变动和主动调整是经济发展的内在要求,国内外环境和市场需求的变化,使得产业
根据碳同位素在自然界的分布、碳同位素的深度效应及测向运移的同位素分馏作用、碳同位素与母质类型和成熟度的关系、热模拟实验中的联同位素变化、有机质中碳同位素的逆转现
针对目前Web站点的身份认证安全问题,提出了一种基于手机令牌和近距离无线通信(NFC,near field communication)技术的身份认证方法,并在Android平台上实现了该系统.该系统利