中文姓名自动识别系统的设计与实现

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:ghostlei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
论文在对大规模姓名样本库、姓名语料库进行统计的基础上,将姓氏库中的姓氏按优先级分类,并研究了前300个姓氏作普通单字时其上下文用字规律,将确定真姓氏并识别姓名的过程看作对句子的姓氏用字集进行划分的过程,设计实现了一个中文姓名自动识别试验系统。同时提出多级阈值的概念,即姓名右边界阈值和识别阈值均是优先级的函数。对系统的开放测试召回率和准确率分别为80.62%、89.27%。
其他文献
<正>医院是保护人民健康和生命安全最为关键的环节,而医疗设备是医院医疗实践、科学研究、医学教育的重要物质基础,是医院固定资产的主要组成部分。医疗设备的数量和质量是衡
数学是高中教学科目中的基础科目之一,其学习难度极大,很多学生在学习的过程中都会遇到这样或那样的阻碍。如果数学教师在课程教学中无法找出合理的教学方法,就不但无法提升
<正>在不同的折扣方式下,其销售额不同,企业缴纳的税款也不一样,这就对企业促销方式的选择和纳税筹划提供了选择的空间和可能。笔者对折扣销售、销售折扣与销售折让三种销售
交通运输业是介于社会性生产和消费之间的产业部门,在国民经济体系运转过程中起着纽带连接的作用,是我国的基础产业,部分现代服务业试点企业营业税改征增值税的工作自2013年8
从引入空间投影变换的概念入手,证明了体积之交比为一般的投影不变量,从而将其作为描述物体的度量。通过对基础矩阵进行合适的分解,导出了确定投影变换模型之齐次坐标和投影坐标
随着人民生活水平的提高,市场经济也在不断发展中,而我国东西部地区在发展中也存在不协调的因素,国家对民族地区的财税政策将要如何调整,采取哪些措施,势必影响民族经济的发
中文姓名识别是自动分词的难点之一。本文在基于统计的中文姓名自动识别方法的基础上,引入局部可信度,并建立了姓名构词可信度的评价函数等:同时在姓名识别的过程中引入词法
个性发挥是保证“人性”的重要方式,促进学生的个性化发展是学校教育发展的重要任务,个性化教学成为教育理论研究的重要课题。当前的个性化教学实践因为班级规模、教师能力等
阐述传统测量方法在李克特量表分析中的固有缺陷,即测验依赖与样本依赖,项目间以及项目选项间计分方式的不合理性的基础上;通过研究实例说明Rasch模型中处理这些问题的方法,
针对当前我国大规模的城市更新造成了城市文化与城市特色危机的状况,提出了“城市更新 与城市文化契合”的概念丛片意义,并从五个力“面探讨了二者契合的方法与途径.