基于混合模型的中国人名自动识别

来源 :中文信息学报 | 被引量 : 19次 | 上传用户:liongliong550
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种支持向量机(SVM)和概率统计模型相结合的中国人名自动识别方法。该方法首先按字抽取特征向量的属性得到训练集,采用多项式核函数建立SVM人名识别模型,然后在特征空间中计算测试样本到SVM最优超平面的距离,当该距离大于给定的阈值时使用SVM对测试样本进行分类,否则使用概率统计方法。实验表明,采用混合模型,对样本在空间的不同分布使用不同的方法可以取得比单独使用SVM或概率统计更好的分类效果,系统开式综合指标F-值比单纯使用支持向量机方法提高了1.51%。
其他文献
<正>作为中国最大的影碟机生产基地,江苏新科电子集团公司一直把技术与质量作为公司的立足之本.在数字技术领域,新科电子紧跟世界技术发展潮流,加强与国外大公司、高科技公司
悠姿曼美妍养生SPA是武汉市第一家商务精英女性打造的首家奢华会所,作为瑞士顶级专业护肤品牌SWISSLINE在武汉市的战略合作伙伴,悠姿曼在空间设计与环境氛围营造上,完全是以
苏东剧变以来,国内外政治界、学术界对苏共亡党、苏联解体的原因进行了多视角、多方法的探讨和研究,见仁见智,众说纷纭。中国外交部原部长李肇星“在外交部工作期间,曾利用各种时机向不下30位外国领导人请教过苏联解体的原因,得到的回答不少于30种,涉及上层腐败、信仰异化、言行不一、法制不健全、经济体制僵化、贫富悬殊、改革太急、与美争霸失利,等等。”经笔者梳理,大体上有以下主要观点。     “三大垄断”说
<正>数码虚拟5.1声道环绕声彩电近日在长虹诞生。它是我国首家推出的“幻真影院”系列彩电,彻底克服了对音源不能正确解码、声相偏位、对白不清晰、层次不清、环绕效果虚拟等
2009年什么美容项目最受欢迎?在新的一年里,这些项目是否还有上升空间?2009年美容市场最火爆的六大高端项目来年是否还会风靡?根据本刊记者对2009年美容市场的调查及美容院反馈,
根据我国标准及CISPR出版物的相关要求,对工业科学以及医疗射频设备的基本概念及其电磁骚扰特性限制和测量方法作了阐述,并推荐实例以供参考。
股份制企业的经营目标是追求利润的最大化,为股东获取最大回报。体制和机制的变化对企业党的建设及思想政治工作提出了新的更高的要求。因此,企业党建和思想政治工作也需要不
被国内外化妆品厂商视为新目标的90后消费者,有哪些消费特点,对产品及销售方式有哪些特别的要求,市场上针对90后的化妆品又有哪些与众不同之处呢?迎合市场、发掘90后消费者的潜在
天空一片明净,我的脚步轻盈,身体非常轻松,想到血液中的毒素得到清除,心中更加舒畅。也许这就是中医所说的“天人合一”吧。
<正>我国农村地域辽阔,人口分布不均,尤其是经济发展水平差异巨大.农民对家电产品的购买能力、消费观念、消费环境的差别更是错综复杂.据北京中企研究中心调查结果显示,如果