面向汉语专有名词识别的支持向量机方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:bin52833093
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  各种未收录的汉语人名、地名、以及机构名称短语等专有名词的自动识别,能够提高中文文本的分析理解能力,是自然语言处理领域的重要和基础性问题,同时也是一项具有较高价值的应用研究。的SVM分类器一般具有更少的支持向量数目,获得了更好的识别结果。研究了一种基于距离估计的多个SVM分类器集成方法。该算法首先通过对特定实例的训练学习,构造了不同的SVM分类器;然后采用一种距离估计的方法,将得到的若干不同SVM分类器以渐进的方式融合为一个单一的分类器。针对专有名词和部分UCI数据库的实验表明:对于类别边界存在交叉混杂区域的二类分类问题,该算法能够较单一分类器取得更好的识别精度。
其他文献
  随着医学影像在临床的成功应用,图像分割在医学影像处理中的地位越来越重要。分割后的医学图像正被广泛应用于各种场合,如三维重建、计算机引导手术、手术模拟、治疗规划、
访问控制是指通过某种途径,允许或限制访问能力及其范围的一种方式。信息系统通过实施访问控制,可以限制对关键资源的访问,防止非法用户的侵入或者因合法用户的不慎操作所造
网格代表着一种先进的分布式计算基础设施,它是一个集成的计算与资源环境,其中吸纳了各种各样的计算资源,并将它们转化为可靠、标准且经济的计算能力。网格技术支持在动态、
本文重点研究了SIP协议的消息流程及消息的内容,以及SIP协议具体的应用情况,研究了其中的端系统测试方法及用于描述抽象测试用例的TTCN语言,对比分析了几种端系统测试方法及适用
中药是我国的国粹,经过上千年的发展,积累了大量的数据,以往对于这些数据的应用,仅仅是提供一些简单的搜索及统计功能,中医药数据中蕴涵的信息未得到很好的利用。随着世界性
  Web技术的日益成熟为互联网注入了活力,但是越来越多的数据让人们迷失在信息的海洋中,对人们有用的只是其中少之又少的一小部分。不同的用户面对的都是千篇一律的web页面。
  近年来,随着移动通信技术的发展和应用的普及,无线定位业务作为一种新兴的增值业务正越来越受到人们的欢迎,尤其是随着美国E-911(Emergencycall‘911’)法案的颁布,无线定位
为消除“信息孤岛”,让宝贵的信息资源为经济社会发展服务,迫切需要建立安全统一的信息交换平台。电子政务的特点对电子政务系统的信息处理、传输和交换的安全性提出了严格的要
主要从硬件体系和软件体系的角度,对远程监测系统做了一些探讨,并以山西铝厂隧道电缆温度及烟雾监测报警系统为背景,对系统的实现进行了深入的研究。 第一章对远程监测系统进
动态联盟、资源共享和信息安全是现代制造资源重组中的关键问题。制造企业动态联盟的出现,带动了制造业传统生产方式的变革,实现了联盟企业间的优势互补、相互协作和资源共享