面向汉语专有名词识别的支持向量机方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：bin52833093

【摘要】

：

　　各种未收录的汉语人名、地名、以及机构名称短语等专有名词的自动识别，能够提高中文文本的分析理解能力，是自然语言处理领域的重要和基础性问题，同时也是一项具有较高价值的

【作者】

：

宇缨

【机构】

：

哈尔滨工业大学

【出处】

：

哈尔滨工业大学

【发表日期】

：

2005年期

【关键词】

：

汉语专有名词识别支持向量机属性约简遗传算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　各种未收录的汉语人名、地名、以及机构名称短语等专有名词的自动识别，能够提高中文文本的分析理解能力，是自然语言处理领域的重要和基础性问题，同时也是一项具有较高价值的应用研究。的SVM分类器一般具有更少的支持向量数目，获得了更好的识别结果。研究了一种基于距离估计的多个SVM分类器集成方法。该算法首先通过对特定实例的训练学习，构造了不同的SVM分类器；然后采用一种距离估计的方法，将得到的若干不同SVM分类器以渐进的方式融合为一个单一的分类器。针对专有名词和部分UCI数据库的实验表明：对于类别边界存在交叉混杂区域的二类分类问题，该算法能够较单一分类器取得更好的识别精度。

其他文献

医学图像序列分割的研究与应用

　　随着医学影像在临床的成功应用，图像分割在医学影像处理中的地位越来越重要。分割后的医学图像正被广泛应用于各种场合，如三维重建、计算机引导手术、手术模拟、治疗规划、

学位

序列分割聚类处理梯度矢量流主动轮廓线自适应形变步长

权限约束支持的访问控制在XML资料库中的应用研究

访问控制是指通过某种途径,允许或限制访问能力及其范围的一种方式。信息系统通过实施访问控制,可以限制对关键资源的访问,防止非法用户的侵入或者因合法用户的不慎操作所造

学位

访问控制策略检查约束角色上下文

网格环境中面向服务的自动协商研究

网格代表着一种先进的分布式计算基础设施,它是一个集成的计算与资源环境,其中吸纳了各种各样的计算资源,并将它们转化为可靠、标准且经济的计算能力。网格技术支持在动态、

学位

网格多agent系统自动协商协商协议协商策略遗传算法博弈论数字签名

SIP协议一致性测试的研究与实现

本文重点研究了SIP协议的消息流程及消息的内容，以及SIP协议具体的应用情况，研究了其中的端系统测试方法及用于描述抽象测试用例的TTCN语言，对比分析了几种端系统测试方法及适用

学位

SIP协议消息流程一致性测试测试用例

数据挖掘在中药专利数据集中的应用与研究

中药是我国的国粹,经过上千年的发展,积累了大量的数据,以往对于这些数据的应用,仅仅是提供一些简单的搜索及统计功能,中医药数据中蕴涵的信息未得到很好的利用。随着世界性

学位

方剂信息数据预处理模糊集隶属函数模糊关联规则知识发现系统

基于web日志挖掘的个性化推荐系统模型研究与实现

　　Web技术的日益成熟为互联网注入了活力，但是越来越多的数据让人们迷失在信息的海洋中，对人们有用的只是其中少之又少的一小部分。不同的用户面对的都是千篇一律的web页面。

学位

web日志挖掘个性化推荐系统主帧子帧兴趣度

基于EAP协议的无线定位系统安全认证研究与实现

　　近年来，随着移动通信技术的发展和应用的普及，无线定位业务作为一种新兴的增值业务正越来越受到人们的欢迎，尤其是随着美国E-911(Emergencycall‘911’)法案的颁布，无线定位

学位

EAP无线定位系统网络安全EAP协议移动通信技术

授权签名协议研究及在安全服务中应用

为消除“信息孤岛”，让宝贵的信息资源为经济社会发展服务，迫切需要建立安全统一的信息交换平台。电子政务的特点对电子政务系统的信息处理、传输和交换的安全性提出了严格的要

学位

授权签名安全服务安全机制网络服务

基于Web的远程监测系统研究

主要从硬件体系和软件体系的角度，对远程监测系统做了一些探讨，并以山西铝厂隧道电缆温度及烟雾监测报警系统为背景，对系统的实现进行了深入的研究。第一章对远程监测系统进

学位

远程监测C/S、B/S混合模式隧道电缆温度烟雾监测

制造资源重组中统一安全模式与RBAC技术研究

动态联盟、资源共享和信息安全是现代制造资源重组中的关键问题。制造企业动态联盟的出现,带动了制造业传统生产方式的变革,实现了联盟企业间的优势互补、相互协作和资源共享

学位

动态联盟网络安全访问控制RBAC统一身份认证

面向汉语专有名词识别的支持向量机方法研究

其他学术论文