论文部分内容阅读
各种未收录的汉语人名、地名、以及机构名称短语等专有名词的自动识别,能够提高中文文本的分析理解能力,是自然语言处理领域的重要和基础性问题,同时也是一项具有较高价值的应用研究。的SVM分类器一般具有更少的支持向量数目,获得了更好的识别结果。研究了一种基于距离估计的多个SVM分类器集成方法。该算法首先通过对特定实例的训练学习,构造了不同的SVM分类器;然后采用一种距离估计的方法,将得到的若干不同SVM分类器以渐进的方式融合为一个单一的分类器。针对专有名词和部分UCI数据库的实验表明:对于类别边界存在交叉混杂区域的二类分类问题,该算法能够较单一分类器取得更好的识别精度。