论文部分内容阅读
本文重点介绍了最小最大模块化支持向量机的组成原理,详细说明了最小最大模块化支持向量机的模块分解和集成规则,并对其串行与并行训练时间复杂度进行了一定的分析。仿真实验表明:最小最大模块化支持向量机能够在保证泛化能力的前提下,明显提高训练速度,是一种行之有效的解决大规模模式分类问题的方法。最后,提出了一种新的处理多标号文本分类问题的方法:对于一个K类多标号问题,首先采用“一对其它”的问题分解方法将原问题分解为K个两类问题;然后按照最小最大模块化支持向量机的“部分对部分”问题分解方法,再对这些两类问题进一步分解。这种方法的特点是能将大规模、训练样本极不平衡的两类问题分解成用户希望的任意大小的相对平衡的两类问题,并能容易地实现并列学习。对《读卖新闻》日文和《路透社》英文数据集进行仿真实验的结果表明: 基于最小最大模块化支持向量机的新的多标号文本分类方法比传统方法有着更好的泛化能力和更短的训练时间。