论文部分内容阅读
本文针对支持向量机(SVMs,Support Vector Machines)中的过学习、不可分区域、过长的训练时间等问题,提出4类改进的模糊支持向量机(FSVMs,Fuzzy Support Vector Machines)。 1.基于λ-截集的FSVMs。这类学习机将FSVMs与模糊理论相结合,提取训练集中的少部分样本,形成少训练样本集,构造基于这种少训练样本集上的FSVMs。首先选取每类样本集的中心,利用样本与其类中心的距离定义隶属函数。该隶属函数将每类数据映射到一个超球体内,这样训练集成为一个模糊集,每一个样本是一个三元组,包括样本的特征、样本的类别属性、样本的隶属度;其次,选取一个合适的参数λ,利用λ-截集选取特征向量,利用特征向量构造FSVMs;第三,利用有向无环图决策机制,将该类学习机推广到多类问题。 2.基于线性聚类的FSVMs。该类学习机利用线性聚类,提取距分类超平面较近的样本构造改进的学习机。首先选取训练集中最典型的一些样本,构造一个粗糙SVMs的分类超平面,用样本与这个超平面的相对距离定义隶属函数,将所有的训练样本都映射到一个带形区域;其次,选取合适的聚类参数λ,缩小这个带形区域,将离粗糙超平面比较近的数据映射到这个小的带形区域,用这个小的带形区域中的数据构造FSVMs;第三,利用1—对—1决策机制,将该类学习机推广到多类问题。 3.基于球形区域的FSVMs。该类学习机也是在少训练样本集上构造的。首先,在所有训练样本的基础上,选取训练集的中心,考虑两类样本的不平衡性,定义该中心为两类中心的中心;其次,在每类训练样本中,利用样本与中心的相对距离定义隶属度;选取参数,截取少训练样本集,在少训练样本集上构造FSVMs。 4.基于聚类的FSVMs。许多聚类技术可以用SVMs。该类学习机利用模糊C—均值聚类技术,将每类训练集划分为若干个子集,这些子集由相似样本组成的。利用聚类中心组成少训练样本集,并用于构造FSVMs。在聚类时,由于位于类边缘的稀疏性,可通过选择合适的聚类参数,使这些稀疏数据独立成为一个聚类中心。因此,减少训练样本既不影响边缘数据,也不影响FSVMs的性能。