自适应剪枝SVM多分类算法模型及其在脱机手写体汉字识别中的应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:chungkhoan2002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于统计学习理论的支持向量机算法具有坚实的数学理论基础和严格的理论分析,是机器学习中的一种新方法和研究新热点,该理论受到广泛的重视并应用到不同的领域,已初步表现出很多优于已有方法的性能,然而,它还处在不断发展阶段,仍有一些问题需要进一步研究和完善,其中两个重要问题是:如何将支持向量机由处理二分类问题推广到多分类问题;在处理超多类大样本分类问题时,如何降低计算时间和空间的复杂度。为了解决这两个问题,本文提出了自适应剪枝SVM多分类算法模型,并将其应用到典型的超多类大样本分类问题——脱机手写体汉字识别当中。主要研究工作包括: 1.从机器学习的数学原理、VC维理论基础和风险结构化最小原则等方面研究了统计学习理论,然后研究了支持向量机在完全线性可分情形、允许线性不可分情形和非线性情形的数学模型以及核函数的选择,最后对当前主流的支持向量机求解算法进行了研究,包括二次规划算法、分解算法、序列最小优化算法和增量算法。 2.研究了各种基于支持向量机的多分类算法模型,包括一对一(1-a-1)、一对多(1-a-r)、纠错编码(ECC)、无环有向图(DDAG)和二叉树决策,接着对它们的本质和优缺点进行了理论研究,并对“投票法”和“模糊隶属”两种流行的策略进行了对比分析。 3.研究了最小二乘支持向量机算法、块增量学习理论、剪枝和逆学习,在此基础上,提出了自适应剪枝SVM二分类算法模型,并详细阐述了其理论基础和算法流程,然后,结合支持向量机多分类算法框架,将其推广得到自适应剪枝SVM多分类算法模型,这是本文的主要理论研究成果。 4.对自适应剪枝SVM多分类算法模型进行实验。编写了该算法模型的软件包,并用三个UCT数据集和一个50类的手写体汉字数据集进行实验,从支持向量个数、训练耗时、测试精度、剪枝参数等方面跟基于SMO的多分类算法进行对比分析。 5.将自适应剪枝SVM多分类算法模型应用到脱机手写体汉字识别问题。根据模式识别的一般理论和脱机手写体汉字识别问题自身特点,设计了基于该算法模型的汉字分类器,同时,通过对算法模型进行改进,使其可以处理400类汉字的超多类大样本分类问题。最后利用采集的汉字图像进行实例实验。 实验结果表明,本文提出的自适应剪枝SVM多分类算法模型的在速度和精度方面有较大的优势,应用到脱机手写汉字识别问题中取得了很好的效果。
其他文献
从今年7月开始,江西省赣州市在全市范围内实行干部离岗考察制。其主要方法是,在对干部进行考察前,先将其调离工作单位,然后再去他们的原单位对其进行全面考察。 Starting fr
本文研究了Hopf代数对代数和余代数的作用和余作用。我们首先回顾模代数的一些结果和研究了由M.Yan和Y.C.Zhu提出的轨道/稳定子的概念并给出一些相应的命题,这些命题可以看作是G-
本文研究了空间P(R+)上的无穷可分概率分布的典型表示,建立了与Shiga和Tanaka平行的结果.全文主要内容如下: 第一节,简单介绍了一些背景知识和若干数学符号. 第二节,给出了几
作为一种风险管理和投机的有效手段,期权市场得到迅猛发展。由于期权合约的灵活多样性及适于创造性,近年来,国际金融衍生品市场除交易广为熟悉的欧式及美式标准期权外,还涌现大量
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
分形集的特征更经常是由测度而不仅仅是由集合来显示。理论和应用的结果均证实,测度的重分形分析是奇异测度分析中一个非常有用的方法。 在某些情形,由测度μ导出的具有指数
自适应滤波算法的研究是当今自适应信号处理中最为活跃的研究课题之一。寻求收敛速度快,计算复杂度低,数值稳定性好的自适应滤波算法是研究人员不断努力追求的目标。 细胞自
本文考虑以下逆变分不等式问题:IVI(Ω.f):找到x∈Rn,使得f(x)∈Ω,(y—f(x))Tx≥0,(A)y∈Ω.这类问题来源与一些不同的系统控制问题。它与传统的变分不等式问题不同的是函数值f(x)
近年来,多智能体系统的一致性问题受到越来越多的学者们的关注,同时它在很多方面都得到了广泛地运用.所谓一致性就是指多智能体系统的每个个体都按照某种控制规则、相互交流信
随着我国开放式基金在金融市场的影响力日益显现,客观、科学地对开放式基金进行业绩评估对于基金投资者、基金管理公司和监管当局都有着十分重要的意义。本文通过借鉴国外证券