高效预测的核学习方法

来源 :中南大学 | 被引量 : 0次 | 上传用户:tingtngliok
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以学习理论解决数据分析问题,是近期统计学研究的趋势之一。问题规模与复杂性日增的现实,需要更具效率的学习方法。本篇博士学位论文在统计学习理论的框架下,应用核方法,提出几种新的学习思路,建立起一套简洁、高效的回归学习机,并成功地用于预测实践。与标准学习方法比较,新的设计思路,更具效率,能以低的计算代价取得满意的学习效果。论文围绕学习性能的改进与学习效率的提高两个主题分四个方面展开。文章首先考虑样本集上信息分布纵横两向上的不均匀性,构造了几种简洁的动态参数,并引入多元尺度因子,构造多元核。在统一的框架下考虑参数的改进、优化与特征提取,所得学习机MO-SVR简明、高效,改进了原标准学习机的学习性能,为学习机的优化设计提供了一条新思路,其性能为试验所肯定。减少学习问题规模是提高学习效率的一种直接途径。文章接下来应用局部风险最小化原则,导出了局部学习机的一般形式,并分析其理论收敛界。承MO-SVR的优化思想,利用快速计算的留一误差,由模式搜索PS算法实现参数的自动优化,构造出具体的优化局部学习机。为高效学习特别是大规模的学习问题提供了一条精简的设计思路,其有效性为试验所肯定。随之,文章从另一个角度提出直接简化DS策略,以极低的计算代价将当前先逼近后优化分步走的稀疏思路合二为一,直接在原问题空间上简化。具体开发了Cholesky分解算法与共轭梯度算法,保证DS策略整体上的高效、简洁。DS具有一定的创新性,在大规模学习问题中更具有直接的实践意义,试验肯定了算法性能与理论分析。提高学习效率的另一途径是改变学习方式。论文最后推广当前在线学习,得到更丰富的学习率下降模式,并在此启示下提出约束随机元方法LSMD。LSMD既有SMD的自适应调节能力,同时算法的稳定性能又有理论保证。论文还比较了在线学习的隐式更新与显式更新,导出了隐式更新的更紧的收敛界。将隐式更新技术与SMD结合的自适应算法AILK具有内在的稳定性,是一种极具挖掘潜力的学习方法。自适应在线方法为高效学习开辟了新思路,利用在线学习方式高效率的同时保证了满意的学习性能,其理论分析与算法性能得到实验的充分肯定。以学习理论解决数据分析问题必将给统计学带来新的活力,本论文在此方面做了有益的尝试。所得成果应用并不局限于预测,其构造思路与相关理论技术亦可推广到其他非核方法的学习领域。论文所做工作丰富了数据分析处理的理论方法,对统计实践具有一定的指导意义。
其他文献
风险在人们生活中无处不在,概率统计是人们研究风险的一个很好的工具.本文主要给出概率统计方法在火灾风险分析中的应用,并研究投资组合中的最优化问题. 随着经济的发展,火灾
本文主要介绍了一种新的数据分析算法,即张量投票算法.该算法完全利用图像数据,根据张量分析,矩阵论和几何的知识,对数据点进行编译和几何阐释,再根据心理学中的Gestalt原理制定一
采样问题主要研究如何利用采样点上的样本值去恢复或逼近原始信号。采样和重构是信号处理的基础,对现代电子工业技术的发展产生了巨大的影响。本文主要研究再生核空间中确定
复合随机动力系统是指具有随机参数的系统受到外部环境激励的动力系统,其能更准确地描述实际问题.经典随机振动系统的丰富动力学行为及应用被学者广泛研究,其中Hopf分岔是一
学位
本学位论文对一类捕食者-食饵系统和一类离散动力系统的稳定性及分岔进行了分析和讨论,全文共分为三章. 第一章,简单的介绍了非线性动力学和分岔的发展史,并列出了分岔的一些
本文研究了循环码的代数理论及其译码算法。论文利用循环码的根刻画方式,讨论一族设计距离为11的狭义本原二元BCH码及其对偶码。具体内容如下: (1)研究F2m上分圆陪集的计数
学位
在本文中,我们探讨了高维度的机器学习问题。本文分析了高维问题所面临的挑战以及这些导致这些问题的原因。为了解决这些问题,机器学习在高维度下的模型和算法需要相应地重新设