基于统计学习理论的多核预测模型研究及应用

来源 :中南大学 | 被引量 : 0次 | 上传用户:doublepay2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,用学习理论解决数据分析问题已成为统计学的研究趋势之一。问题规模与复杂性日增的现实,需要更具效率的学习方法。本篇博士论文在统计学习理论的框架下,应用核方法,提出几种新的学习思路,建立了一套多核的支持向量回归机,并成功的应用于实践预测。与传统的学习方法相比较,所设计的新思路更具效率,能以低的计算代价取得期望的预测效果。传统的核学习方法包含的一个主要问题是建立学习模型后采取什么样的优化算法。基于此,本文的第一个创新点是在求解最小二乘支持向量机模型时,针对工作集的选择提出了一个单向收敛序贯最小优化算法(SD-SMO),该算法要求在迭代过程中仅优化一个拉格朗日乘子,使目标函数基于拉格朗日乘子的梯度单向收敛于0。在标准数据集上的数据试验表明,SD-SMO几乎没有降低学习精度,能有效减少算法迭代的次数,降低了计算成本。为了克服传统的核学习方法需要选择具体核的难题,针对多源数据或异构数据,研究者提出了多核学习方法(MKL)。多核学习的核通常是一族核函数的组合,由核函数族构建的学习核得出预测模型,传统的多核学习是基于l1范数,但模型的稀疏解降低了模型的预测精度。本文的第二个创新点是在l1范数的多核学习基础上,将其推广,得出基于lp(p>1)范数的多核支持向量回归模型,该模型能有效克服稀疏化解降低学习精度的问题,提高了预测效果。针对提出的基于lp(p>1)范数的多核支持向量回归模型求解,本文给出了一个相互交错、轮流优化的算法。在真实的经济数据上的试验结果表明,该方法预测效果比单核支持向量回归及基于l1,范数的多核支持向量回归模型都有明显提高。对于机理复杂、时变性强的数据,在线多核学习方法近来得到了研究者的青睐,也是当前机器学习领域中的又一个研究热点。基于此,本文的最后一个创新点是构建了一个在线多核学习预测框架,并给出了一系列的算法和理论分析。优化算法采取的是两种在线学习算法的融合,考虑到在线学习过程中计算成本逐渐增加的问题,应用了加权随机抽样策略,降低了计算成本。在标准时间序列数据集上的实证分析表明,在线多核支持向量回归预测模型以较大的计算成本获得了较好的预测效果;在采取随机抽取策略以后,能保证较高的预测精度,使学习时间明显减少。以学习理论解决数据分析问题将给统计学带来新的活力,本论文在此方面做了有益的尝试,所得成果的应用不仅仅局限于预测,其构造思路与相关理论技术也可以推广到其他学习领域,论文所做的工作丰富了数据分析处理的理论方法,对统计实践具有一定的指导意义。
其他文献
随着分数阶微积分理论的发展,越来越多的人关注这一领域的实际应用问题。现有大量文献提到,利用分数阶微积分能够对许多事物进行更精确的数学建模,这些分析结论在很大程度上
全球化与现代化是交织在一起的,经济全球化给我国现代化带来了深刻影响。要抓住难得机遇,迎接严峻挑战,趋利避害,加快我国现代化的发展。
<正> 五,SMT的焊接工艺分析表面安装的焊接大致分为两种类型。第一种以波峰焊为代表的焊接方式。这种方法是使用粘胶剂把表面安装元件粘合在印刷电路板平面上,然后通过波峰焊
分析对比研究了同批次同收获年度的粳稻谷在"原粮进、原粮出"的传统轮换模式和原粮深加工的转换模式下储备粮的轮换费用情况,通过产业化运作储备粮轮换工作,达到节约轮换费用
阐述了非均质材料零件设计优化的数学模型,并采用灵敏度分析以及最速下降法对其各个材料区域的材料性能进行设计优化,得到最佳材料性能参数后,再从非均质材料数据库中找到相
目的调查广州市三级甲等综合医院病人安全文化的现状。方法采用病人安全文化的医院调查问卷,对广州市7所三级甲等综合医院进行病人安全文化测评。结果病人安全文化正性应答率
<正> 随着高科技技术的发展,电子计算机产业受到了世界各发达国家的重视,且已被广泛用于军事、民用、航天、航海、交通、石化、矿产、医疗、文教、金融等领域。并向着高速度
笔者认为,机车互换配件修理科目的增设没有实质意义,使会计核算复杂化,建议取消"3128机车互换配件"科目,将互换配件修理费用定额还原到机车中修费用定额中,更便于预算管理、
对桔纹化涂装进行了探讨,提出了桔纹化涂装机理及涂层形成时的影响因素,并找出了实现桔纹化涂装的途径。特别是对普通漆桔纹化涂装的探索,很有独到之处。
随着现代工业朝着大规模、复杂化的方向发展,工业生产的过程监控和故障检测成为了工业系统关注的主要问题之一。通过对复杂生产过程的运行状态进行监测,及时发现过程干扰、故