均衡m×2交叉验证方法

来源 :山西大学 | 被引量 : 1次 | 上传用户：li875

【摘要】

：

估计统计模型的期望预测误差是统计机器学习的核心任务之一。期望预测误差估计的好坏对后续的模型选择问题、不同模型预测误差差异的显著性检验问题以及变量选择问题均有着显

【作者】

：

杜伟杰

【机构】

：

山西大学

【出处】

：

山西大学

【发表日期】

：

2013年01期

【关键词】

：

交叉验证均衡m×2交叉验证模型选择

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

估计统计模型的期望预测误差是统计机器学习的核心任务之一。期望预测误差估计的好坏对后续的模型选择问题、不同模型预测误差差异的显著性检验问题以及变量选择问题均有着显著的影响。为了找到一个优良的估计,研究者们提出了大量的估计方法,例如,MDL方法,交叉验证方法,Bootstrap方法以及它的改进.632Bootstrap方法。其中,交叉验证是一种最常用的泛化误差估计方法。本文主要针对统计机器学习分类问题,对已有交叉验证方法的优缺点进行了分析和总结,并在此基础上对交叉验证方法进行了改进。对于组块3×2交叉验证来说,它虽然具有折数低、对数据集切分均匀、实验次数少等特点,但是5×2交叉验证、10×2交叉验证对于分类问题也同样具有不错的效果,而且对于分组2折交叉验证的方法,随着实验次数的增加会一定程度上提高实验结果。但是如何解决实验性能与实验开销间的矛盾,如何确定合理的实验次数一直都是机器学习领域的难题,为此我们尝试对组块3×2交叉验证进行了改进和推广,提出均衡7×2交叉验证和均衡11×2交叉验证,并在此基础上总结出更一般化的均衡m×2交叉验证(BCVM×2)同时给出了其具体构造方法。我们推荐使用均衡m×2交叉验证方法来确定实验次数,以此来提高实验效果,并且通过理论分析和模拟实验佐证了我们的设想。对于分类学习中的模型选择任务,我们同样应用均衡m×2交叉验证方法。综合考虑均衡m×2交叉验证模型选择方法的各种影响因素,可以判断运用m×2交叉验证进行模型选择效果要优于常用的5折、10折交叉验证。我们通过模拟实验支持了以上判断,并且从理论上证明了均衡m×2交叉验证同样具有选择一致性。因此,可以说明均衡m×2交叉验证是一种更适合分类问题的模型选择方法。

其他文献

通过高速偏转光束进行小尺寸部件的激光焊接

期刊

光束小尺寸部件结构激光加工机激光装置轨道运动千瓦级聚焦极动力学弯曲焊接

表面效应对平面P波在半圆柱形纳米缺陷上散射的影响

随着纳米科学和技术的发展,纳米材料和纳米元器件得到了广泛关注和研究。在纳米尺度,由于表面和界面在整体中所占比例显著增加,其影响逐渐重要,使得纳米材料和纳米结构元器件

学位

散射表/界面效应P波孔洞夹杂动应力集中波函数展开法

差分特征列方法的一些改进及应用

差分方程组在物理学、天文学、现代生物学、人工神经网络、经济学等很多领域都有着非常广泛的应用，但目前对于非线性差分方程组我们只能对其解进行定性分析，却很难求出其精确解

学位

数学机械化非线性差分方程组差分特征列方法精确解

基于压力舒适性的纺织材料设计反问题:数学建模、分析及数值计算

本文依据弹性力学中的小变形理论，建立了人体-弹性织物系统的静态力学模型。通过模型及适当假设建立正问题，得到关于弹性织物位移函数的椭圆型偏微分方程组边值问题，利用有限差

学位

反问题正则化伴随共轭梯度法弹性织物压力舒适性最小二乘问题数值计算

加权Motzkin路的一些计数问题

水平步,上步和下步加权分别为α,β和γ的Motzkin路称作加权Motzkin路.在x轴没有水平步的加权Motzkin路称作加权Riordan路.第一章,给出了关于组合数学中的格路和Riordan矩阵的一些概念和记号.第二章,主要研究了加权Motzkin路和加权Riordan路.首先用符号化方法生成Motzkin路和Riordan路,借助Riordan矩阵的A序列和Z序列,考虑了加权Motzkin

学位

九维Taft代数上的2--余循环

Hopf代数是代数学的一个重要研究领域，起源于上世纪四十年代，是Hopf在研究Lie群的拓扑性质时发现的一种既有代数结构又有余代数结构的代数系统.在过去的三十多年里，随着量子群的

学位

Hopf代数Taft代数2-余循环

均衡m×2交叉验证方法

其他学术论文