几种机器学习算法及其集成模型在回归问题中的应用与比较

来源 :兰州大学 | 被引量 : 5次 | 上传用户:ymz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据机器学习理论中“没有免费的午餐”定理,不存在能够完美解决一切问题的算法。数据集的规模和结构等很多因素会对最终结果产生影响。针对具体的数据集和现实需求,应该考虑如何选择合适的算法。本文提出了一种回归预测中最优模型选择的方法。这种方法的重点不是最后的具体模型,而是最优模型的选择过程。因此,它不仅限于用在某一给定的数据集上。这正是本文的创新之处。方法整体上分为数据集分解和集成模型选择两大部分。在数据集分解部分,先对原始数据进行季节调整,得到季节指数和趋势项序列,再将趋势项序列进行完备集合经验模态分解,得到本征模函数(IMF)。集成模型选择部分是本文的重点。对分解得到的IMF实现回归预测,可以用同一算法预测所有IMF,也可将诸IMF分成若干类,对不同类的IMF选择不同的算法。若对IMF分类预测,存在如何分类以及选择何种算法的问题。本文提出的方法是:对每条IMF用多种算法分别进行预测,选出最优集成模型,并有针对性地提出对比模型,验证所选最优集成模型是否性能最佳。实证研究中,分别用k近邻(kNN)、BP神经网络(BP)、极限学习机(ELM)和支持向量机(SVM)四种机器学习算法预测了诸IMF。选择SVM惩罚参数c和核函数参数g时,比较了网格搜索算法(GS)、人工蜂群算法(ABC)、粒子群优化算法(PSO)、布谷鸟搜索算法(CS)、差分进化算法(DE)和基于差分进化的混合灰狼优化算法(HGWO)等6种不同算法的结果。根据综合比较的结果,最优集成模型中选择了DE算法选择参数。
其他文献
中小企业是经济增长和社会就业的重要推动力量,但同时它们的生产过程也产生了大量的环境污染。公共行政管理机构正在开始表现出对中小企业环境活动的关注,因为它们已经意识到了
中等职业学校(以下简称“中职”)作文教学一向是中职语文教学的难题,在中职学校教学改革的大背景下作文教学的改革也势在必行。本文从“真实写作”角度对中职作文教学做了认
英语教学的研究一直是热门话题,人们对英语的重视也是有增无减,而英语写作一直处于被忽略的地位。在本文中,作者论述了英语写作的重要性,找出了影响英语写作的因素,指出了传
新一轮的基础教育课程改革已经如火如荼地开展了十余年,关于课程资源理论和实践的研究也在不断深入,课程资源的地位日益突出。然而,目前山区农村缺乏有利的条件性课程资源,绝
目的对CT增强中实施整体护理的应用进行总结,进一步完善和优化检查过程中的护理流程,做好关键步骤的护理工作。方法在CT增强检查前、中、后三个时段实行分段细节化护理,注重
目的:探讨早期桥式运动对中风偏瘫患者日常生活能力的影响。方法选择100例中风偏瘫患者急性期作为临床资料随机分为试验组和对照组,两组患者均采用传统常规护理方法,试验组在此
<正> 煤炭工业是我国的主要能源。要加快煤炭工业的发展,保证有一个稳定、健康的增长速度,必须改变煤矿工人的形象。首先应该改变采掘工人队伍思想波动、不稳定的状况,这是保