基于模糊决策树的模糊时间序列预测模型研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:sufe_
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界中有很多事物的统计指标是以时间先后次序排列而成的数据序列,通过对这些数据进行分析可以挖掘序列的内在规律,进而对未来的趋势进行预测。在经典的时间序列预测中要求历史数据具有一定的完整性和精确性,然而实际生活中存在着许多模糊不清的事实。针对经典时间序列无法处理带有不确定性数据的问题,Song等抽象出模糊时间序列的概念并建立了预测框架。在模糊时间序列预测模型的构建过程中论域划分和模糊关系的处理是影响预测精度的关键。对于论域划分,传统的模糊时间序列预测模型往往根据经验对论域进行划分,划分没有依据致使预测精度较低。对于模糊关系的处理,大量模型使用单因素进行预测,忽略了与预测变量相关的其他因素。除此之外,现实生活中的很多问题因为数据采样难度大,数据遗失等原因导致样本缺失,致使模型无法相对精准的预测。为解决这些问题,本文对模糊时间序列预测算法进行了研究与改进,并提出了两种基于模糊决策树的预测模型。针对传统模糊时间序列预测论域划分没有依据的问题,本文提出基于C-模糊决策树的自适应模糊时间序列预测模型,依据序列数据的关联关系优化论域划分。该模型利用C-模糊决策树挖掘序列数据的关联关系,通过验证集预测误差与论域划分复杂度构建目标函数,基于关联关系最小化目标函数,使模型自适应划分论域进行预测。同时为避免过拟合,基于决策树剪枝算法REP提出C-模糊决策树剪枝策略进行优化。本文在提出的基于C-模糊决策树的自适应模糊时间序列预测模型的基础上,进一步提出基于随机森林的多因素模型。考虑到很多实际问题中,影响预测变量的因素并非只有一个,此时使用单因素预测模型无法满足实际情况的需要,且存在大量现实问题有历史数据缺失的情况。因此利用C-模糊决策树引入多种因素构建模型进行预测,更加全面的分析样本特征,并通过随机森林解决样本缺失的问题。本文利用仿真实验评估模型预测精度,将模型分别应用于上证股指和TAIEX预测,并将预测结果同其他模型进行对比分析。实验结果表明,本文提出的模型能够克服按经验划分论域以及单因素预测的缺点并有效解决数据缺失问题,获得了较高的预测精度,验证了本文模型的有效性。
其他文献
汽车轮胎压力监测系统(TPMS)是继防抱死制动系统(ABS)、安全气囊防护系统(SRS)之后,汽车电子领域出现的新一代高科技安全预警系统,它是一种能够在汽车行驶过程中对轮胎内压力
报告了当前嵌入式系统中人机交互界面的现状与实际应用需求。介绍了液晶显示控制器在嵌入式系统设计中的地位和作用,液晶屏接口信号的定义及作用。以Samsung公司的32位嵌入式
微信作为一个新兴媒体,以其独特的功能吸引着大学生,它不仅让大学生有了一个广阔的、多功能的交流平台,也为大学生了解时事开辟了新的渠道。对大学生思想政治教育来说,微信的
外商直接投资(FDI)是跨国公司的投资需求与东道国社会经济及政策制度等环境相互契合的结果,是推动区域经济增长的重要动力。我国利用外资规模不断扩大,但空间分布不均衡,加剧
<正>国土资源执法是行政执法的一种,具体是指县级以上人民政府国土资源行政主管部门依法对单位和个人执行和遵守土地、矿产资源管理法律法规的情况进行监督、检查,并对违法行
随着人们生活水平的提高和科学技术的发展,现代医学进步的脚步从来没有放缓。医疗器械作为医学发展的产物已经成为世界上增长最快、体量最大的产业之一。随着我国改革开放的
“客家”概念的诠释不宜生搬硬套斯大林有关“民族”定义的模式。民系只是民族的地域性分支,是民族内部在民族共性覆盖下的具有相对差异的方言以及生产、生活习俗的人类群团。
随着"互联网+"理念的普及,智慧城市建设进入了飞速发展模式,作为智慧城市建设的核心之一的智慧物流也迅速发展,因此需要大量的物流信息化人才。为了更好地培养物流信息化人才,针
目的:探讨高血压脑出血超早期手术的疗效。方法:回顾性分析2005年1月~2012年2月35例高血压脑出血超早期手术患者的临床资料,对其总结、分析。结果:本组35例中死亡4例,死亡率占比11.4
为快速有效地实现物联网中无线节点的定位需要,提出混合使用遗传与退火算法计算物联网无线节点位置的方法。利用退火算法具备概率性向“优化”和“劣化”方向搜索的特点,优化