时间序列数据逐步聚类降维法

来源 :IT经理世界 | 被引量 : 0次 | 上传用户:cupzss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了达到对复杂的多维度时间序列数据进行简化和提取有效信息的目的,本文介绍了一种新的对多维度的时间序列数据进行聚类及降维的方法,处理数据科学及其相关领域的时间序列数据的分类、剔除多重共线性及降维问题.该方法首先通过借鉴K临近算法(K-Nearest Neighbor)和贪心算法(Greedy Algorithm)的思想,基于数据横截面有效性为启发式函数(Heuristic Function),按启发式函数大小为顺序逐步对时间序列数据进行聚类;得到已聚类分组的数据后,在每一组内同样通过数据有效性为顺序进行逐步普通最小二乘法(Ordinary Least Squares,OLS)回归分析,逐步回归得到的残差作为新数据,根据新数据回测的有效性进行加权平均,在每个组别内合称为一个新的数据,最终达到降维的效果.通过利用金融量化投资领域的多因子模型(Multi-Factor Model)和过去十年的A股数据进行回测及分析,证明采用逐步聚类降维法能够有效的处理高维度、高共线性时间序列因子数据,帮助后续应用模型更好的剔除时间序列数据间的多重共线性关系,同时最大程度上保留甚至提高时间序列数据的有效性.
其他文献
采用现代设计的方法、手段实现大型电除尘器本体结构的优化设计,以获得合理的结构,减轻电除尘器的重量、节省材料、降低成本,是当前亟待解决的问题,有着非常重要的实际意义。本文以北京海懋通用技术有限公司的H6083户外式大型电除尘器为研究对象,针对其结构的特点,提出了一种集工艺设计、受力分析与本体结构优化为一体的设计方法,并对这种全新的大型电除尘器本体结构分析与设计环境进行了集成机理、实现框架、关键技术等
本文通过对荣华二采区10
期刊
随着数控机床朝高速、高精度、高性能方向发展,对机床工作性能的要求越来越高,不仅要求机床具有良好的静态特性,而且要具有良好的动态特性。影响数控机床动态性能的因素除了
语文学习离不开阅读,养成做读书笔记的习惯,不仅有利于记忆,更重要的是能为学生一生的读书学习打下基础,让学生终身受益.在小学阶段,教师要有序培养学生做读书笔记的习惯.低
机器人在自动控制与自动操作领域应用非常广泛,它能高智能化的实现各种运动或操作,同时机器人的运动或操作需要满足精度要求。目前市场上的各类机器人关节减速器多存在返程间隙,且补偿困难,降低了机器人的操作精度。本课题主要针对反向间隙问题提出一种无反向间隙变速机构,主要用于机器人回转关节,由于采用滚珠丝杠-预紧螺母机构,它不存在返程间隙,具有传动精度高,结构简单,制造方便等优点。本文主要对机构的构型、承载能
随着社会的不断发展,信息技术课程变得越来越重要.尤其是在小学教育阶段,既要通过课程安排帮助学生打好计算机基础,也要帮助学生养成正确的计算机使用习惯,使计算机对学生成