基于CAE-余弦聚类的股价形态特征提取方法及其对中短期股价预测影响研究

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:byddr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
股价形态是影响股价变动的重要因素,许多投资者会观察股价图像形态进行交易操作,比如市场中形成的如“双峰顶天,跌在眼前”等现象就是投资者通过观察股价图像形态进行交易操作,进而对股价变动产生影响。但股价形态的研究存在诸多困难,一方面诸多如“双峰型”、“三峰型”、“三角型”等形态特征难以通过设计指标的方式来计算衡量,单纯使用股价等时间序列数据进行研究又无法体现股价形态对股价变动的影响;另一方面股价形态千变万化,且不同时段投资者对股价形态的认知不同也使得在每一时点都可能出现新的形态变量,从而给“贴标签”式的股价形态研究带来极大困难。从以往研究情况来看,大多研究者研究技术面股价预测方法时多从指标角度出发,研究股价形态对股价预测影响的文献则较少,但结合市场实际来看许多国内投资者较少通过建立技术模型的方式来进行股票交易,而是通过观察股价图像的形态特征进而做出交易行为。排除股价形态因素的股价预测研究与现实情况有一定的脱节。本文的研究目的主要有二:一为提出一种能以无监督模式识别处理股价形态数据的方法;二为比较研究股价形态能否对股价预测性能的提升产生边际贡献。考虑到CNN神经网络中的卷积核运算以及池化运算在识别提取图像形态特征方面的极大优势,以及余弦距离在衡量图像相似度方面相较欧式距离的更佳表现,本文提出一种结合CAE(CNN自编码器,CNN Autoencoder)、基于余弦距离的K-Means算法及LSTM(长短期记忆,Long Short-Term Memory)神经网络的模型,使用CAE提取股价图像特征数据并通过余弦K-Means算法进行无监督归类,然后结合技术数据对短期股价进行预测,并将结果与仅使用原始股价数据、原始股价数据+CAE降维数据、原始股价数据+随机数据、原始股价数据+CAE+PCA降维数据作为有效输入的LSTM模型或岭回归模型做出对比,以说明引入图像特征数据对股价预测可能存在的边际贡献。本文使用上证指数的自2000年1月4日至2021年12月30日的5330条开盘、收盘、最高、最低价作为原始数据进行实证分析,结果表明:1)“两头宽,中间窄”架构的CAE深度自编码器结合PCA算法能有效在保留原始股价图像信息的前提下对股价图像进行压缩;2)基于余弦距离的Kmeans聚类算法能很好的识别CAE编码后的非线性股价形态特征,并得到符合人类视觉的股价形态归类结果;3)股价形态数据能够对LSTM模型预测股价产生正向边际贡献,但贡献程度不足以抵消高维数据输入带来的模型复杂程度上升,原因可能在于市场中股价变动相较股价形态变动频率更高,高频的股价变动掩盖了投资者基于低频股价形态变动进行的交易行为所产生影响。本文的最大创新点在于提出一种结合CAE卷积自编码器和余弦距离聚类算法的无监督式股价形态归类方法,归类后的股价形态数据具备较强的可解释性,可直接用于研究或金融实务,同时无监督的模型架构也能避免因市场迅速变化带来的数据更新困难问题。本文的最大不足在于引入股价形态数据的LSTM模型在测试集上预测性能提升较小,主要因为本文模型预测股价相对高频(按交易日),但股价形态的转换相对低频,高频的股价变动掩盖了投资者基于低频股价形态转换进行的交易行为所带来的影响。因此,下一步研究的主要方向为如何对股价形态转换频率进行处理,并探究股价形态对股价变动的影响区间。
其他文献
近年来,我国通过一系列政策指引大力倡导绿色发展。“十四五”规划提出,该时期我国的主要目标除了在经济发展方面取得新成效外,还要在生态文明建设方面实现新进步。在此背景下,我国企业尤其是高资源消耗、高能源耗用的重污染企业,开始重视环境保护,并通过绿色并购等方式实现绿色发展。绿色并购是指企业为获取绿色环保生产要素、践行环境保护理念等缘由而发生的并购行为,但其能否真正为企业经营、为保护生态环境或者为我国社会
学位
现如今,“大众创业,万众创新”已成为时代的新浪潮,创新力已成为企业增强竞争力、立足于市场的必要因素,该如何提升企业创新能力是所有企业面临的难题。随着我国人口红利的逐渐消失与投资回报率的下降,我国经济增长方式正从粗放的资源消耗驱动型转变为高质量的创新驱动型。同时,积极利用外资一直是我国对外开放战略的重要内容。改革开放以来,我国不断出台并完善相关法律法规打开了外资在中国资本市场的大门,为外资流入保驾护
学位
绿色信贷作为绿色金融领域的新兴理念,是一种将企业环境风险因素纳入到银行等金融机构的信贷资质审核过程中的创新性金融手段。绿色信贷政策的出台不仅有利于金融资源的合理配置,还能通过释放“绿色信号”鼓励社会各界加强环保意识、实现绿色转型。僵尸企业的生存和发展与政府或银行的信贷补贴息息相关,此类企业的大量存在不仅会对正常企业产生“挤出效应”,还会降低资本配置效率,加剧行业产能过剩。本文的研究问题为:绿色信贷
学位
我国保险行业规模近年已步入20万亿大关,但保费收入与国内生产总值的比值仍明显低于世界平均水平,保险业将会是受到国家和社会重视的朝阳产业。在保险行业中,占主导地位的寿险企业将面临一系列的机遇和挑战,本研究以国内占市场较大份额的上市寿险企业为研究样本,开展企业估值水平影响因素实证研究,为寿险企业提高估值提供相关建议。本研究详细收集和整理了H股上市的全部6家寿险企业2012年至2021年上半年相关数据,
学位
自改革开放以来,中国经济始终保持飞速发展,但在最近几年却遭遇了瓶颈期,为了促进中国经济长期稳定发展,2015年中央提出了供给侧结构性改革,而减税降费是其中的一项关键举措,可以降低企业的生产成本,使企业更有活力。过去中国企业的社会保险缴费率在世界范围内都处于较高水平,给企业带来了沉重的负担,2019年国务院发布通知,将企业养老保险缴费比例下调至16%,有效地促进了企业发展,且在疫情期间帮助企业平稳地
学位
当今社会已经完全处于在了互联网时代,网络游戏产业也正处于高速发展阶段,网络游戏逐渐成为了当代人生活中重要的休闲娱乐活动之一。1980年到2000年出生的这代人见证了互联网技术的成长,而这批人也是正当前国家发展的力量源泉,伴随着当前网络技术的不断研发,“5G”技术的提出和应用,网络传输速度发生质的飞跃,也为网络游戏的飞速发展奠定了良好的基础。在这样的背景下,网络游戏相关产业的规模快速增长,网络游戏具
学位
中国股票市场发展至今已经颇具规模,但散户投资者比例明显偏大。散户投资者由于缺乏健全的知识体系,其决策更容易受非理性情绪影响,导致我国股市中非理性投资行为普遍存在。传统金融学在研究金融现象时均利用了“理性人”这一假设,但是金融市场上存在大量“非理性”的行为与现象是难以用传统金融加以解释的。本文基于行为金融学的投资者情绪理论,尝试从投资者情绪出发对不同市值规模的股价指数之间的联动关系进行分析。传统金融
学位
随着我国城镇化进程不断发展,交通拥堵、环境污染等城市问题愈发严重。为减少小汽车使用及其带来的环境问题,很多城市实施了多项交通需求管理政策,包括公交优先、限行限购、错峰出行等。由于单一政策效果有限,往往采用多项政策联合实施。一方面,政策之间复杂的相互作用使得政策效果有较强的不确定性。另一方面,政策自身的可接受性同样影响政策的实施效果。部分政策因其具有限制作用,遭受较强反对意见而表现出较低的可接受性。
学位
截止于2020年末,我国60岁及以上人口所占比例已经达到了18.7%,65岁及以上人口所占比例已经达到了13.5%,随着老龄化、高龄化程度的日渐加深,对长期护理服务的需求也日趋增多,催生尽快全面建立长期护理保险制度,然而现有的试点地区待遇支付模式五花八门,无法为全国建立长护险制度提供支撑。本文以上海市为研究对象,着重深入系统的剖析试点地区探索长期护理保险的待遇支付模式问题,不仅为上海长期护理保险制
学位
当前,人类社会物质财富极大地丰富,摆脱了以前社会生产力严重不足的窘境。与之截然相反的是,生态环境前所未有的恶劣,对自然的过度开发与利用,使人类遭受了严重的气候与环境问题。由于二氧化碳排放物过多,导致全球变暖,引起极地的冰山融化,海平面也随之上升,人类的活动区域在逐步被压缩,而人口基数却维持在高位水平,全球性生态问题正困扰着人类。提高生态文明的建设,保持我们赖以生存的地球村的环境和谐,逐渐成为全人类
学位