基于TEI@I的股价中长期变动趋势预测

来源 :中央财经大学 | 被引量 : 0次 | 上传用户:pjzh210427
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
股票市场是一个受众多因素影响的复杂系统,能在一定程度上反映着经济的繁荣与衰退。股票市场变动趋势的预测分析是金融、管理和统计学领域的研究热点问题之一,针对来自于股票市场的数据特点,研究者提出了各具特色的预测模型,从传统时间序列预测方法到如今的各种深度学习算法,越来越多的研究者投入到股票市场变动趋势的研究中。股票市场上股价变动趋势的预测在宏观和微观方面都具有重要的现实意义,宏观方面,对股票市场变动趋势的预测和把控是政府相关部门制定市场干预政策的重要参考,微观方面,对股价变动的准确预测既有利于投资人对投资策略的优化,也有利于公司内部经营状况预警。为了进一步提升股价变动的预测精度,本文借鉴TEI@I方法论的核心思想,构建了一种股价中长期变动预测模型MLT-TEI@I(Medium-Long Term Prediction Model on TEI@I:MLT-TEI@I)。由于TEI@I方法论在复杂系统预测方面具有良好效果,而深度学习算法相较于传统机器学习算法在数据集的非线性特征提取上更有优势,因此,本文借鉴TEI@I方法论先分解后集成的思想,将深度学习算法融入到该方法论中。具体来说,首先使用线性回归模型分解出自变量与预测变量之间的线性关系;接着使用深度森林算法对线性预测残差(即自变量与因变量之间的线性关系不能解释的部分)进行拟合;同时为了更好地拟合自变量与因变量之间的非线性关系,使用深度森林算法直接对数据集因变量进行预测;最后结合不同行业指数使用ANN算法将上述预测结果进行非线性融合,得到最终的预测结果。MLT-TEI@I预测模型以股票的次年涨跌值为响应变量,以影响股价变动的行情因子、财务因子、宏观经济因子等相关指标为解释变量,利用股票当年度的相关因子来预测股票下一年的涨跌趋势。考虑到不同行业的股票具有不同的变动特征,并结合实际数据可获取情况,本文选择了数据量相对较大的软件服务、化工原料、专用机械、元器件及电气设备共5个不同行业的股票数据进行建模分析,对股价的次年涨跌大小进行预测,不仅分析了PCA降维对股价预测效果的影响,还对比了本文模型与深度森林、随机森林、XGBoost和ANN这四种常见算法在预测效果上的差异以说明本文模型的有效性。为了验证MLT-TEI@I模型在不同数据集上预测结果的相对准确性与稳定性,本文不仅将模型分别应用于各行业数据集,同时也应用于5个行业的合并数据集上对比模型预测效果,并通过多次划分训练集与测试集从而进行多次实验来对比模型预测结果。本文在建模过程中考虑到所选择的部分指标之间存在较强的线性相关性,容易导致模型的过学习,因此在建模前使用PCA对指标进行了降维处理。在对模型预测结果进行评价时,本文选择了回归模型中最常用的RMSE来衡量模型预测精度。从实证结果上来看,降维可以有效提升模型在测试集上的预测效果,大大减轻模型在训练集上的过学习情况,降维前MLT-TEI@I模型在6个数据集上的平均RMSE为12.37,降维后的平均RMSE为7.77,降维后预测精度(RMSE)提升了37.20%。在实证研究过程中,本文还使用了贝叶斯优化方法来对部分重要参数进行优化,结果表明,贝叶斯优化方法在一定程度上提升了深度森林的预测效果,但在部分数据集上提升效果有限。从方法对比上来看,MLT-TEI@I模型的预测准确性优于其它算法,具体来说,MLTTEI@I模型在6个测试集上预测结果的RMSE较深度森林模型平均提升了6.52%,较随机森林、XGBoost、ANN分别提升了21.13%、15.92%、49.18%,且在不同行业的数据集上有不同的提升效果,这表明,本文构建的MLT-TEI@I模型较深度森林、随机森林、XGBoost和ANN这四种常见算法的预测精度更高,预测稳定性更强。此外,MLT-TEI@I模型在分行业预测时的精度比不分行业预测的精度更高,这说明不同行业数据集之间的差异会影响到模型的拟合效果。为了进一步验证本文所构建的MLT-TEI@I模型在中长期股价变动预测上相较于其它算法的优势,本文对数据集进行多次划分训练集与测试集并多次构建模型,计算不同划分下上述模型预测的准确性与结果的稳定性,以降低随机划分对实验结果的影响。从多次实验结果来看,无论是分行业的数据集还是行业混合数据集,MLT-TEI@I模型相较于其它算法均表现出了更高的预测精度与更强的预测稳定性。论文的结构如下:第一章是本文的绪论部分,主要介绍了文章的研究背景、目的及方法;第二章总结了股价变动趋势预测的研究现状,主要介绍了机器学习方法在股价预测中的发展;接着第三章对MLT-TEI@I模型中所涉及的主要算法进行了简要介绍,包括TEI@I方法论、深度森林等算法的主要思想;第四章是本文的实证部分,也是本文最核心的部分,详细介绍了从数据获取、数据预处理、描述性统计分析到MLT-TEI@I模型构建的过程;最后对全文进行了总结与展望。
其他文献
房建深基坑开挖支护技术是现代房屋建筑工程实施中应用的关键技术。经过理论分析和实践讨论,针对某房建项目深基坑开挖支护技术进行研究。该文总结了深基坑支护基坑开挖、基坑支护以及基坑排水等多项工艺要点,从中把握各项工艺要点,不但对后续的工程施工非常重要,而且有助于深基坑开挖支护工艺的应用推广。
期刊
十九世纪末二十世纪初,在世界发展迎来高度发达的物质文明的同时,自然环境、资源面临崩溃的危机,以“褐色经济”为主导的传统经济模式难以为继。一方面污染物排放和资源过度开发对环境的破坏,引发了温室效应等全球性的生态危机。另一方面对资源的强依赖性导致能耗产业的发展难以长期持续,例如二氧化碳、水资源等面临着供给到顶但仍然无法满足增长的需求。因此,推动经济模式绿色化转型、发展绿色经济是人类必须要走的路。绿色经
学位
居民消费价格指数(CPI)与我国居民日常生活息息相关,反映着国家宏观经济的运行情况,为宏观调控提供参考,对CPI进行准确的预测十分重要。但CPI具有滞后性和非线性时序特征,准确预测难度较高,对CPI的预测研究也成为了难点和热点。CPI预测的方法层面,时间序列等线形模型已经得到广泛应用并取得了一定的研究成果,而随着机器学习和深度学习方法的兴起,非线性的预测模型开始进入研究者的视野。LSTM模型更是因
学位
秦岭-桐柏-红安-大别造山带,西连祁连-昆仑造山带,共同构成了一条横贯我国几千公里的中央造山系。该中央造山系也是全球范围内规模最大的高压-超高压变质带之一,是近三十年来国际上研究高压-超高压变质作用以及大陆深俯冲的重点区域。秦岭-大别造山带作为中央造山系的重要组成部分,带内出露了大量不同年代的高压-超高压变质岩石,这些高级变质岩成为研究大陆边缘深俯冲变质作用、造山带构造演化的关键岩石样品。在秦岭造
学位
在经济环境、技术进步、政策支持等多因素综合驱动下,我国物流业发展规模日益壮大,物流产业集聚目前作为一种客观现象,对推动物流绿色高效发展有着重要潜在的影响。与此同时,物流产业所引起的能源消耗与碳排放的问题依然凸显,在国家整体碳减排压力下,提升物流产业碳生产率显得尤为紧迫。而其中物流产业集聚所带来的外部效应为物流业实现绿色高效发展提供了可能的实现路径。因此,本文聚焦物流业集聚对物流业全要素碳生产率的影
学位
奥陶纪生物大辐射是一次大规模、影响深远的重大海洋生物演化事件,此期间古生代的动物群演化完成了对寒武纪大爆发的全面替代。然而,以往的研究主要集中在奥陶纪海洋动物方面,对于重要海洋初级生产者藻类的研究涉及甚少,尤其是对于钙质红藻的多样性演化及古生态特征缺乏清晰的认识。耳壳藻类(Peyssonneliaceans)是现今分布在世界各地热带至亚热带浅海环境中的一种皮壳状红藻,与大多数附生红藻一样以岩石或微
学位
全球变暖背景下,各国响应号召启动碳排放交易市场,来完成各自国家的温室气体减排目标。2013-2014年间七大区域碳交易市场的陆续上市,全国碳交易市场2021年正式开市。碳排放交易市场作为市场型环境规制工具,通过碳交易价格内化碳排放成本刺激创新和减排,长期将成为影响企业经营的重要影响因素。碳排放权交易能否激励企业研发创新,对于不同企业特性、不同资源禀赋、不同外部环境是否存在差异,尚未达成一致结论。研
学位
马斯洛的需求层次理论指出,人在满足基本生理需求的基础上,逐渐形成更高层次的需求。我国目前已全面解决吃饭、穿衣等基本生活问题,居民对美好生活的需要愈发重视,对高质量生活愈发关注。休闲时间作为享受美好生活的时间,是我国居民享受高质量生活的基础,也是居民经济福利中重要的一部分。暂缓工作和家庭劳动,休闲行为是为了追求生活的满足,能够有效提升我国居民的幸福感,获得效用。享受休闲时间,就相当于享受了一定的经济
学位
根据古生物化石的形态结构破译其功能,是重建古生物生活方式的重要内容,具有重要的古生态学研究意义。但是,由于化石保存不完整、缺乏可对比的现生类群等因素,其形态功能的研究通常是定性的推测,缺乏定量分析的工作。得益于古生物数字化的快速推进,通过建立三维模型,计算流体力学(computational fluid dynamics简称CFD)能够实现化石形态与功能的定量分析,对验证现有假说具有重要作用。刺细
学位
真核多细胞藻类作为地球生态系统的重要组成部分,其起源和演化得到了广泛的关注和研究。埃迪卡拉纪陡山沱期和寒武纪第3–5(乌溜)期藻类化石有丰富的文献记录,而寒武纪幸运期(第1期)藻类化石少有报道,为深入认识这一时期海洋生态系统营养结构造成了困难。宽川铺生物群产出于陕南寒武系纽芬兰统宽川铺组,其中保存了大量三维立体磷酸盐化的微体化石,如小壳化石、动物胚胎、蓝细菌以及藻类等,为研究寒武纪早期海洋动物门类
学位