【摘 要】
:
股票市场预测是金融界最热门、最有价值的研究领域之一,随着交易所电子交易系统的快速发展,股票交易中的订单处理时间急剧缩短,在几分钟或几秒钟内执行指令的高频交易激增。股票价格,尤其是高频的日内股价,其非线性和时变性使得预测具有很大难度,传统的预测方法通常会对数据施加一些非常严格的数学假设,在现实世界中也就很难应用起来。机器学习方法有着超高的计算效率,在生活服务、企业管理和金融科技等领域表现亮眼,学术研
论文部分内容阅读
股票市场预测是金融界最热门、最有价值的研究领域之一,随着交易所电子交易系统的快速发展,股票交易中的订单处理时间急剧缩短,在几分钟或几秒钟内执行指令的高频交易激增。股票价格,尤其是高频的日内股价,其非线性和时变性使得预测具有很大难度,传统的预测方法通常会对数据施加一些非常严格的数学假设,在现实世界中也就很难应用起来。机器学习方法有着超高的计算效率,在生活服务、企业管理和金融科技等领域表现亮眼,学术研究中也有越来越多的学者开始使用机器学习方法对股价进行预测研究,并取得了较好的实证结果。输入指标,被用作机器学习器的输入,其中一个关键问题是如何确定一套富含信息且具有区分性的输入指标,但如何确定更有价值的输入指标从而提高预测准确率仍有待研究。本文尝试对沪深300指数的每分钟数据进行分析研究,采用传统计量方法和机器学习方法对指数未来5分钟的涨跌情况进行预测,实证检验高频数据下机器学习方法能否取得优于计量ARMA模型的预测结果,并着重讨论相对比DIS(固定指标输入法),适应数据变化的AIS(自适应指标输入法)能否改善机器学习方法的预测准确率,进而探寻得一种更优的输入指标方法。为了充分验证实证结果,本文也对上证指数和深圳成指两只股指的涨跌情况进行了预测研究,检验基于沪深300指数数据得出的实证成果是否具有普适性。论文选用数据为2020年10月1日至2020年11月30日沪深300指数、上证指数和深证成指3只指数每分钟的价格数据,累计共有37个交易日,每只指数每日240个指数价格数据累计共8880个数据。输入指标上沿用了8个经典的价格类输入指标,分别为相对价差RDP、移动平均MA、指数移动平均EMA、相对移动平均偏离率DISP、相对指数移动平均偏离率EDISP、移动平均变动率OSCP、指数移动平均变动率EOSCP和相对强度指数RSI。而输入指标方法选用了DIS(固定输入指标法)和AIS(自适应指标输入法),其中DIS法基于上述8类输入指标基础,其时间参数选取了前人研究中实证结果较好的一些参数,累计共有23个输入指标,AIS则相应地扩大了输入指标的时间参数,以便在选取输入指标时能考虑到最优的输入指标,而DIS和AIS输入指标的优劣排序则参考T检验者和信息增益IG值。确定每组实证数据的输入指标后,先将训练集数据分别输入到支持向量机SVM和XGBoost中进行学习训练,最后对测试集数据进行预测并检验模型预测的准确率,在实证过程中将进行滚动预测,每6天为一组实证数据,其中前5天为训练集数据,之后的第6天为测试集数据,依次类推进行滚动预测,共涉及32组实证数据。实证结果表明:(1)沪深300指数、上证指数和深证成指的最优预测模型一致,都是以信息增益IG值为排序标准并通过AIS(自适应指标输入法)确定输入指标,然后采用支持向量机进行预测的模型;(2)对比计量模型与机器学习模型的实证结果可知。支持向量机的整体预测效果最好,在运算速率上XGBoost远优于支持向量机模型和ARMA模型,在预测准确率上支持向量机SVM的预测结果优于ARMA模型和XGBoost,其中XGBoost模型的表现最差,且支持向量机具有较好的预测稳定性;(3)对比DIS与AIS两个输入指标方法可知,相比于DIS法,适应数据变化的AIS方法能显著提高机器学习模型的预测准确率,且AIS方法下预测稳定性得到了小幅改善。本文在总结学习前人的宝贵研究成果上,对沪深300指数高频数据的涨跌情况进行预测研究,并重点讨论了机器学习方法下DIS法(固定指标输入法)和AIS法(自适应指标输入法)能否提高机器学习的预测准确率,丰富我国基于高频指数数据的机器学习方法的研究,并对提高输入指标的有效性的方法进行了验证,具有一定的理论意义和实践意义。
其他文献
近年来,中国产业数字化规模屡创新高,数字化已成为促进国民经济发展的不可或缺的动力之一。为了迎接消费者日新月异的需求变化,在竞争激烈的市场中存活,传统产业积极进行数字化转型,个体经济逐渐向平台经济转换。平台经济,作为一种在线新经济,最终目的是为提振消费。我国消费市场目前呈现出数字化、智能化、平台化的明显特征。消费者随着收入增加,消费理念和模式产生转变,从过去的衣食住行为主的商品性消费转变为更多地进行
我国在构建现代医疗卫生服务体系的过程中,医疗服务工作不断取得突破性进展:医疗卫生服务体系所覆盖的居民规模逐步扩大,医疗服务的可及性不断提高;卫生科学和医疗专业技术水平进一步提升,疾病预测和疫情应急防治的能力也在不断提高;人民群众的健康状况明显进步,居民身心素质等各个方面指标均位于发展中国家之前列。但随着近年来我国医疗费用的不断增长,看病困难和看不起病的现象仍旧普遍存在,这引发了学者们对政府卫生健康
疫情期间,央行为提振实体经济持续性放水,以致我国金融市场呈现流动性较为宽松形态。宽松的流动性环境推高了房地产和资本市场产品价格的同时,也埋下了未来流动性缩紧,资产价格跳水的隐患。因此,对于商业银行流动性创造的研究被推上了风口浪尖。随着金融市场地不断发展演进,银行的多元化发展与多元化经营的趋势已逐渐形成,而银行业务多样性会对商业银行的流动性创造构成怎样的影响引起了学者的好奇与关注。此外,近年来越来越
长期以来,中国执行严格的股票发行核准制,导致出现“IPO堰塞湖”问题,数百家企业需要长时间的等待排队上市。IPO等待时间长与A股市场不完善的退市机制,造成中国市场出现特有的“壳价值”问题。如何给资产给予合理的定价是金融学中的核心问题之一,而中国市场过高的壳价值干扰了市场资产定价的效率,导致在国外适用的资产定价模型在国内“水土不服”,因此,为了提高金融资源得到有效的配置,国家进行强有力的注册制改革,
中共十九届五中全会明确提出,要把坚持创新摆在我国现代化建设全局的核心位置,以科技自立自强作为国家发展的战略支撑。受到市场失灵和研发融资约束的影响,企业选择的研发投入力度往往低于社会最优水平。因而近年来我国投入大量财政资金以实施财政补助和税收优惠这两类财税政策,尤其重视对高新技术企业的扶持,旨在弥补企业边际研发成本,提高企业创新能力。然而现有文献对于前述两种财税扶持政策的创新激励效应存在争议,一些研
货币政策是国家宏观经济政策的一个不可缺少的组成部分。有效发展经济的一个必要条件是明确的货币和金融监管机制为了能够影响企业活动,总需求,信贷市场的状况,稳定货币流通。因此,货币政策是宏观经济管理的一个关键要素。理想的情况下,国家的货币政策要保证物价稳定性,高居民就业率,国际收支稳定,经济增长——这些都是国家最高及最终目标。然而,在实践中,它还必须解决更为狭窄的、符合国家经济迫切需要的问题。目前俄罗斯
劳模精神作为劳动精神的集中体现与人格化表达,是中国共产党人精神谱系的重要内容,是社会主义精神文明建设的重要文化资源。通过完善课程设置、丰富教学资源、拓展教学方法夯实校内课堂,通过巩固物质文化承载、依托纪念活动仪式、运用劳动教育实践丰富校园文化,通过运用多媒体网络技术、把握社会舆论导向、立足家风家训教育优化校外课堂,“三课堂”联动不断增强劳模精神育新人的协同性、多样性与有效性,对于青年一代养成“崇尚
随着科学技术的快速进步和我国供给侧改革的不断推进,科创型中小企业登上发展的舞台,发挥出重要作用。但是,科创型中小企业在融资方面的待遇似乎与其为经济发展做出的贡献并不匹配,其融资现状也成为政策制定者关注的重要问题。作为融资的供给方,商业银行在支持科创型中小企业发展时面临着很多难点和痛点,无法在新兴产业上找到合适的切入点也限制了商业银行利润增长。另外,随着风险投资和私募股权投资在我国快速发展和加速洗牌
新常态阶段经济增速变慢,结构性矛盾突出,固定资产投资增速下降,面临产业转型升级的困难;企业融资难、融资贵的问题制约了设备更新与技术进步。为了解决现阶段经济发展过程中的各种问题,“三去一补”的供给侧改革应运而生。作为供给侧结构性改革的一个重要部分,刺激投资的税收手段作用凸显。固定资产加速折旧政策通过增加企业折旧抵税现值,递延了企业纳税时间,相当于一笔国家给予的无息贷款。2014年加速折旧政策在开始在
习近平主席多次在讲话中提到,我国正处于由高速发展向高质量发展转变的阶段,因此股票市场也应该加快推进高质量发展的进程。进入二十一世纪,我国公共卫生事件时有发生,例如2003年的非典、2009年的甲型H1N1流感和2020年的新冠肺炎。重大公共卫生事件不仅关系到公共卫生安全,也关系到国计民生和金融稳定,从统计资料看,各次重大公共卫生事件都对人类社会各个方面产生了巨大的影响,对经济活动也造成了巨大冲击。