基于Lasso的我国股票价格影响因素分析

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:sosen871213
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自改革开放以来,我国的经济取得快速发展,我国的国内成产总值(GDP)从1990年的18,774.00(亿元)增长到2014年的634,043.40(亿元)。与此同时,我国证券市场也已经得到了较全面的成长与完善,对社会经济发展做出了不可轻忽的贡献。虽然世界上从建立股票到至今已有接近四百年的历史,中国证券市场起步相对甚晚,但成长速度及规模不容小觑。首先,从成交情况看,据中国证监会统计,2013年中国股票成交金额累计468,728.60(亿元),2014年较上年增长58.71%,而2015年截至12月底则累计达到2,550,538.30(亿元),较2014年增长超过200%。其次,就交易活跃度来看,单上海证券交易所而言,2015年的总成交量达1,024,856,267.14(万股),且2015年的日最高成交量达到8,607,174.87(万股)。如此可以这样说,证券中的股票市场行情可以用来反映我国宏观国民经济运行的“晴雨表”,于现代市场经济而言具有不容轻视的作用。而对于中国而言,一个股票市场发起晚,只有20多年股票历史的国家,我国股票市场仍存在诸多变数。2014年12月和2015年一月,市场几乎是在剧烈震荡中度过的,2015年注定是中国股市从疯牛到股灾难忘的一年。从牛市起步到疯牛的形成,再到股灾爆发流动性完全丧失,出现有6天跌1000点、2个月跌3000点的怪象,这一切仅在半年多时间内完成,如梦亦如幻。证券中的股票市场行情是可以反映我国宏观国民经济运行的“晴雨表”,所以研究股票市场价格具有十分重要的意义。本文旨在研究上证综指的风险因素。特别,针对我国国民经济以及股市情况,初步挑出了28个待选因子,这些因子涵盖了体现物价指数、经济景气指数、货币政策、利率政策、财政政策、对外贸易外汇以及体现股市本身交易活动情况的交易量和影响我国乃至世界的道琼斯工业平均指数。多元线性回归模型在研究金融证券股票市场有很好的实用价值,可用于识别及解释多个风险因素对结果变量的影响。在建立多元线性回归模型前,为了详尽地诠释因变量,我们往往事先尽可能多地搜集影响因子,不论是纵向影响还是横向影响,不论直接影响的还是间接影响的,我们都希望加入到模型中,以更好地解释因变量如何受这些因子影响。当因子太多时,一方面,这些因子可能存在多重线性关系,传统的最小二乘回归方法不适用;另一方面,因子太多不利于我们对模型的解释。这时候,岭回归(ridge regression)通过采用L2惩罚对模型的回归系数进行压缩以解决多重共线性问题,得到的模型具有较好的稳定性。但是岭回归终不能将回归系数压缩至0,不能进行变量选择,导致其模型较难解释。但是我们希望从备选因子中挑选出对因变量有显著影响的少量因子,这时候,我们通常采用变量选择方法。传统的变量选择方法包括向前逐步回归(forward regression)、向后逐步回归(backward regression)和结合二者的逐步回归(stepwise regression),这些方法多是基于一些信息量准则,包括AIC和BIC。这些信息准则是一个组合优化问题,当维数很高时,将会出现NP-hard的问题,即计算时间将会随着维数的增加呈现指数的增长,并且这些方法统计性质不清楚。最近,Tibshirani提出的Lasso方法1通过对系数进行L 1判罚,能将某些极小的系数直接压缩至0,自动达到了变量选择的目的,并且同时估计了显著变量的回归系数,同时完成了选择及估计,因此计算极为简单。最近的很多研究(Fan&Li2001以及Fan&Peng2004)显示Lasso方法有相合及渐近正态性。本文结合多元回归模型及Lasso方法识别并估计上证综指的风险因素。特别,本文选取了从2010.01月到2015.12月的上证综指及28个风险因素的月度数据。首先,我们对上证综指数据进行对数变换,以减少其异方差,此外用对数变换后的数据进行建模有更好的解释。其次,我们对数据进行了单位根检验——ADF检验,以考察变量的平稳性。接着,为了探究被解释变量与解释变量的长期均衡关系,本文对因变量和自变量进行了EG协整检验,发现均有协整关系。然后我们继续考查了被解释变量和解释变量之间的格兰杰因果关系,最终结果表明平稳后的解释变量均是上证综指月收益率的格兰杰原因。最后,我们利用标准化的数据进行Lasso建模。为比较,本文的第四部分也给出了基于AIC准则的三种逐步回归方法估计,得到了各个方法下的模型结果并进行了对比。比对显示两种方法均选出了上证综指月成交量增长率、消费者满意度指数同比增量、财政收入增长率以及道琼斯指数月收益率,且对上证综指月收益率显著性影响程度排名前两位的均是上证综指月成交量增长率与道琼斯指数月收益率,这与成交量和收益率是股市市场最重要的两个指标的事实无可厚非。比对结果还显示Lasso方法得到了更好的模型,具体表现在:1. Lasso结果有更好的解释性,Lasso选出的是5个变量,而逐步回归选出了8个变量,并且在汇率方面,逐步回归选出的是港元方面汇率,而Lasso选出的则是最具有代表性的美元方面汇率;2.相对于逐步回归分析方法,Lasso结果有更小的预测误差,拟合效果更优。本文研究显示上证综指月成交量增长率、消费者满意度指数同比增量、美元期末汇率增量、财政收入增长率以及道琼斯指数月收益率5个变量对上海综合指数月收益率有显著影响。
其他文献
目的了解2007—2008年北京市石景山区学校水痘爆发疫情,为制定学校,托幼机构防控措施提供科学依据。方法应用描述流行病学方法分析石景山区2007—2008年学校水痘疫情情况。结果
在现代高层建筑当中,玻璃幕墙的应用较为广泛,其不仅可以有效实现对于高层建筑的外部保护,更能够保证建筑自身的外表美观性.随着玻璃幕墙的应用不断扩大,其所存在的短板问题
目的:比较应用荧光定量PCR与常规方法(用培养法检测解脲脲原体,用胶体金法检测沙眼衣原体)检测分泌物标本解脲脲原体、沙眼衣原体的优缺点。方法:对临床上疑似解脲脲原体(UU)
市场竞争的残酷性,使优胜劣汰成为铁的法则。要在市场竞争中求发展,急需高质高效的竞争情报工作。竞争时代竞争情报已越来越被现代企业所重视,本文对竞争情报工作的渠道、方式、
<正>英国广播公司(BBC)涉嫌在新闻节目中虚构贩卖儿童案。记者假扮卖家向匿称"哈里"的罪犯哈桑提供4万英镑(约63万港元),将小童从保加利亚偷运到英国,并暗中拍下交易过程。保
随着目前我国经济水平的腾飞,工业科学技术等领域的迅猛发展,对工程建筑行业也产生了深远的影响,钢铁产量的逐年提高、钢材性质的不断改进、钢结构设计理论的进步完善和大型
医务人员的吸烟状况及态度有示范作用,直接影响着其他人群的吸烟行为,对控烟工作有重要影响。2003年WHO/中国控烟能力建设项目的调查结果表明,我国医务人员在临床实践中为患者提
SolidWorks三维软件有零件设计、装配体设计、工程图设计等基本功能,并集成了丰富的辅助功能,在送变电工程企业开展铁塔组立技术方案编制时,借助该软件可提升工作效能.在具体