论文部分内容阅读
本文通过将变量选择方法应用于从沪深300(CSI300)股票里选择部分股票的研究中,以建立与CSI300股指期货同时操作的现货组合,为投资者提供一种新的选择股票构造现货组合的方法,本文所运用方法与以前所运用的凭主观和经验选择股票构造现货组合的方法有着实质上的区别,文中所用方法是从CSI300股指期货和CSI300股票数据的特征出发,利用数理统计模型筛选变量,从而更客观的分析,以选择出更适合于利用CSI300股指期货做套期保值或者套利的现货股票组合。本文利用2014年9月25日CSI300股指期货与CSI300股票的分钟高频数据作为实证分析的对象,将八种变量选择方法应用于从CSI300股票中选择部分股票的研究中,然后根据最终选择出的股票与CSI300股指期货建立的回归模型的R值,将模型选择的效果进行了排列,根据研究过程以及研究结果,发现不同的方法选出的股票数量与精度均有所不同,同时逐步回归、Lasso+逐步回归这两种变量方法的回归决定系数R值均有0.64左右,不仅说明其对期货市场运作及投资股票取得收益都具有一定的积极作用,并且也是对此前偏重主观性和经验性的相关研究的全新突破。本文得出了如下结论:1、本文具体实例研究中的模型效果比较如下:Lasso+逐步回归>逐步回归>加权的Lasso>加权的Group-Lasso> SIS-Lasso=加权的SIS-Lasso,需要说明的是还有两种方法由于方法的局限性,未能成功做出变量选择的结果。2、在高维变量选择中,传统的AIC、BIC准则有着局限性。在实证研究中,通过对程序运行过程的分析发现Lasso、Group-Lasso,之所以不能直接选择出较好的股票组合,是因为模型中的AIC、BIC等准则不能做到在较优的地方取得最优值,因此,关于如何改进或者设置高维变量选择模型中选择准则是一个有待继续研究的问题。3、从变量选择的角度出发,通过统计方法选择股票具有可行性。在之前的研究中,更多的是通过主观性方法或者经验性方法选择股票,不是通过从数据特征的角度分析,选择股票构造股票组合,在本文的研究中,成功将变量选择方法应用于构造现货股票组合里。