R统计软件在证券收益率的分析与预测中的应用

来源 :金融经济·学术版 | 被引量 : 0次 | 上传用户:wanglaow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  一、R软件简介
  
  R是一个有着统计分析功能及强大作图功能的软件系统,由Ross Ihaka和Robert Gentleman1共同创立。R语言可以看作是由AT&T贝尔实验室所创的S语言发展出的一种方言。因此R既是一种软件也可以说是一种语言。首先,R是完全免费的自由软件,使用者可以在上面随意进行二次开发。它开放源代码,具有很多功能强大的第三方开发的模块。其次,R是一种可编程的语言,使用者可以在R中很容易的写出自己希望执行的程序,不会受固定模块的限制。再次,R具有很强的互动性,输入和输出都是在同一个窗口进行(除了图形输出),这点和SAS有很大的区别。最后,R具有强大的图形输出功能,输出的图形输出的图形不但可以存成JPG、BMP、PNG等主流图片格式,还可以保存为PDF文件。它善于输出各种常用的统计图形,如饼图、直方图、散点图、箱图、QQ图等。
  相比于大家熟悉的统计软件SPSS和SAS,R软件以其高度的灵活自由性正受到越来越多统计学者的青睐。以易用性著称的SPSS和功能强大的SAS软件都包括了很多功能强大的统计分析模块,分析人员必须在它们既定的模块上进行各种分析。但是,随着信息技术的飞速发展,越来越多的统计分析新方法被提出来,尤其是在证券分析领域,使用既定模块分析的统计软件已经不能及时地跟上发展的速度。这个时候就需要人们自己用编程来实现这些新方法,R就提供了这样一个很好的平台。
  
  二、理论基础
  
  1.Markowitz投资组合模型
  假设ri是投资在第i种证券上的收益率,它是随机变量,ui是第i种证券的预期收益率,σij是ri和rj的协方差(σii是ri的方差),wi是投资在第i种证券上的投资比例,则投资组合的收益率∑ri×wi是随机变量,wi是由投资者确定下来的非随机变量,显见∑wi=1,并且根据假设(8)有:wi≥0。则可得到投资组合的预期收益率为E=∑Ni=1wiui,方差为V=∑Ni=1∑Ni=1σijwiwj,或者用相关系数表示为V=∑Ni=1w2iσ2i+2∑1≤i<j≤Nwiwjρijσiσj。
  Markowitz投资组合模型为:
  min∑Ni=1∑Ni=1σijwiwj
  s.t.E=∑Ni=1wiui
  ∑wi=1
  wi≥0,i=1,2,…,N
  Markowitz证券投资模型所基于的的重要假设之一是:证券的收益率ui可以视为随机变量且服从正态分布,其性质由均值和方差来描述。
  2.证券预期收益率的预测方法
  在证券收益率服从正态分布的假设下,我们必须对模型中的一个重要参数——证券的预期收益率做出合理预测。在此,我们介绍预测证券预期收益率常用的两种方法:计算证券收益率的期望值和加权期望值。
  计算证券收益率的期望值,这是Markowitz在其著名的论文《投资组合选择》中所使用的方法。他通过计算最近N周内收益率的期望值作为第N+1周收益率的预测值。而计算加权期望值的方法则有很多,如果投资者认为据目标期时间越近则关系越密切,那么就可以将历史数据中的各时期的收益率进行加权平均,使得据目标期时间越近的收益率的权重越大。这类方法中最常见的当属指数平滑法。指数平滑法的基本公式是:St=αYt+(1-α)St-1,其中St表示时间t的平滑值,Yt表示时间t的实际值,St-1表示时间t-1的平滑值;α表示平滑常数,其取值范围为[0,1]。St是Yt和St-1的加权算数平均数,α的取值大小决定了Yt和St-1对St的影响程度。St具有逐期追溯性质,可探源至S1为止,包括全部数据。在此过程中,平滑常数以指数形式递减,故称之为指数平滑法。平滑常数的取值至关重要,它决定了平滑水平以及对预测值与实际结果之间差异的响应速度。平滑常数α越接近于1,远期实际值对本期平滑值的下降越迅速;平滑常数α越接近于0,远期实际值对本期平滑值影响程度的下降越缓慢。由此,当时间数列相对平稳时,可取较大的α;当时间数列波动较大时,应取较小的α,以不忽略远期实际值的影响。
  
  三、R软件在证券收益率的分析与预测中的应用实例
  
  1.验证Markowitz模型的重要假设:证券收益率服从正态分布
  (1)数据读取
  对于存储在文本文件(ASCII)中的数据,R可以用函数read.table来创建一个数据框,这也是读取表格形式数据的主要方法。例如若包含某证券共100周开盘和收盘指数信息的数据文件“data.txt”存放在D盘上,我们可通过以下命令格式来读取:
  mydatas<-read.table(“d:/data.txt”,col.names(“p0”,“p1”))
  其中数据框名为mydatas,数据框中每个变量被依次命名为:p0,p1,(缺省值为V1,V2……)。
  (2)计算证券的周收益率
  假设某种证券在最近N周内的收益率分别为r1,r2,…,rN,则ri=p1i-p0ip0i×100%,其中p0i表示第i周第一天的开盘价,p1i表示第i周最后一天的收盘价。R中通过对数据框mydatas的变量p1和p0进行运算操作,可计算出用数据框wp存储的周收益率。命令格式为:
  wp=(mydatas[“p1”]-mydatas[“p0”])/mydatas[“p0”]
  通过使用fix(wp)函数,可以对wp的变量名进行修改,使其具有直观的名字,如weekprofit。
  输出结果:
  〉wp
  weekprofit
  11.66087551
  2-0.61299388
  3-0.85826857
   …………
  98 -1.13587649
  99 -0.95793858
  100 -1.51198618
  (3)对周收益率数据进行初步分析
  运用R中的summary和fivenum函数可以得到数据组的汇总信息,并对数据组的数据结构获得初步了解。命令格式:
  summary(wp$weekprofit)
  输出结果为:
  Min. 1st Qu. Median Mean 3rd Qu. Max.
   -1.6070 -0.3188 0.3479 0.3854 1.0790 2.8640
  命令格式:
  fivenum(wp$weekprofit)
  输出结果为:
  [1]-1.6066727 -0.3195476 0.3479232 1.0935828 2.8636463
  (4)作出周收益率的直方图
  为了更加直观的分析周收益率这组单变量数据的分布,我们首先作出柱形图,命令格式为:
  hist(wp$weekprofit)
  
  (5)绘制密度图
  为了更加清晰地分析该数据组的分布特征,我们在柱形图基础上绘制密度图,命令格式为:
  lines(density(wp$weekprofit))。
  
  (6)求周收益率的经验分布函数
  命令格式为:
  ecdf(wp$weekprofit)
  输出结果为:
  〉 ecdf(wp$weekprofit)
  Empirical CDF
  Call: ecdf(wp$weekprofit)
  x[1:100] = -1.6067, -1.5275, -1.512, …, 2.6041, 2.8636
  (7)作出经验分布函数图
  命令格式为:
  plot(ecdf(wp$weekprofit),verticals=TRUE)
  
  (8) 拟合正态分布
  从以上的分析可以看出这个数据组的分布还是与正态分布比较相似的,因此我们拟合一个正态分布,并且使拟合后的图与经验分布函数图相重叠。命令格式为:
  〉plot(ecdf(wp$weekprofit),verticals=TRUE)
  〉x〈-seq(-1.7,3,0.1)
  〉lines(x,pnorm(x,mean=mean(wp$weekprofit),sd=sqrt(var(wp$weekprofit))))
  
  图中的实线便是正态分布的拟和线,由上图可以清晰地看到,拟和后的曲线与原经验分布函数基本吻合。但要具体考察二者的吻合程度,R软件为我们提供了更精确的工具。
  (9) 做出分位比较图(Q-Q图)
  为研究(8)中正态拟和线与经验分布函数的吻合程度,R软件提供了分位比较图(Q-Q图)来完成这个任务。命令格式为:
  qqnorm(wp$weekprofit)
  qqline(wp$weekprofit)
  
  由上图可见,二者具有优良的吻合度,未出现明显的偏离正态期望的长尾区域。
  (10) 正态性检验
  R中提供了Shapiro-Wilk检验和Kolmogorov-Smirnov检验两种正规的正态性检验方法。命令格式分别为:
  shapiro.test(wp$weekprofit)
  ks.test(wp$weekprofit,“pnorm”,mean=mean(wp$weekprofit),sd=sqrt(var(wp$weekprofit)))。
  我们应用Kolmogorov-Smirnov检验可以得到以下输出结果为:
  One-sample Kolmogorov-Smirnov test
  data:wp$weekprofit
  D = 0.0451, p-value = 0.987
  alternative hypothesis: two-sided
  由于检验所得p值非常接近1,由上述分析可以验证证券收益率近似服从正态分布。
  2. 预测证券的预期收益率
  方法一:计算这支股票的期望收益率。以最近时期内的样本期望值来估计得到第N+1周的预期收益率为rN+1=1N∑Ni=1ri,这也是Markowitz在《投资组合选择》中所采用的方法。命令格式为:
   mean(wp$weekprofit)
  输出结果为:
  [1] 0.385416
  方法二:用指数平滑法计算加权期望收益率。如果投资者认为据目标期时间越近则关系越密切,这样就可以将历史数据中的各时期的收益率进行加权平均,据目标期时间越近则权重越大。本文以指数平滑法为例阐述期望收益率的这种估计方法。[2]假设某种证券在最近N周内的收益率分别为r1,r2,…,rN,则在估计该证券的预期收益率时,可以得到这些收益率的追溯预测值1,2,…,N
  i+1=αri+(1-α)i
  1,=r1+r22
  R=N+1
  其中,R表示预期收益率;α表示加权系数,介于0和1之间,由投资者决定。
  注1:一般情况下如果收益率序列{ri}波动不大,则α应取小一点,比如:0.1-0.3;如果收益率序列{ri}波动较大,则α应取大一点,比如:0.6-0.8。
  注2:在实际操作中,可取多个值进行试算,比较它们的MAE=1N∑Ni=1|ri-i|,取较小者为准估计预期收益率。
  在此,我们若取α=0.1,运用R软件提供的自由、灵活的编程环境,作者对指数平滑法预测证券收益率的方法进行了编程,命令格式为:
  〉 r=NULL
  〉 r[1]=(wp[1,1]+wp[2,1])/2
  〉 for(i in 2:100){
   r[i]=0.1*wp[i-1,1]+(1-0.1)*r[i-1]}
  〉 R=NULL
  〉 R=0.1*wp[100,1]+(1-0.1)*r[100]
  输出结果为:
  〉 R
  [1] -0.3395193
  
  四、小结
  
  本文简要介绍了R统计软件的特点,以及如何应用R软件检验Markowitz模型的重要假设:证券收益率近似服从正态分布。我们先后求出了证券的周收益率,做出了柱形图,求出了密度函数,经验分布函数,进行了正态分布拟合,用分位比较图验证了吻合程度,最后应用Kolmogorov-Smirnov法进行了正态检验。接下来又运用R软件,通过自由编程,结合期望值法和指数平滑法分别对证券的预期收益率进行了预测。通过分析我们看到 R软件在证券分析中的应用非常自由、方便、有效,在进行证券分析与预测时具有广泛的应用空间。但R并不局限于解决某一类问题,在证券的数据分析中,还可以应用于各类概率分布的拟和,如logistic分布、Poisson分布等,并进行相关的假设检验。此外,R除了具有可以与其他商业软件相媲美的统计分析功能,还为广大的用户提供了一个强大灵活的编程平台,这无疑为证券分析学者提供了一个灵活而自由的创新空间。
  (作者单位:厦门大学数学科学学院)
  注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文
其他文献
一、基本理论、事实和研究假说    1.基本理论  美国新古典主义经济学家瓦伊纳(1923)认为倾销实际就是一种全国性市场之间的价格歧视,即对同一消费者或不同消费者以不同价格出售不同单位的同一商品。这一定义首次把倾销与具有补贴性质的出口奖励区分开来,指出倾销是指企业在不完全竞争市场上具有分割国内市场与国外市场的能力,通过不公平的价格手段获取最大的利润。  国际贸易原理也认为各国相同产品的价格不同是
期刊
摘要:通过分析三起在国际上影响巨大的商业银行操作风险事件,并结合近几年中国商业银行操作风险损失案件,总结出中国商业银行操作风险的特点,最后得出国外商业银行操作风险事件对中国的启示和加强中国银行操作风险管理的对策。  关键词:国外;操作风险事件;中国;操作风险管理;启示    20世纪90年代以来,国际上发生了多起影响巨大的商业银行操作风险事件,本文在此选取三起非常典型的操作风险事件进行分析,以期通
期刊
一、引言    给定标的资产的信息,研究这个标的资产的衍生证券的价格是经济研究的一个核心问题,假定标的资产遵循布朗运动,运用无套利理论,Black-Scholes公式给了我们一个非常明确的答案,这时候也会产生一个问题,对于标的资产价格变动不做任何假设的话,仅仅使用无套利理论,那么:已知标的资产的K个时刻的价格,由此得出衍生证券一般收益函数,问这个衍生证券价格的最可能的最好的界是多少?  Cox和R
期刊
一、模型简介    Merton提出了下面的股票价格模型  dStSt-=(θ-λμ)dt+σdWt+d(∑Nti=1(eXt-1))(1)  这里θ,σ,λ,μ均为常数,其中θ为股票的期望收益率,σ为无跳情形下股票波动率,μ为股票价格的预期跳跃百分比,即μ=E(eX-1),Nt为强度λ的Poisson过程,λ也即瞬时发生率。令  Yt=∑Nti=1(eXi-1
期刊
一、信贷结构与经济发展现状    (一)信贷投入有效推动了地方经济的发展,并在一定程度上促进了地方经济结构的调整和转型。    统计数据显示,2005-2007年,辖内信贷总量分别为852.85亿元、902.04亿元、986.23亿元,年均增长7.54%。信贷投入有效的支持了地方经济发展,2007年,岳阳、常德、益阳、娄底四市生产总值达2636亿元,五年来年均增长20.1%,其中全社会固定资产投资
期刊
一、PEG(市盈率增长率比率)的概念    PEG是综合考察价值和成长性的最为普遍的方法之一,用它可以找出相对于盈利增长率市盈率较低的股票。它通常被简化表示为市盈率除以预期投资盈利增长率。  关于PEG指标起源的说法众说纷纭,但将PEG选股法发扬光大的却不是它的发明者,而是华尔街投资大师彼得·林奇。林奇在《战胜华尔街》(lynch 2000)中指出,PEG方法是其选择股票的主要技术方法,任何公司在
期刊
一、引言    金融学界对于市场异象的研究和讨论开始于20世纪60年代,金融异象的发现对传统金融学的理论基础——资本资产定价模型(CAPM)和均值方差投资组合理论以及效率市场假说(EMH)等都提出了质疑,并成为了金融学者关注的焦点。Fama(1998)虽然坚持市场是有效的,但也不得不承认已有两个持续存在的异象,在有力地挑战“有效市场”范式,其中一个就是盈余公告效应。盈余公告效应指的是:上市公司财务
期刊
一、引言    本文结合保监会规定的偿付能力11个监管指标,从业务稳定性、流动性、盈利能力、业务增长能力、资产投资能力五个角度确认评价指标。利用主成分分析法,对众多影响指标进行筛选,采用最有效的指标对国内主要存在的财险公司的偿付能力进行分析。    二、偿付能力边际的界定    保险公司偿付能力一般分为最低偿付能力、法定偿付能力、实际偿付能力三类。  最低偿付能力边际是保险公司为了能够承担所负的责
期刊
在我国实行土地集体所有制和家庭联产承包责任制的农村土地制度总体框架下,土地流转作为农村基本经营制度的重要补充,也是市场经济下资源配置的有效形式。但土地流转毕竟是农村土地变革的新生事物,对经济金融既有积极因素,也有负面影响。为此,人民银行衡阳市中心支行近期对衡阳市辖内2个行政村进行了典型调查,初步掌握第一手资料,并试图探索我国农村土地流转的有效途径,推动农村经济又好又快发展。    一、农村土地流转
期刊
一、郴州市农村信用社经营管理现状    自2004年8月湖南省农村信用社改革试点工作启动以来,郴州市农村信用社系统业务经营和内控管理进一步加强。目前,以央行专项票据支持为基础的农信社改革工作进展顺利,全市农信社系统金融运行基本稳健,总体呈现质量、效益、速度协调发展的良好态势。  1.资本约束和风险防范机制逐步建立,抵御风险能力得到加强。主要表现在两个方面,一是资本实力增强,股权结构保持稳定。200
期刊