论文部分内容阅读
【摘要】估计模型的参数值最常用到的方法就是最小二乘法(OLS),但是这种方法的假设众多(比如:同方差,不存在自相关等),当这些假设条件并不能满足的时候要研究估计量或者统计量的有限样本分布特征的时候最常用的方法之一就是蒙特卡洛模拟。
本文将主要讨论应用蒙塔卡洛模拟来估计任意函数的期望值的置信区间的基本原理,并应用R语言来计算一个具体的函数的期望的置信区间,并对得到的结果进行简要的分析。
【关键词】蒙特卡洛模拟 R语言 期望值 置信区间
一、基本原理
(一)定义
蒙特卡洛(Monte Carlo)模拟是一种通过设定随机过程(数据生成系统),反复生成随机序列并计算参数估计量和统计量,进而研究其分布特征的方法。
在应用蒙特卡洛模拟的过程中重复生成随机序列的过程越多,估计出来的参数统计量和估计量就越接近真实值,所以蒙特卡洛模拟得到的是一个最优解的近似值而不是最优解。
(二)运用蒙特卡洛模拟估计期望和标准差的基本原理
假设我们给出一个随机变量X,我们想求解任意的函数g(·)的期望Eg(X)。如果我们能得到n个伪随机数(通过计算机声称的随机数成为伪随机数)X1,X2,…Xn从分布X中,我们可以考虑用g(xi)的样本均值来近似估计期望Eg(X):
二、简单应用
下面用一个简单的例子来通过R语言实现运用蒙特卡洛模拟估计一个函数的期望Eg(X)。令Y=g(X)=eβX,其中,假设X~N(0,1),β=5。
三、结果分析
由上面的结果可以看出来通过蒙特卡洛模拟估计出来的期望Eg(X)的置信区间过大,因此是没有意义的。
造成这个结果的原因主要有两个:第一个是因为g(X)本身存在的巨大的波动性,如果Y=g(X)本身的波动性很大,那么通过蒙特卡洛模拟来估计其参数就无法提供有效的信息。第二个是因为样本的波动性使得估计出来的参数值的可靠性降低了。基于以上两个原因,在重复了n=1000000之后并没有达到渐进正态性,所以标准误差的估计值并不是无偏的,自然我们估计出来的置信区间就是没有太大意义的。
如果我们将重复的次数n的值扩大10倍,即令n=10000000重新運行代码那么得到的置信区间为:
并且可以得到图3.1,从图形中可以看出在扩大了重复的次数之后置信区间明显缩小了,并且目标真实的参数值和通过蒙特卡洛模拟估计出来的参数值之间的差距明显缩小。但是置信区间依然很大,这是因为蒙特卡洛估计向波动性很大的目标真值收敛是非常缓慢的,所以扩大重复的次数虽然起到了一定的缩小置信区间的作用,但是得到的置信区间依然意义不大。
参考文献
[1]SM lacus:Simulation and Inference or stochastic Differential Equations [M].Springer,2008.
[2]张晓峒:蒙特卡洛模拟[Z].2012.
本文将主要讨论应用蒙塔卡洛模拟来估计任意函数的期望值的置信区间的基本原理,并应用R语言来计算一个具体的函数的期望的置信区间,并对得到的结果进行简要的分析。
【关键词】蒙特卡洛模拟 R语言 期望值 置信区间
一、基本原理
(一)定义
蒙特卡洛(Monte Carlo)模拟是一种通过设定随机过程(数据生成系统),反复生成随机序列并计算参数估计量和统计量,进而研究其分布特征的方法。
在应用蒙特卡洛模拟的过程中重复生成随机序列的过程越多,估计出来的参数统计量和估计量就越接近真实值,所以蒙特卡洛模拟得到的是一个最优解的近似值而不是最优解。
(二)运用蒙特卡洛模拟估计期望和标准差的基本原理
假设我们给出一个随机变量X,我们想求解任意的函数g(·)的期望Eg(X)。如果我们能得到n个伪随机数(通过计算机声称的随机数成为伪随机数)X1,X2,…Xn从分布X中,我们可以考虑用g(xi)的样本均值来近似估计期望Eg(X):
二、简单应用
下面用一个简单的例子来通过R语言实现运用蒙特卡洛模拟估计一个函数的期望Eg(X)。令Y=g(X)=eβX,其中,假设X~N(0,1),β=5。
三、结果分析
由上面的结果可以看出来通过蒙特卡洛模拟估计出来的期望Eg(X)的置信区间过大,因此是没有意义的。
造成这个结果的原因主要有两个:第一个是因为g(X)本身存在的巨大的波动性,如果Y=g(X)本身的波动性很大,那么通过蒙特卡洛模拟来估计其参数就无法提供有效的信息。第二个是因为样本的波动性使得估计出来的参数值的可靠性降低了。基于以上两个原因,在重复了n=1000000之后并没有达到渐进正态性,所以标准误差的估计值并不是无偏的,自然我们估计出来的置信区间就是没有太大意义的。
如果我们将重复的次数n的值扩大10倍,即令n=10000000重新運行代码那么得到的置信区间为:
并且可以得到图3.1,从图形中可以看出在扩大了重复的次数之后置信区间明显缩小了,并且目标真实的参数值和通过蒙特卡洛模拟估计出来的参数值之间的差距明显缩小。但是置信区间依然很大,这是因为蒙特卡洛估计向波动性很大的目标真值收敛是非常缓慢的,所以扩大重复的次数虽然起到了一定的缩小置信区间的作用,但是得到的置信区间依然意义不大。
参考文献
[1]SM lacus:Simulation and Inference or stochastic Differential Equations [M].Springer,2008.
[2]张晓峒:蒙特卡洛模拟[Z].2012.