Matlab统计工具箱的若干优化补充

来源 :计算机辅助工程 | 被引量 : 0次 | 上传用户:maiapink
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:针对Matlab 6.5统计工具箱没有优化正态总体方差的区间估计,且没有给出正态总体方差检验的问题,通过编写Matlab程序,优化统计工具箱对正态总体方差的区间估计,开发正态总体方差的假设检验算法. 实例表明该方法在推断统计方面实用性较强.
  关键词:Matlab; 统计工具箱; 区间估计; 假设检验
  中图分类号:O212.1;TP311.52
   文献标志码:A
  
  Optimization and supplement on Matlab statistics toolbox
  YOU Wenjie1, 2a, DENG Liangzhang2b, 3
  (1.Fuqing Branch, Fujian Normal Univ., Fuqing Fujian 350300, China; 2.a.College of Computer & Info. Eng.;
  b. College of Mathematics Sci., Xiamen Univ., Xiamen Fujian 361005, China;
  3.Fujian Polytechnic of Info. Tech., Fuzhou 350003, China)
  Abstract: The interval estimation on variance of normal distribution isn’t optimized in Matlab 6.5 statistics toolbox, and it doesn’t provide hypothesis testing on variance of normal distribution. So a Matlab program is developed to optimize interval estimation on variance of normal distribution, and provide arithmetic of hypothesis testing on variance of normal distribution. The examples show that the method has better practicability on deducing statistics.
  Key words: Matlab; statistics toolbox; interval estimation; hypothesis testing
  
  0 引 言
  
  Matlab应用于统计分析上所具有的操作简单、接口方便、扩充能力强等优势是其他软件(SAS,SPSS等)不可比拟的,再加上其应用范围广泛,因此在统计应用上占据极其重要的地位.Matlab 6.5统计工具箱(Statistics Toolbox)[1]加强Matlab在统计分析方面的功能,并提供250种以上的运算功能以及易于使用的接口,让使用者能够轻松分析历史资料、构建数据模型、仿真系统并发展统计算法.
  参数估计和假设检验是数理统计最基本的方法.Matlab统计工具箱在正态总体方差的区间估计并非最优,并且没有给出正态总体方差的检验.本文针对该缺陷进行优化,并发展统计工具箱在正态总体方差的假设检验算法.
  
  1 基于Matlab的正态总体方差区间估计算法的改进与优化
  
  利用样本对总体进行统计推断的一类问题是参数估计,参数估计分为点估计和区间估计两种.Matlab统计工具箱在参数估计方面提供多种分布类型的分布函数及其置信区间的估计方法.
  1.1 单正态总体方差的区间估计[2,3]
  设总体X服从正态分布N(μ,σ2),X1,X2,…,Xn为总体X的随机抽样,样本均值为X,样本方差为S2,对总体参数σ2的区间估计有结论:σ的置信度为1-α的置信区间为n-1S[KF(]χ2α2(n-1)[KF)],n-1S[KF(]χ21-α2(n-1)[KF)]
  在给定置信度情况下,置信区间是不唯一的.区间越长说明估计值分散的可能性越大,所以区间长度是估计优良的反映.为此,在置信水平一定的前提下,应该选取区间长度最短的一个.但在实际应用中,仍取对称的分位点χ21-α2(n-1)与χ2α2(n-1)来确定置信区间,这种方法得到的不是最优区间估计,并且在小样本时会产生不小的误差.以下利用Matlab强大的数值计算能力实现非对称χ2分布区间估计的优化.输入置信度及样本值,就可得更优(短)区间,简单直观.
  1.2 置信区间算法优化改进[1,4]
  在Matlab中编制函数文件minsigmaci.m,存入统计工具箱中以备调用.
  function [sigmaci,len] = minsigmaci(x,alpha)
  len=100;
  m=size(x,2);%样本容量
  sigmahat = std(x);%样本标准差
  for i=101:200
  
   k=i/100;
  
  
  chi2crit1 = chi2inv(alpha/k,m-1);%调用chi-square分位点函数
  
  
  chi2crit2 = chi2inv(1-alpha*(k-1)/k,m-1);
  
   sigmacileft=sigmahat*sqrt((m-1)/chi2crit2);
  
   sigmaciright=sigmahat*sqrt((m-1)/chi2crit1);
  
  
  length=sigmaciright-sigmacileft;%置信区间长度
  
   if length < len
  
  mink=k;%用来计算两侧尾部概率
  
  minsigmacileft=sigmacileft;
  
  minsigmaciright=sigmaciright;
  
  
  len=length;
  
  
  
   end
  end
  sigmaci = [minsigmacileft;minsigmaciright];%优化后的置信区间
  len;%优化后置信区间长度
  2 基于Matlab的正态总体方差的假设检验
  利用样本对总体进行统计推断的另一类问题是假设检验,Matlab统计工具箱在假设检验方面提供包括单样本t检验、双样本t检验、z检验和χ2拟合检验等方法,但没给出对单正态总体方差的χ2检验.
  2.1 单正态总体方差的假设检验
  
  上述检验法称为χ2检验法(注:不同于Matlab统计工具箱提供的χ2拟合检验法).以下利用Matlab实现正态总体方差的χ2检验,补充统计工具箱在正态总体方差的假设检验算法.
  2.2 单正态总体χ2检验算法实现
  在Matlab中编制函数文件chi2test.m,存入统计工具箱中以备调用.
  function [h,sig] = chi2test(x,sigma,alpha,tail)
  samplesize = length(x);%样本容量
  s2 = var(x);%样本方差
  chi2 = (samplesize-1)*s2/(sigma^2);%chi2-square抽样分布
  if (tail =
  
  3 实例应用
  
  例1 试验室有一批贵重元器件,设元器件的使用寿命近似地服从正态分布,试求该元器件总体标准差σ的置信度为0.95的置信区间.随机抽样检测4个元件,测得数据如下:506,508,499,503,504.
  (1) 传统区间估计方法 计算样本标准差S=3.391 2.由置信度1-α=0.95,α=0.05,自由度n-1=5-1=4;查表得:
  
  (2) 调用统计工具箱函数 调用优化前normfit函数[1],运行如下代码
  x=[506 508 499 503 504];
  alpha=0.05;
  [muhat,sigmahat,muci,sigmaci]=normfit(x,alpha);
  sigmaci
  运行结果:sigmaci =2.031 8 9.744 7
  调用优化后minsigmaci函数,运行如下代码
  x=[506 508 499 503 504];
  alpha=0.05;
  minsigmaci(x,alpha)
  运行结果:ans =1.668 0 8.156 5
  评注 按传统方法计算出的置信区间不是最优的.利用优化后统计工具箱minsigmaci函数,求得置信区间(1.668
  
  例2 某试验室用一台精密仪器加工某元件.该元件的使用寿命是随机变量,并服从正态分布.仪器正常时,其均值为 0.5 kh,标准差不超过0.015 kh.某日开机后为检验该仪器是否正常,随机抽取它所加工的元件9个,测得数据(kh)为
  
  问仪器是否正常?(显著性水平α=0.05)
  (1) 调用统计工具箱函数ztest 检验
  
  调用ztest函数,运行如下代码
  
  所以拒绝原假设 ,接受备择假设 ,即发现仪器存在显著偏差,该仪器均值不为0.5 kh.
  (2) 调用统计工具箱(编制)函数chi2test 检验 调用chi2test函数,运行如下代码
  
  所以接受原假设 ,拒绝备择假设 ,即没有发现仪器存在显著不稳定,可以认为该仪器标准差不超过0.015 kh.因此说明该仪器虽然工作稳定,但是仪器存在显著偏差(偏大),故仪器工作不正常.
  评注 该问题隐含两个问题:(1)检验 ;(2)检验σ≤σ0.对于问题(1)直接调用Matlab统计工具箱ztest函数,h=1说明拒绝原假设 说明样本观测值的概率非常小(<0.05,小概率事件),对原假设质疑.对于问题(2)调用补充Matlab统计工具箱chi2test函数,h=0说明接受原假设H0;sig = 0.925 5说明样本观测值的概率不算太小(0.05,非小概率事件),对原假设不应质疑.
  
  4 结束语
  
  Matlab统计工具箱应用非常广泛,除了其本身提供的工具箱以外,还可以根据实际问题的需要,建立起相应的m-文件(命令式文件或函数式文件)解决更加复杂的问题,并且程序通用性强.本文在推断统计方面对统计工具箱进行一些优化与补充.
  
  参考文献:
  [1]The Math Works, Inc. Statistics toolbox user’s guide [EB/OL
  ].[200508].http://www.mathworks.com/access/helpdesk/help/toolbox/stats/
  
  
  [2]盛骤, 谢式千, 潘承毅. 概率论与数理统计[M]. 2版. 北京: 高等教育出版社,
   1989: 173,202.
  [3]陈希孺. 数理统计引论[M]. 北京: 科学出版社, 1999.
  [4]郭永宁, 黄丽华. 提高Matlab程序运行效率的若干手段[J]. 福建电脑, 2005 (11
  ): 147.
  [5]魏宗舒. 概率论与数理统计教程[M]. 北京: 高等教育出版社, 1983.
  (编辑廖粤新)
  
  “本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文”。
其他文献
摘 要 论文提出了一种新的科技期刊综合评价模型:核主成分分析(KPCA)。通过一个非线性变换,KPCA首先将原变量空间映射到高维特征空间,然后在这个高维特征空间中进行线性主成分分析。通过核技巧,KPCA评价方法只需在原空间进行点积计算,而不必知道非线性变换的确切形式。十种科技期刊综合评价的实证表明,KPCA综合评价方法具有一定的实际应用价值。  关键词 核主成分分析 综合评价 科技期刊 
期刊
摘 要 脱硫过程是一个复杂的非线性系统,文章建立了一个基于RBF神经网络的脱硫预报模型,并提出使用CRBP算法,从而较好地解决了传统RBF神经网络中心难于确定,存在过拟合的缺点。实践证明,该算法应用在脱硫预报模型的建立中是合理的、可行的。  关键词 脱硫 预报 神经网络 RBF GRBF  文章编号1002—8331—(2003)24—0218—03 文献标识码A 中图分类号TP
期刊
摘 要:针对在工程中只应用某一软件完成有限元分析的过程复杂、效率不高的问题,根据UG, HyperMesh和MSC Marc软件的特点,综合运用其长处完成从几何建模、网格划分、分析计算到结果处理的整个过程. 实例表明,综合运用各有限元分析软件,有利于发挥每种软件的优点,可以大大提高有限元分析的效率.   关键词:有限元; UG; HyperMesh; MSC Marc  中图分类号:TB115;O
期刊
摘 要 随着Intemet的出现和发展,电子商务技术也有了长足的进步,ASent概念的出现及其技术的进步,使它成为自动完成电子商务活动代理的理想选择。首先,文章基于多ASent思想构造了一个电子商务系统框架;其次,对此系统中AZent之间的通信协议要求进行了规范;通过分析,选择了XML作为ASent之间通信的消息格式;最后,在上述平台上集中研究了如何将关系型数据转换成XML数据的方法,并对此进
期刊
摘 要 数据可视化是计算机学科的一个重要研究方向,文章简要介绍了数据可视化的概念、研究现状,结合数据可视化技术在过程冶金中的CFD(Computional Flnuid Dynamic)应用,详细介绍了计算数据(速度场、温度场、浓度场等)的可视化方法、程序实现及其特点。  关键词 数据可视化 程序实现 过程冶金 CFD应用  文章编号1002—8331—(2003)24—0221—04
期刊
摘 要:针对制造业对三坐标测量软件的需求,基于三坐标测量机(Coordinate Measuring Machine, CMM)设计并实现测量软件MworksCAD. 将其体系结构分为4层:机器层、驱动层、功能服务层和界面层.将尺寸测量接口规范(Dimensional Measuring Interface Standard,DMIS)测量语言作为系统的信息载体,实现智能化的测量点采样、测量路径选
期刊
摘 要:研究美国航空工业计算机辅助训练委员会(Aviation Industry CBT (Computer-Based Training) Committee,AICC)制定的计算机辅助训练(CBT)课件开发规范,在分析现有CBT技术背景和航空培训需求的基础上,结合多媒体技术、视景仿真技术与虚拟交互技术,开发基于虚拟现实技术的交互式计算机辅助训练(Interactive CBT, ICBT)系统
期刊
摘 要:由于分析跨河桥梁、防洪堤坝等水利工程影响河流过水断面、上下游防洪的相关软件较少,而且目前多数三维建模软件侧重于三维对象的建模,缺乏对场景和模型的实时控制,因此,提出并实现基于OpenGL的河道地形实时可视化显示系统. 该系统首先从航测数字线划图(Digital Line Graphic,DLG)文件中自动提取数字高程模型(Digital Elevation Model,DEM)数据,然后选
期刊
摘 要:由于网络支付是制约电子商务向深度和广度发展的瓶颈,在介绍网络支付系统框架的一般结构及银行卡的网络支付模式之后,提出基于安全套接层(Secure Socket Layer, SSL)和安全电子交易(Secure Electronic Transaction, SET)协议的网络支付系统,并对其支付流程和安全性进行阐述与讨论.  关键词:网络支付; 安全套接层; 安全电子交易; 电子商务; 支
期刊
摘 要:针对各种实时数据采集传输的需要,设计和实现基于通用分组无线业务(General Packet Radio Service, GPRS)网络的远程数据采集传输系统. 该系统使用RS-232接口读取外部数据,如果GPRS网络或GSM(Global System for Mobile Communication)网络可用,则以GPRS通信或短信方式将数据发送到数据中心,否则将数据存储在外部存储器
期刊