试论计量检定中的异常值及其剔除方法

来源 :中国科技博览 | 被引量 : 0次 | 上传用户:jinlu2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要]随着计量检定在各专业领域应用的普遍,人们对计量检定结果的准确度和精度也提出了更高的要求。当前,带来检定结果的准确度降低的原因主要是混入了“异常值”,而当检定人员在计量检定中由于人为或者客观因素造成的过失,或者外界条件的突然改变,都会造成异常数据的产生,属于比较普遍的现象。因此,相关检定人员要掌握异常值剔除的有效方法。本文结合笔者实践工作经验,首先对计量检定中异常值形成的原因及判断方法进行了分析,在此基础上分析了拉依达准则、肖维勒准则、狄克逊准则等三种应用较为广泛的异常值剔除方法,希望可以为相关的理论和实践提供借鉴。
  [关键词]计量检定;异常值;剔除方法;拉依达;肖维勒准则
  中图分类号:P413 文献标识码:A 文章编号:1009-914X(2015)33-0390-01
  一、计量检定中异常值的形成
  通过计量检定获取的数据中如果混入了“异常值”,势必会对检定的结果带来一定的影响。这时如果可以有效地将异常值进行剔除,那么获得的结果必定是更加客观和符合事实情况。而在实际中还存在着这么一种情况,某组通过正确和客观测得的具有分散性的数值,本来是可以正确地对事实本身进行反映,是仪器在特定条件下进行测量的随机波动特性。相关人员为了获得更加精密的结果,而人为地对其中误差比较大的数值进行剔除,殊不知这些误差较大的值并不属于异常值,实质上是虚假的。以后在相同条件下对该组数据进行重新检定时候,和该误差值类似的误差值就会可能再次出现,甚至出现多次的情况。那么异常值是如何产生的呢?笔者认为,当检定人员在计量检定中由于人为或者客观因素造成的过失,或者外界条件的突然改变,都会造成不正常数据的产生,是含有粗差的数据。粗误差产生的原因是多方面的,比如读错数据、记错记录、计算错误、调错标志、仪器故障和操作不当等都会造成粗误差产生。。
  以下情况下确认的数据都可以确定为粗误差,可以将其予以剔除:
  1)标准器或检定设备不正常或者操作不当时的读数;
  2)模拟环境条件超过规定值或稳定性不符合要求的读数;
  3)经过校准或者补测确认的粗误差。
  二、计量检定中异常值的判断方法
  (1)异常值物理判断法
  上文以及论述,在计量中很多异常值的产生都是因为检定人员的主观过失,包括读错数据、记录错误以及仪器突然的震动和跳动等,这类异常值是可以随时发现并予以剔除的,必要时,可以结合实际情况进行重新检定。这种在检定过程中对异常值进行判断和剔除的方法被称之为物理判断法。不过,在实际情况中,对可疑数据的处理务必要慎重,当发现异常数据后要立即停止检定,分析原因并及时纠正错误,如果检定已经结束,则应该先找出原因,再决定取舍。
  (2)异常值统计学判断法
  相对于异常值的物理判断法,还有一种方法是采用统计学的判断方法。该方法适用于整个计量检定已经完成后,并不能直观地认定哪一个数值是异常值的情况。统计学判断法的基本原理为,设定一个置信概率,并根据该置信概率确定一个相应的置信界限,凡是超过这个置信界限的误差,都认为其不属于随机误差的范畴,将其确定为粗误差,将其进行剔除。
  三、计量检定中异常值的剔除方法
  本文根据计量检定异常值的剔除实际运用情况进行分析,将当前采用的拉依达准则、肖维勒准则、狄克逊准则等三种剔除方法进行总结:
  (1)拉依达准则
  拉依达准则,又称之为3σ准则,其原理为:设对被测量进行等精度测量,独立得到X1,X2..., Xn,算出其算术平均值X及剩余误差Vi=Xi-X(i=1,2,...,n),并按贝塞尔公式算出标准误差σ,若某个测量值Xb的剩余误差Vb(1<=b<=n),满足下列3-1式:
  |Vb|=|Xb-X|>3σ (式3-1)
  就可以认为Xb是含有粗误差的异常值,就可以对其进行剔除。
  在n足够大的情况下,采用拉依达准则是一种比较好的方法,可以有效地对异常值进行剔除,但是当n比较小时,就难以有效地将异常值进行判断并剔除,甚至会将正确的数值误判为异常值,从而成为“蒙蔽”检定人员的一种假象。为了有效改善拉依达准则的这种自身缺陷,当前利用的主要是下文将要描述的肖维勒准则。
  (2)肖维勒准则
  肖维勒准则是建立在频率P=m/n趋近于概率P{|Xi -?X|>Zcσ}的前提下,其中m是绝对值大于Ecσ的误差出现次数,P是设置的置信概率。
  设等精度且呈正态分布的测量值为Xi,若其残差vi≥Zcσ则Xi可看做为含有粗误差的异常值,这时候就可以将Xi 剔除。在剔除Xi之后在重新进行计算和继续使用判别依据判断,以此类推,从而达到有效剔除异常值的目的。
  (3)狄克逊准则
  狄克逊准则是一种用极差比双侧检验来判别计量检定中异常值的准则,它从测量数据的最值入手,一般取显著性水平a为0.01。在运用该准则时,将检定数据划分为四个组,每个组都有相应的极端异常值统计量R1R2的计算方法,再根据测量次数n和对应的统计临界系数D(a,n)按照以下的方法来判别:
  若R1> R2,R1> D(a,n),则判别X1 为异常值,应舍弃;
  若R2> R1,R2>D(a,n),则应舍弃X n;
  若R1< D(a,n)且R2< D(a,n),则没有异常值。
  在当前采用的计量检定中的异常值剔除方法中,存在着多种方式。现在也没有一种统一的规范和标准,在实际应用中还需要根据检定数据的实际情况采用合适的剔除方法,以保证计量数据的准确、客观。
  四、结束语
  综上所述,在计量的检定过程中,为了有效避免异常值的出现,一方面要严格执行《计量检定规程》,在相应的操作规范和步骤下进行,另一方面要求计量检定人员在检定过程中务必要仔细、认真,对发现的异常值要采取合理的措施进行处理。为了有效剔除计量检定过程中不可避免产生的异常值,要充分结合当前应用较广泛的拉依达准则、肖维勒准则、狄克逊准则等三种剔除方法进行合理选择性使用,以保障计量检定数据的精度和准确度,以最终确认量值传递的准确性,提升整体的计量检定水平。
  参考文献
  [1]周中汉,王汉江,李梅,郭定和.利用DPS剔除测量数据中的异常值[J].计量技术.2007(10)
  [2]楼润瑜,吴江云,王水生,钟继.检测数据异常值判断方法的优选[J].检验检疫科学.2008(06)
  [3]张德然.统计数据中异常值的检验方法[J].统计研究.2003(05)
  [4]张立伟.用数理统计的方法处理试验数据的异常值[J].电线电缆.2005(04)
  [5]毋红军,刘章.统计数据的异常值检验[J].华北水利水电学院学报.2003(01)
  [6]杭爱明.如何处理统计数据中的异常值问题[J].上海统计.1994(04)
  [7]周强,欧阳一鸣,胡学钢,王浩.数据挖掘中应用偏最小二乘法发现异常值[J].微电子学与计算机.2005(01)
  [8]王文周.未知σ,t检验法剔除异常值最好[J].四川工业学院学报.2000(03)
其他文献
[摘 要]在锅炉的供暖使用中,可以说其中比较核心的环节就是燃烧,燃烧也是锅炉使用价值的重要体现。但是据目前来说,很多锅炉的使用状况不甚良好,造成了锅炉不能有效、科学地使用,导致能源浪费,这与我国构建节约型社会的要求背道而驰。该文从锅炉的炉拱作用以及设置原则入手,在此基础上分析锅炉供暖实际节能运行方式。  [关键词]供暖锅炉 炉拱 燃烧 节能  中图分类号:TK223 文献标识码:A 文章编号:10
期刊
[摘 要]本文以实例的方式分析、介绍综采工作面过断层和冲刷层地段的安全技术措施。  [关键词]综采面;过断层;过冲刷层;技术措施  中图分类号:D035.39 文献标识码:A 文章编号:1009-914X(2015)33-0384-01  1 引言  当煤矿综采工作面遇到地质构造较为复杂的地段时,比如落差大的断层及煤层受冲刷影响变化大的情况,要想安全顺利通过该区域,并保证煤炭得以全部回收,那么就要
期刊
[摘 要]本文指出高职院校现有安检实训室建设存在的问题,对机场安检通道实训室的进行介绍,并提出建设机场安检通道实训室的要求,最后针对实训室的使用及注意事项进行了说明。  [关键词]机场安检通道 实训室 建设  中图分类号:F560.81 文献标识码:A 文章编号:1009-914X(2015)33-0379-01  1.高职院校现有安检实训室建设存在的问题  为了给民航安检行业培养高技术应用型人才
期刊
[摘 要]很多人都知道,高职院校印刷专业培训由于缺少实训设备、缺少实战经验,导致学生学习内容脱节、落后,甚至面临着与企业、行业脱节的可能,而模拟技术的应用改变了这种现状,本文从高职院校实训基地培训的现状入手,分析印刷模拟技术实训室的建设带来的好处,提出培训室建设所需的条件,评估建成效果,从而寄予建成后的实训室美好的展望。  [关键词]印刷模拟技术;实训室建设;应用效果  中图分类号:R47-4 文
期刊
[摘 要]机电一体化技术的应用,既可以有效降低设备购置与维修成本,又可以有效降低安全生产成本,还可以提高生产掘进速度,在“开源与节流”两个方面都可以实现有效控制和提升。随着生产效益的提升,随着员工对该技术的掌握,随着自身技能的提高,必然会使得企业与员工的收益都获得提升。  [关键词]煤矿;机电一体化技术;实际应用  中图分类号:TH-39;TD40;TD60 文献标识码:A 文章编号:1009-9
期刊
[摘 要]伴随着网络技术的快速发展,计算机在人们的生活中扮演着越来越重要的角色。现在信息技术的快速发展深刻的影响到了人们的思维方式,同时也改变着金融方面的教育理念。与此同时,网络技术的发展也为金融学的教学模式的改变奠定了坚实的基础。  [关键词]网络技术;金融学;应用的领域;计算机;  中图分类号:G434;H195.3 文献标识码:A 文章编号:1009-914X(2015)33-0383-01
期刊
[摘 要]通过分析煤矿电气控制电路的相关特点以及电气控制电路的常见故障,从电气控制电路的实际出发,结合现有的一些电路检修办法,深入研究探索出更加适合煤矿单位在电气控制中使用的电路检修方法。  [关键词]煤矿;电气控制;检修  中图分类号:TM571.2 文献标识码:A 文章编号:1009-914X(2015)33-0388-01  1 电气控制电路的相关特点  电能作为一种传输方便、无污染、控制方
期刊
[摘 要]化工机械设备是对所有应用子化学工业生产的设备及仪器的总称.它具有涉及能量形式多、运行工况领域宽以及工作性质灵活等特点。在现代化工业生产向着规模化、系统化方向发展的大前提下.一台处于运行状态下的化工机械设备又可以被看作是一个复杂化、综合化的集成系统。然而当这一系统中某个环节突发故障时,如果没有及时且有效的处理措施,那么这种故障就会迅速的扩大、蔓延,给整个运行系统带来不可预估的损失。  [关
期刊
[摘 要]锅炉压力容器的安全检验要仔细认真,专业检测人员要在锅炉的工作前以及工作中进行科学的安全检验,一旦发现问题要立即采取科学措施进行处理,在确保锅炉能够正常工作的同时防止发生安全事故,避免造成财产损失和人员伤亡。  [关键词]锅炉;压力容器;检验措施  中图分类号:X933 文献标识码:A 文章编号:1009-914X(2015)33-0382-01  1 锅炉压力容器的常见问题  1.1 容
期刊
[摘 要]随着世界科技水平的不断的提高,社会对于机电产业的要求也随之变得越来越高,对于产品的精密程度的要求更新的周期也变得越来越短。这种需求大大的促进我国的现代制造产业的发展。数控机床成为了目前制造产业中引用最为广泛的产品,而数控机床的核心就在于数控系统的控制,在这部分中PLC得到了广泛的应用,文章主要介绍了可编程控制器的工作原理,数控系统中PLC的组成,分类及在数控机床中的功能。  [关键词]P
期刊