用相容性调整的选择后多重置信区间

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:chyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多重检验是目前高维统计推断的领域中研究的热点之一,并在临床医学、基因检测、教育学等多领域中均有广泛的应用。同时对多个假设进行检验是多重检验的实质,它常常被用来对来自大量总体的某个参数或多个参数的水平进行比较。当多重检验中的一个假设被拒绝,我们通常希望对该参数构造置信区间,从而确定该假设对应真值的取值范围。我们将多重检验中被拒绝的假设对应的参数称为选择后参数,为选择后参数构造能控制FCR的置信区间也成了统计学家们新的研究方向。Benjamini和Yekutieli(2005)提出的BY方法可以针对FCR的控制构造选择后多重置信区间。Weinstein,Fithian和Benjamini(2013)提出的SRT方法可以针对选择后参数的符号判断构造选择后置信区间。BY方法能有效地构造选择后多重置信区间。基于BY方法,置信区间可以对FCR进行有效地控制,但是它的长度过大,这会导致区间构造方法过于保守。SRT方法是一个有效的选择后置信区间构造方法。这种方法的应用场景更偏向判断拒绝原假设的参数的符号,并且在原文中并未对SRT区间的性质进行讨论。本文详细地讨论了SRT方法构造的置信区间的优缺点,发现相对于BY置信区间而言,它的区间长度更短,但是当参数真值与原假设下的值差别较小时,SRT方法构造的置信区间会更倾向于与检验的结果不相容。本文在第三章首先利用选择后参数置信区间的性质给出了相容性比例和相容性期望的定义,并以此作为区间构造方法的评价方法。其次本文介绍了SRT方法的接受域与置信区间的构造方法、分析了SRT方法置信区间的特点、并将其与BY方法进行讨论,详细比较了两者的优缺点。接着,本文分别给出备择假设为真的参数服从正态分布与混合高斯分布的情形下SRT置信区间的相容性期望计算公式,这更适用于选择后参数的置信区间评估,丰富了对选择后参数的理论研究。最后,本文总结以上两点,给出了水平为(?)的r-CI方法的选择后置信区间构造方法,并从理论分析与模拟研究两个角度对其进行讨论。该方法可确保选择后置信区间的相容性始终大于(?)。此外,该方法还结合了BY方法能有效控制FCR的优点以及SRT方法的区间长度更短的优点。为了测试r-CI置信区间方法的有效性,本文在第四章设置了以FCR、相容性比例、区间平均长度作为评估指标的2组共8个实验。第一组实验改变了原假设与备择假设的差异、备择假设为真的参数比例和总检验个数,发现当(?)的取值越大,r-CI方法更倾向于选择BY方法,同时FCR控制效果更好,区间更长。第二组实验中通过改变总体均值、随机变量间相关性、备择假设为真的参数总体分布来比较r-CI方法、BY方法与SRT方法的有效性。此时利用模拟实验发现了r-CI方法的适用条件为参数间彼此相互独立或相关系数接近0。在该适用条件下,r-CI方法保证了相容性比例高于水平(?),并且它同时具备了BY方法能有效控制FCR的优点以及SRT方法的区间长度更短的优点。最后,本文将r-CI方法应用于2015年美国加利福尼亚州AYP数据中,通过对每所学校家境良好与家境贫困的学生的阅读考试通过率是否存在显著差异作多重检验,在不同的显著性水平下,利用水平(?)=0.7的r-CI方法构造选择后参数置信区间,估计成绩有显著差异的学校的通过率之差,并在文章的最后给出指导性建议。
其他文献
机关事务管理工作高质量推进是我们国家当前焦点工作之一,稳步推进机关事务管理法治化是治理模式迎合新时代、促进机关高效发展的新要求。依法行政有效深化、加快法治政府建设也能从机关事务管理法治化进程中集中体现,机关事务管理法治化是稳步推进依法治国具有实践意义的重要举措。2020年底,中共中央发布的《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》与《法治中国建设规划(2020—2
学位
在金融市场定价理论中,资本资产定价模型(CAPM)一直都是起主导作用的资产价格文献。风险与预期收益之间的权衡一直都是金融学中最受关注的问题,近几十年来,左尾风险是否在确定预期回报的横截面方面发挥特殊作用的问题也一直受到金融经济学家的关注。风险规避的投资者要求以更高的预期回报的形式获得更高的报酬,以持有风险更高的金融证券。转换到左尾风险框架,在对预期收益相关高阶矩变量分布不了解的情况下,具有较高左尾
学位
近年来,中国地方政府债务迅速增长,政府债务在补缺口、强基建和促发展等方面发挥了积极的作用,但由于规模增长快,债务风险不断累积,且越来越突出,已成为我国经济可能的“灰犀牛”。与此同时,地方政府债务扩张所产生的巨额资金需求可能会通过金融市场的传导影响公司部门的融资需求。全社会的资金资源在整体上是有限的,当地方政府的融资需求大幅上升以及地方政府的信用较好,银行会偏向选择地方政府,一定程度上挤占原本属于公
学位
代谢组学是生物流体或组织中低分子量代谢物动态变化的量度。代谢组学研究的基本策略为基于高通量分析技术量测的高维数据的获得和基于化学计量学方法的代谢组学数据解析。此类数据通常具有小样本、高维、高噪和易含奇异样本的特性。化学计量学在代谢组学数据解析中的两项主要任务为识别各组之间的代谢差异(即模式识别)并筛选出表征各组之间代谢差异的潜在的重要生物标志物(即变量选择)。近年来,分析技术平台的不断发展导致生成
学位
在金融市场中,波动率不仅是衡量风险的指标,它对衍生品定价和资产配置都至关重要,因而对于波动率的研究一直是金融研究领域当中的较为热门话题。在对波动率的研究上,一些学者采用了文本情感分析的方法,通过词频统计模型探究与波动率的关系。然而,词频统计模型因其无法联系上下语义的局限性,语义捕捉能力较差,降低对波动率的解释效力。此外,而在对波动率预测的研究上,之前的研究集中在对低频收益率数据拟合而成的GARCH
学位
在语言学的定义里,新词是指一个最近铸造的发明词或者词组,可能来源于新事物的产生、方言的吸收、简略词汇、外来语等。当今互联网时代下,大量的中文新词会在不同背景的碰撞下产生并借助网络的力量迅速传播开来。由于中文里没有明显的界限符,所以在英文中不存在的分词问题在中文里却是很重要的一步。未登录词是影响分词准确率的重要因素,新的未登录词及其变体层出不穷,依靠人力去构建词库费时费力,因而使用某些方法让计算机自
学位
在中央经济工作会议提出的“六稳”方针中,“稳金融”的底线是要求不发生系统性金融风险,并稳步推动金融市场的发展。商业银行作为核心金融机构,其信贷风险管理质量对金融市场的稳定有重大影响,特别是随着近年来中小企业的快速发展及其伴随而来的银行信贷资源需求与日俱增,中小企业的信贷风险管理逐渐成为商业银行信贷风险管理之重点。信贷风险评价体系作为商业银行信贷风险管理的基础性环节,直接关系到信贷风险管理质量。商业
学位
近年来,随着深度学习算法的效果变得越来越好,许多学者开始着眼于深度学习算法的稳定性。其中的一个方向叫对抗样本。对抗样本是指在原始数据上添加一个特定的噪声(噪声的比例越小越好,能被模型识别而不被人眼察觉)使得损失函数最大化,所形成的输入样本,会导致模型以大概率给出一个错误的结果。对抗样本的生成又被称为对抗攻击。现如今,深度神经网络已经成为了人们生活中不可或缺的一部分,人脸识别、语音转文字等都是日常生
学位
报纸
医疗搜索作为广大群众搜索场景下的刚需,是普通用户获取优秀医疗资源最为便捷的渠道。医药领域数据的爆发式增长给研究人员提供了丰富的知识,是重要的研究资源。医疗搜索的重点就是从海量庞杂的医药领域数据中快速高效地获取信息,而命名实体关系抽取就是文本数据处理工作中一项基础且重要的环节。在医药领域内,准确识别说明书中的禁忌症和适应症实体对于构建合理用药规则,构建完善的医药领域知识库有重要意义。但是,由于医药领
学位