基于PASS及SAS软件的常用样本含量估计方法实现及部分方法比较研究

来源 :中国人民解放军军事医学科学院 | 被引量 : 11次 | 上传用户:ltavip
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
样本含量估计一直是医学科研设计中的一道难题。据统计,在我国有高达90%以上的医学文献资料中未使用或者用错样本含量估计方法。大部分科研人员还没有认识清楚样本含量估计的重要性,更没有系统掌握其估计方法,从而所开展研究的科学性和有效性受到质疑。研究者在确定样本含量估计方法的过程中,会遇到各种各样的困难,诸如科研设计类型、统计分析方法、比较类型、精确度要求以及所能承受的时间、经费成本限制等等。即使这些问题都已确认完毕,接下来如何正确估计样本含量仍需要经过一番认真思考和仔细研究。采用专业的样本含量估计软件来计算样本含量在科研工作中日趋流行。本课题将引导科研工作者高效、准确地找到适合自己科研目的的样本含量估计方法,再结合具体例子展示如何在专业软件上得以实现,以提高科研效率,使结果更加严谨科学、真实可靠。本研究涉及到的样本含量估计方法有:(1)估计总体均值时样本含量估计;(2)估计总体率时样本含量估计;(3)单组、配对或交叉设计均值比较时样本含量估计;(4)成组设计均值差异性检验时样本含量估计;(5)成组设计均值等效性检验时样本含量估计;(6)成组设计均值非劣效/优效性检验时样本含量估计;(7)单因素多水平设计定量资料方差分析时样本含量估计;(8)单组设计率的比较时样本含量估计;(9)成组设计率的差异性检验时样本含量估计;(10)成组设计率的等效性检验时样本含量估计;(11)成组设计率的非劣效/优效性检验时样本含量估计;(12)配对设计四格表资料统计分析时样本含量估计;(13)队列研究/病例-对照研究时样本含量估计;(14)相关分析时样本含量估计;(15)定量资料重复测量设计时样本含量估计;(16)定量资料析因设计时样本含量估计;(17)生存分析中样本含量估计。第3章列举了多种常见设计类型下对应的样本含量估计方法。从介绍基本的公式入手,再分别基于两种软件结合具体实例来一一实现。第4、5、6章中分别介绍了定量资料重复测量设计、析因设计、生存分析等几种比较复杂的多因素设计下的样本含量估计方法,并在第7章中对同一个问题不同解决方法间做了比较研究。在估计定量资料重复测量设计的样本含量时,分成只考虑主效应和同时考虑所有因素及其交互作用两方面来展开论述。只考虑主效应估计样本含量时,首先介绍了Bloch’s公式和Liu K.J’s公式,从比较中发现Bloch’s公式假设的前提条件实际中很难满足,容易低估样本量。Liu K.J’s公式需要提供的参数如条件相关系数、重复测量误差等都不容易获得,实际操作较困难。第二种方法为采用PASS软件计算,PASS不仅提供多种协方差类型来应对各种情况,还能灵活切换各种参数值和条件,在分析参数不同取值的检验效能时能准确、直观地展现各个变量间的变化趋势及相互关系。当既要考察主效应又要考察重复测量因素及交互作用时,PASS软件也提供了专业的解决方案,本文列举了需要注意的关键步骤,并通过实例加以展示。在估计定量资料析因设计的样本含量时,从预实验结果中获得所需的参数估计值是十分科学、有效的方法。本文介绍了SAS GLMPOWER过程和PASS软件两种估计的方法,它们背后的原理一样,但所需提供的参数稍有不同。GLMPOWER需要每个实验小组的均值估计值、PASS软件则需要提供因素合并后每个水平的均值估计值,两种情况对预实验结果进行初步处理后都可方便获取所需参数。生存分析中介绍了三种类型的样本含量估计方法,包括生存分析Log-rank检验、成组序贯设计和Cox回归时的样本含量估计方法。Log-rank检验中包含的样本含量估计方法主要有Freedman方法、Lachin-Foulkes方法和Lakatos方法。Freedman方法计算简单快捷,但它没有考虑生存资料的特殊性,是在基于风险比例保持不变、病人良好的依从性、生存时间满足指数分布等前提下提出的,并且忽略了时间因素和删失数据对结果造成的影响,导致样本含量估计结果偏差会较大,只适合粗略估计时使用。Lachin-Foulkes方法假设病人在时间段R内进入试验,接着随访一段时间直至到达总时间T为止,引入了删失率,也考虑时间因素的影响。但该方法设定的删失率、风险率是一个固定值,因此该方法并没有很好地拟合一个合理的生存过程。第三种方法为Lakatos法,它基于马尔可夫方法,并考虑了更多的不确定影响因素,该方法应用灵活,能较好地反映实际情况,是一种可行、有效的样本含量估计方法。生存资料成组序贯设计样本含量估计时,由于需要进行多次检验,引入了?消耗函数,但仅考虑了两组生存率计算样本量,因此该方法考虑因素比较简单,只适合粗略的估计。Cox回归样本含量估计时,对生存时间的分布特性没有要求,只要符合Cox比例风险假定即可,该方法不仅对单个影响因素进行研究,还可综合考虑其他协变量的影响。
其他文献
由于存在政治、经济等因素的干扰,广东出口产品往往会受到欧美等多国反倾销、技术壁垒等多种贸易障碍的影响,同时广东作为我国第一贸易大省,将面临更大的贸易风险。2017年广东出口产品中19.1%依赖美国市场,15.6%依赖欧盟,只有6.1%输往东盟,与东盟国家合作有利于广东避免过分依赖欧美市场。广东与东盟地理位置相近,关系密切,双方有着悠久的交往历史,并且广东与东盟要素禀赋存在差异,经济互补性强,双边贸
浆液的扩散半径决定着灌浆孔的布置和浆液消耗量,也是选择工艺参数、评价灌浆效果的重要依据,是灌浆施工中非常重要的参数。通过设计正交试验,对影响水泥浆液扩散半径的几个因素
水泥搅拌桩已广泛用于软土地基加固工程,水泥土单桩承载力是复合地基承载力的主要影响因素,本文从规范给出的地基承载力理论计算公式出发,结合工程试验统计数据分析实际承载
在宋代的文学发展历史和文学类型当中,词是发展最为辉煌也最具代表性的文学类型。在当时,词的发展成就甚至可以与唐诗的成就比肩而立,不分伯仲。在文学发展的历史长河中,两者
近年来,世界的发展变化让人瞩目,各个国家都随着世界的变化而不断变化,对于地球这个大世界来说,各个地区都有着属于自己的不同语言,想要有更好的交流就必须有专门的语言作为
甘肃省玛曲县大水金矿床是近几十年来在甘肃省南部西倾山地区发现的特大型金矿床,是国内外十分罕见的新类型金矿,规模大,品位高,埋藏浅,矿石成分简单,具有贫硫明显,硅化强、
共产主义社会制度能够最终实现,这是人类社会生产力发展的必然结果。社会生产力是不断发展的,不会停滞不前。社会生产力的巨大发展,必然带来社会制度的根本性变化,必然带来人的思
《茶经》堪称茶的百科全书,是中国乃至世界保存最早、最完整、最全面介绍茶的专著,它将普通的茶事升格为一种文化的艺能。它不仅是中国茶文化中极重要的组成部分,而且是中国
随着新媒体不断的深入,网络舆论信息的内容也是五花八门,充满着许多社会问题,由于网络舆论的不断异化,对人们和社会都带来非常大的冲击与挑战。基于新媒体语境下的网络舆论的
对于学校教育者而言,他们欣赏学习好的学生,但更欣赏有良好品德的学生,即使是在应试教育理念影响的学校教育空间中也是如此。其实不仅是学校教育者,每一个人都喜欢和品德修养