论文部分内容阅读
研究背景:在多中心临床试验中,调整中心效应的统计分析已经成为美国食品药品管理局(FDA)、欧洲药品管理局(EMEA)和我国食品药品监督管理总局(CFDA)等权威机构发布的相关统计分析指导原则中明确提出的要求,无论中心效应是否确实存在,对中心效应的考虑都是有必要的。对于以率为结局变量的指标,除采用假设检验的方法对不同干预间有无差异进行推断外,还常用置信区间的方法估计不同干预之间的差异大小,特别是对于目前在临床试验中经常采用的非劣效设计,通过计算率差的置信区间来验证非劣效成立是最基本的方法之一。对于多中心临床试验,率差的置信区间需考虑中心效应的调整,否则可能得出潜在的误导性结论。所以,统计分析时应提供经中心效应调整的置信区间,与未经中心效应调整的置信区间一并作为评价依据。然而,由于现有估计方法尚未得到普遍认可,故在数据处理实践中如何针对二分类反应变量进行中心效应调整的置信区间估计鲜有应用,也缺少指南或指导原则的明确指引,导致当率差作为主要评价指标时考虑中心效应的非劣性验证有一定困难。解决这一方法学问题显然对临床试验应用领域具有重要价值。目前,经中心效应调整的率差置信区间估计方法主要有以下四种:最小风险权重法:该法由Mehrotral & Railkar (2000)提出,综合考虑了CMH和逆方差权重的赋权思想,通过各中心权重w控制率差的误差与率差的方差之和为最小进行赋权。由于该方法计算的方差较小,所以在不做校正的情况下覆盖率较低。Newcombe法:Yan & Su(2010)提出了基于逆方差的加权方式,并利用单样本率的分层Wilson置信区间构建了率差的分层Newcombe置信区间,但该方法计算复杂,且覆盖率会随中心数量增加有所下降。Logistic回归法:Ge & Durham等(2011)提出了基于logistic回归的率差置信区间估计方法,基本思路是利用logistic回归方法纳入中心协变量,并用Delta法近似求得总体率差及其方差的估计,从而用于构建中心效应调整后的置信区间。由于Delta法基于大样本近似,使得logistic回归方法得到的置信区间在中、小样本量水平上的覆盖率偏低。Klingenberg法:Klingenberg (2014)在Greenland等人的基础上,提出了基于CMH权重的置信区间估计方法,其思想是将校正后的CMH加权率差作为置信区间的中点值(midpoint),并利用Greenland & Robins提出的后经Sato等改进的CMH方差估计方法,计算边际误差(margin of error, ME),最后构建形式为δMid±ME的置信区间。该置信区间的覆盖率较好,但对率差的估计存在偏性。基于以上方法存在的不足,我们需要一个计算简便、受样本量影响较小,保证置信区间覆盖率、且具有较小的率差估计误差的新方法。在本人开展本课题研究过程中,Klingenberg法的论文见诸发表,故本研究也将最新的Klingenberg法列为比较对象。研究目的:本研究拟建立一种新的含单个分类协变量(即中心效应)的率差置信区间估计方法,为多中心临床试验评价提供简便有效的分析手段。方法:首先经理论推导提出含单个分类协变量(即中心效应)的率差的区间估计方法;然后通过模拟研究与已有方法进行对比,验证其优势与不足;最后进行实例验证。(1) 理论推导:基于ψ调整的含单个分类协变量的率差置信区间估计方法(简称ψ法)的基本思路是:以中心内两组率之和与各中心合并后的两组率之和的比值构建各中心率差的调整系数ψi,利用CMH加权估计总体率差及其方差,最后采用Wald方法构建置信区间。调整系数ψ的定义见下式,式中pi1,pi2分别为第i中心第1组和第2组的样本率,p1,p2分别为各中心合并后第1组和第2组的率的估计值。对总体率差的估计为θ=∑wiφi(pi1-pi2)式中,wi为第i中心的CMH权重。对总体方差的估计为V(θ)=π1(1-π1)/n1+π2(1-π2)/n2 π1=(∑wipi1+∑wipi2+θ)/2,π2=(∑wipi1+∑wipi2-θ)/2根据中心极限定理,最后获得基于ψ调整的含单个分类协变量的率差的置信区间估计为θ±z1-a/2(?)(2) 模拟研究:多中心临床试验率差数据的构造:利用R软件(R 3.1.264位)的rbinom()函数,分别构造两个独立的二项分布,生成k个中心第1组的例数向量ni1和阳性反应数向量xi1以及第2组的例数向量ni2和阳性反应数向量xi2,由这4个向量数据构成一个多中心试验的模拟样本。参数设置:考虑中心数、样本量及总体率3个参数,在生成样本数据过程中,对中心数、每中心样本量及总体率3个参数进行控制,样本量取9个水平,7个(8中心×12例、12中心×12例、16中心×12例、8中心×24例、8中心×36例、15中心×36例、50中心×24例)为中心间样本量一致,2个(6中心共50、12中心共282)为中心间不同,中心内组间例数及合并后各组例数均设为一致;第1组与第2组的总体率分别设置为0.05-0.95与0.08-0.98,每0.1一个间隔合计100种组合。评价标准:对各方法的优劣评价主要依据以下两个准则:a) 率差的估计误差(θ-θ)2,以误差小者为优;b) 覆盖率更接近名义置信水平者为优。(3) 实例验证:从作者曾参与的临床试验项目中选择有代表性的研究共7组数据,中心数由3至14不等,每个试验总的样本量由68例至438例不等,试验中各干预的终点指标(有效率、显效率、治愈率等等)率值覆盖了0-1的所有区间。所有研究的率差及置信区间,均给出采用合并Wald置信区间、Newcombe法、最小风险权重法、Klingenberg法、logistic回归及ψ法的估计结果,便于对比。结果:(1)模拟研究结果率差的估计误差:与现有其它五种方法比较,即合并Wald置信区间法,Newcombe法,最小风险权重法,logistic回归法和Klingenberg法,两总体率在0.5至0.9区间时,在较小样本情况下,即每组样本量分别为25、48和72例时,ψ法对率差估计的误差与Klingenberg法相近,平均的误差水平分别为0.013、0.0069和0.0046,但比其它已有方法小;在总体率差接近0或1时,ψ法对率差的估计误差略有升高,但基本与logistic回归法及合并Wald置信区间法保持一致。随样本量的增大(每组96例、141例、144例、270例及600例),各方法的误差均在降低,但在中心内样本量保持不变的情况下,ψ法随中心数的增加,其率差估计误差的减少幅度较其它方法更大,当中心数增至12个时(中心内样本量为每组6例),率值在0.5~0.9区间的误差为所有方法中最小;而当中心数保持不变、中心内样本量增加时,ψ法与其它方法(除Newcombe法外)的变化趋势相同,当中心内样本量增加到36例时,ψ法、合并Wald方法、logistic回归及Klingenberg法的误差水平基本一致。置信区间覆盖率:在总体率值不特别接近0或1时,ψ法的覆盖率均在名义置信水平附近。对于模拟研究中最小样本的情形(共5中心,每组合计25例、总计50例),且极端率差(接近0或1)情况下,ψ法的覆盖率有所下降,平均覆盖率偏低为93.6%,相比Klingenberg法(95.23%)和Newcombe法(94.2%),偏离设定的95%略远,但较合并Wald置信区间法(92.9%)、最小风险权重法(86.9%)及logistic回归法(91.1%),更接近设定水平。除上述小样本和率差的极端情形,ψ法估计的置信区间同样比合并Wald置信区间、最小风险权重和logistic回归法更接近名义置信水平,但较Klingenberg法略低。在每组合计48例、72例、96例、144例、270例及540例的样本量水平下,ψ法在总体率的所有组合下(包括极端率值在内),平均的率差置信区间覆盖率分别为:0.944、0.948、0.949、0.948、0.949、0.949,非常接近设定的0.95水平。(2)实例验证应用ψ法对7个实际临床试验的有效性数据进行了率差的估计及置信区间的构建,与其它方法得到的率差及置信区间进行了对比,进一步验证了ψ法的适用性。结论:当总体率差不在0或1附近时,ψ法对于含单个分类协变量的率差的估计误差较小,置信区间可达到满意的覆盖率水平,其统计性能与Klingenberg法相近,优于其它四种方法,且计算更为简便,可应用于含单个分类协变量的率差置信区间估计,特别是多中心临床试验考虑中心效应的率差置信区间估计。