论文部分内容阅读
研究背景:药品不良反应(Adverse Drug Reaction,ADR)监测是保障用药安全的重要手段,监测的实施主要通过药品不良反应信号检测来完成。前期开展了一系列药品不良反应信号检测方法的研究,在逐渐深入研究的过程中发现,目前信号检测方法存在两个突出问题:①常规方法忽略药品不良反应高微阵列数据特点导致的多重性检验问题,造成检测结果中假阳性信号比例偏高。传统的多重比较方法,如Bonferroni方法、Sidak方法等,控制的均是总I型错误率(即FWER)。而现有的自发呈报系统数据库中药品-不良反应的组合种类常高达上万种,使用传统的多重比较方法则限制过于严格,从而导致检验效能较低,并不能有效地解决高微阵列海量数据的多重检验问题。由于药品不良反应数据可表达为一个由i种药品和j种不良反应组成的ji×的列联表,是典型的具有高微阵列特点的数据,且以筛检为目的的检测,因此,可采用微阵列数据多重比较中广泛应用的错误发现率(False Discovery Rate,FDR)进行控制。②我国自发呈报系统中报告例数少的药品不良反应组合所占比例较高,常规方法对该部分组合的信号检出率低且结果可靠性差。如我国2010~2011年的自发呈报系统数据中,报告例数a<3的组合比例高达64.35%。针对报告例数a<3组合,常规方法如IC方法和MHRA方法未发现任何可疑信号,ROR方法将a<3中39.04%的药品不良反应组合检测为可疑信号。然而模拟研究显示ROR方法检测到的a<3的可疑信号中假阳性信号的比例高达69.15%,远高于a≥3时的25.7%。进一步从理论上分析,常规方法如ROR等在计算相应的统计量的置信区间时是基于正态近似分布的,然而较小的报告例数会导致检测结果不够稳定。因此,可考虑将确切检验作为常规ROR及PRR等方法之外的另一个备用方法以适用于现有数据的特点。确切非条件检验被认为比Fisher确切检验具有更高的检验效能。研究目的:本研究针对常规方法对药品不良反应报告例数较少(a<3)组合的信号检出率低及假阳性信号比例高且结果不够稳定的问题,引入确切非条件检验方法用于信号检测;同时,针对常规信号检测方法在实施过程中忽略药品不良反应数据呈现的微阵列数据特点,导致多重性检验造成假阳性信号比例偏高的问题,引入错误发现率指标FDR进行控制;并在此基础上探索与确切非条件检验和常规信号检测方法结合的合理的FDR控制估计方法和相应阈值的设置,以期在降低假阳性信号的比例的同时,提高信号检测结果的检出率、准确性和可靠性。为进一步的专家评价提供更加可靠的证据,为国家层面的决策如修改药品说明书及发布通报等提供循证决策的依据。研究方法:研究包括模拟研究和实例分析两个部分。模拟研究部分:首先,初步整理规范国家药品不良反应监测中心提供的2010~2011年的数据,并充分研究药品不良反应监测数据的特点,为下一步数据模拟参数的合理设置提供依据;其次,结合实际数据获得的参数,以及相关文献中自发呈报系统数据的模拟产生模拟数据;进而运用模拟数据探索基于FDR控制的确切非条件检验模型和其信号检测效能,尤其对于报告例数较少组合的信号检测能力,以及药品不良反应组合最小报告例数的限定对信号检测结果的影响和信号检测效能与报告例数的关系,并考虑合理的FDR控制估计方法的确定和阈值的设置;最后,采用灵敏度、阳性预测值和ROC曲线下面积等评价信号检测能力,探索不同条件下最优的方法,并与确切条件检验及传统方法等进行比较研究。实例分析部分:基于全国自发呈报系统药品不良反应监测数据、已知药品说明书数据库和国家药品不良反应监测中心发布的《药品不良反应信息通报》。首先,对国家药品不良反应监测中心提供的2010~2011年的国家自发呈报系统数据和药品说明书数据库进行清理,得到规范化数据集。在此过程中考虑了竞争偏倚,即首先根据国家药品不良反应监测中心提供的药品说明书数据库去除药品说明书中的已知药品不良反应组合,从而控制竞争偏倚造成的假阳性错误。然后,对规范的数据利用基于FDR控制的确切非条件检验模型等方法发现可疑信号。最后,通过国家药品不良反应监测中心发布的《药品不良反应信息通报》进行回顾性验证,进一步评价确切非条件检验模型在实际数据中的适用性。上述研究过程均在SAS软件中实现,并采用R语言进行了部分验证。研究结果:1.模型构建建立适用于自发呈报系统数据的基于错误发现率(FDR)控制的确切非条件检验模型,包括确切非条件检验(Reporting Exact Unconditional Test,REUT)和基于中间概率P值的确切非条件检验(mid REUT)两种情形。其实现过程为:在计算得到确切非条件检验P值的基础上,进一步采用FDR控制估计方法计算调整后P值,最后在确定阈值的基础上确定药品不良反应的可疑信号。2.模拟研究本研究探索了基于六种FDR方法(包括:BH法、ABH法、BY法、Qvalue法、LBE法和基于原假设的非混合模型贝叶斯后验概率法(简称posth0法))控制的确切非条件检验方法、确切条件检验方法(包括基于中间概率P值的Fisher确切检验,以下简称mid RFET)和传统信号检测方法(包括ROR和IC法)的效能并进行了比较分析,并研究了FDR的合理阈值的设置,以及信号检测效能与报告例数的关系。(1)各种方法检测效能比较及FDR控制估计方法选择:①基于中间概率P值的各种方法相比相应的原始方法总体具有较大的优势,即mid REUT法相比REUT法总体具有较大的优势,mid RFET法相比RFET法具有较大的优势。②基于Qvalue方法控制的mid REUT法、mid RFET法、ROR法均分别优于基于其他FDR方法控制的mid REUT法、mid RFET和ROR法。③基于posth0控制的IC方法则总体上具有较强的优势。④若主要关注检测到的可疑信号中真实信号所占的比例即检测到的信号的可靠性,则需要提高其阳性预测值,此时基于BY控制的mid REUT、mid RFET、ROR和IC方法在该方面表现较为突出。将表现较优的12种方法进行综合比较研究看出:①"IC+posth0"总体水平较高,“mid RFET”、“mid REUT”及基于Qvalue控制的该两种方法,即“mid RFET+Qvalue”法和“mid REUT+Qvalue”法,均可作为可供选择的信号检测方法。②若目的是寻找具有较高的灵敏度和综合指标ROC曲线下面积的方法,则仍然首推mid REUT和ROR。③若是注重信号结果的可靠性,即要求较高的PPV的方法,则"IC+BY"为首选,其余基于BY控制的"mid RFET+BY"、"mid REUT+BY"和"ROR+BY"也是可供选择方法。(2)FDR阈值的设置:随着阈值的增加各种信号检测方法的结果均有不同的变化,若维持较优的总体效能,则较小的阈值范围如0.01-0.10是可供选择范围。其中0.01、0.025、0.05和0.10相对较为常见,研究者可根据需要和实际情况进行合理的设置。(3)信号检测效能与报告例数的关系:各种方法的灵敏度和阳性预测值(PPV)均随着报告数的增加逐渐增加;mid REUT方法总体灵敏度较高,且在报告数a较小时(a<3)表现出明显优于现有其他方法的优势;基于BY控制的各种方法总体PPV较高,尤其在报告例数a较小时,“mid REUT+BY”法表现出明显优于其他方法的优势。与分析所有a≥1的报告和在分析时增设a≥3的限制条件两种情形相比,仅分析a≥3的报告,其整体的灵敏度和阳性预测值均有较大幅度的提高,但是其不足在于忽略了对于报告例数较少(如a<3)报告数据的充分利用,不利于尽早、及时地检出可疑信号。因此,对于报告例数较少的数据可考虑采用mid REUT方法和“mid REUT+BY”方法进行分析,但是更好的适用于该部分数据的信号检测方法仍有待进一步加强研究,且检测出的a<3的信号仍需审慎处理。3.实例研究将模拟研究中表现较优的7种方法应用于2010~2011年的国家自发呈报系统数据,并采用《药品不良反应信息通报》数据进行相应的回顾性验证。可以看出,“mid REUT”和“mid REUT+Qvalue”和的可疑信号检出比例最高,其次为“mid RFET+Qvalue”。且该三种方法和“IC+posth0”能有效地检测出《药品不良反应信息通报》发布的信号。总体上,尤其在报告例数较大时,基于FDR控制的确切非条件检验方法,包括mid REUT和“mid REUT+Qvalue”,与以往研究报道的信号检测效能较优的“mid RFET+Qvalue”和“IC+posth0”一致性较好。由于其他方法在信号的检出上各有其特点,因此可考虑在采用基于FDR控制的确切非条件检验进行信号检测的基础上,联合其他表现较优的方法如“IC+posth0”等,进行综合分析。研究结论:综上所述,在自发呈报系统药品不良反应信号检测中,采用基于FDR控制的确切非条件检验信号检测方法在一定程度上降低了假阳性错误,提高了整体的信号检测效能,尤其在报告例数较少时的信号检出率和可靠性均有一定程度提高。但是,其也存在自身的缺陷如无统计量辅助判断可疑信号的强弱以及运行的速度等均有待进一步研究。