论文部分内容阅读
药物的全球同步研发,已经成为一种共享全球研发资源的开发模式,可以控制不必要的资源浪费,有助于解决在关键市场上市时间的滞后问题,使患者有更早的机会获得更新更好的治疗方案。国际多区域临床试验(Multi-regional Clinical Trials, MRCT)的目的在于多区域同步研发、同步注册上市,提高药物研发的效率,以利于更多地区的患者接受新的更有效的治疗方案。然而,由于不同区域之间存在种族、医疗环境等对临床结果产生潜在影响的因素,新药同步注册对于各区域监管机构和申办方来说仍面临着各种各样的挑战。
其中最核心的问题就是如何科学地评价不同区域之间疗效的一致性或相似性,提供证据以支持各参与MRCT的国家和地区的上市决策。从方法学的角度来看,对疗效的一致性或相似性评价问题的考量主要集中在研究计划的试验方案设计阶段以及数据收集后的统计分析和结果解读阶段。看似不同的两个阶段,实则紧密相关:研究者或监管机构需要在试验设计阶段考虑好需要获得哪些数据才能更全面更科学地评价药物的真实疗效,如何处理过程中可能出现的伴发事件,如何有效地分析和解读数据等等;否侧,仓促开展试验收集上来的数据不足以验证科学问题,就无法达到研究目的,甚至可能造成极大损失。目前,已有不少研究者对MRCT从不同角度进行了较深入的方法学探讨,但仍有一些问题尚未被有效的解决。
首先,针对研发策略的制定和试验设计,ICH对E9指南进行增补,在ICH-E9(R1)中提出了估计目标(Estimand)框架,在指导更加科学、完善的临床试验的同时也为MRCT中的研究设计、试验操作与结果分析解读都带来了不同程度的复杂性。例如,倘若不同区域的药审监管机构对研究终点的要求不一致,亦或临床实践操作不一致,对伴发事件的定义也可能不尽相同,那么就会导致不同区域的监管机构要求采用不同的估计目标。这种情况下若采用MRCT,试验如何科学的设计和实施、各区域不同的内外因素等信息如何收集和整合、试验数据如何正确的分析和解读、目标区域人群疗效与总MRCT疗效的一致性或相似性如何恰当的评估,都是亟待解决的问题。
另一方面,在数据统计分析和结果解读阶段,已有学者和机构从不同角度提出针对不同区域间药物疗效的一致性进行趋势分析的方法,如定量交互作用检验、异质性定量评价法、假设检验法、置信区间法、多元定性方法等。申办方多采用日本药品和医疗器械管理局(Pharmaceuticals and Medical DevicesAgency,PMDA)推荐的方法一,即药物在目标区域的疗效不应低于总MRCT疗效的既定的比例;同时采用其他的方法进行敏感性分析以判断结果的稳健性。由于目标区域的样本量往往占总MRCT的比例较小,这种情况下,如何克服目标区域与非目标区域样本量的不均衡、如何准确地估计不同亚组人群的药物疗效才能合理地评价区域间疗效趋势的一致性或相似性,均尚未见完善的解决方案。
针对这些尚待讨论的问题,本论文将主要从以下两个方面着手展开研究:
1.试验设计阶段:估计目标(Estimand)框架在MRCT中的应用研究和探讨本文第一部分总结和分析了ICH-E9(R1)中最新提出的估计目标框架在MRCT中的应用所出现及可能遇到的试验设计和分析解读所存在的问题;构建了MRCT-Estimand框架,以及扩展型MRCT中估计目标框架,并通过举例探索各自的优劣势与适用条件,结合中国国情进一步给出合理的应用建议。对于不同因素差异产生的不同估计目标,会存在相应不同的考虑:
MRCT-Estimand框架1思路采用相同的研究设计方案,不存在因为估计目标的不同导致实验操作和统计分析等问题;但是可能存在不同地区针对不同种族人群产生的不同临床解读方面的问题。对于MRCT-Estimand框架2思路,主要问题在于如何科学地进行数据分析,评价疗效的一致性,并从临床角度对结果进行有效解读,同时考虑监管部门是否能够接受。此外,在试验操作层面,如何收集有效信息和所有相关数据。对于MRCT-Estimand框架3-5思路,不同地区可能涉及到不止一个估计目标,因此除了各地区药物审评机构的接受程度以及临床解读方面的考量,所采用的多个估计目标主次也可能略有不同,相互支持。对于共主要估计目标或当计划将某次要估计目标作为关键次要目标放在说明书里的话,便可能涉及统计学多重性校正问题。此外,同样存在试验操作方面的问题。
扩展型MRCT-Estimand框架6-10思路的基本考量点同MRCT-Estimand1-5思路;同时可能存在更多的问题。例如,倘若总MRCT人群的结果显示某伴随用药会对疗效结果产生正向或负面的效应,则有可能对目标区域扩展阶段的治疗方案产生影响,如伴随用药的使用等。此时,若对估计目标中伴发事件的定义以及目标区域后续的估计目标进行调整,则目标区域的估计目标定有别于总MRCT的估计目标,可能就无法与前期研究中目标区域的人群进行合并分析。所以,此处暂不建议采取方案的修订,防止在结果的解读时引入更多复杂性和不确定因素。
此外,对于涉及不止一个估计目标的情况,样本量可能会有所增大。其优势在于可以提供更多的安全性数据,为疗效的评估提供更多的信息;但样本量的增加会导致经济成本和时间成本的增加,有可能间接影响到无法在某个预期的目标地区开展临床试验。若定义估计目标的要素中仅人群定义或伴发事件略有差异,可以在设计阶段考虑是否可以合并疗效数据进行分析。同时,要需要考量MRCT-Estimand框架下总一类错误的控制问题。
2.数据分析阶段:采用Bootstrap法评价MRCT中药物疗效的一致性趋势
本文第二部分运用bootstrap再抽样的技术,对不同的样本人群进行有放回的再抽样,以获得样本量相同的Bootstrap样本,使得不同样本具有一定程度的可比性。并进一步对不同的Bootstrap样本的疗效参数进行估计和比较分析。
首先,通过模拟正态分布连续型变量数据,分析比较了MRCT中不同Bootstrap样本的概率密度函数值的分布和估计值的差异,并通过构建六种线性回归模型分析不同目标区域样本比例和目标区域样本疗效对概率密度值分布的影响。结果显示:随着目标区域样本占比的增加,相同目标地区疗效所对应的概率密度值也随之增大。与原概率密度相比,Bootstrap后的概率密度曲线更加集中;Bootstrap后的的样本疗效值更加接近总MRCT。对目标地区样本占比为5%至25%时六种不同概率密度的线性回归模型的比较中观察到:基于该模拟数据,与基于原MRCT样本疗效均值和标准差的正态分布所计算出目标地区疗效值所对应的概率密度所构建的模型1和模型2相比,Bootstrap之后的样本模型3和模型4中,目标地区样本量占比显示出了其统计学意义。且随着目标地区样本量所占比例的增大,及MRCT样本与目标区域样本疗效差值的变化,概率密度值的变化更加明显,更具向心趋势。Bootstrap法在一定程度上控制了MRCT中目标区域人群样本的选择偏倚。
进一步提出Bootstrap置信区间覆盖法(Bootstrap confidence interval coverage method, BCIC)及相应的Bootstrap置信区间覆盖率(Bootstrap confidence interval coverage rate, BCICR),并采用目标区域一致概率LCP(Local Consistency Probability)和目标区域成功概率LSP(Local success probability)对MRCT中药物疗效的一致性趋势进行评价。其中,BCICR将通过对bootstrap抽取的样本疗效和置信区间与其可比的等容量样本的疗效和置信区间的交叠关系进行探索研究;LCP指在MRCT成功的前提下,目标区域与非目标区域结果一致性的概率;而LSP指在MRCT成功的前提下,新药在目标区域疗效与非目标区域一致或优于非目标区域的概率。
针对连续型变量、二分类变量及时至事件型变量分别进行模拟研究,考虑了四种Bootstrap抽取方式,即:(1)从总MRCT抽取与目标人群样本量相同的Bootstrap样本;(2)从非目标人群抽取与目标人群样本量相同的Bootstrap样本;(3)从目标区域人群抽取与总MRCT人群样本量相同的Bootstrap样本;(4)从目标区域人群抽取与非目标区域样本量相同的Bootstrap样本。此外还生成了两种疗效效应参数:delta_ratio(目标区域样本的效应值与总MRCT或非目标区域疗效效应值的比值:如正态分布资料中为δL/δMRCT,二分类资料中为RL-trt/RMRCT-trt,生存资料中为HRL/HRMRCT)和delta_difference(目标区域样本的效应值与总MRCT或非目标区域疗效效应值的差值:如正态分布资料中为δL-δMRCT,二分类资料中为RL-trt-RMRCT-trt,生存资料中为HRL-HRMRCT)。因此,共有24种模拟场景。
通过比较目标区域疗效的效应值、所占样本比例及BCICR界值的不同组合,估计不同参数设置情况下BCICR、LCP和LSP的大小,分析其分布,计算目标区域中可得到趋势一致的结论的次数占总模拟次数的比例,以作为一致性趋势概率的近似估计值,进而评价目标区域与非目标区域之间疗效趋势的一致性;亦可用于探讨最优的BCICR界值的选定策略。
主要结果显示:
(1)对于不同类型数据的模拟结果,LCP和LSP的变化趋势大致相仿。具体数值和影响因素会有所差异。
(2)目标人群效应值越接近MRCT总样本人群疗效时,LCP越大。LSP随目标人群效应值的增大而增大,当目标人群效应值小于MRCT总样本人群疗效时,LSP随着二者差异的减小而增大;当目标人群效应值大于MRCT总样本人群疗效时,LSP随着二者差异增大而继续增大,说明目标区域成功的可能性更大。
(3)探索目标区域样本量比例p的变化对LCP和LSP的影响。delta_ratio在某范围内(该模拟情况下约为0.75~1.25时)或delta_diff在某一个范围内(该模拟情况下约为-0.25~0.25时),不同的p变化几乎不影响LCP和LSP的值,在不同的BCICR界值下都几乎趋于一个相对较稳定的数值。当目标人群效应值与MRCT总样本人群疗效差异较大时,目标区域样本占比p的增大将会导致一致性的降低(LCP减小),当然,目标区域疗效远好于MRCT总样本人群时,对于目标区域来说其成功的概率肯定更高(LSP增大)。
(4)探索BCICR界值对LCP和LSP的影响。二者总体来说会随着BCICR界值的增大而降低。当目标人群效应值与MRCT总样本人群疗效差异越大时,LCP和LSP越容易受到界值选择的影响。当二者差异越小时,LCP和LSP越不容易受到BCICR界值的影响,趋向于一个相对稳定的数值。举连续型变量的例子,当BCICR界值为60%,delta_ratio=0.75~1.25或delta_diff=-0.25~0.25时,无论目标区域样本占比多少,LCP均大于80%。当BCICR界值为80%、δL≥δMRCT时,无论目标区域样本占比多少,LSP基本>70%;当BCICR界值为60%、δL≥δMRCT时,LSP基本都在90%以上。总体上看,只要目标区域和MRCT总样本人群的疗效相近,LCP和LSP可以是一个相对稳定的指标,不易受到目标区域样本比例的影响。
(5)进一步从一类错误和二类错误的角度进行分析。当delta_ratio=0和delta_diff=-1时,即目标区域没有疗效时,所对应的LCP和LSP值可以看作是一类错误,随目标区域样本占比p的增大而迅速降低。结果显示,当p>10%、BCICR界值>80%、目标区域没有疗效时,LCP和LSP值均控制在20%以下;随着目标区域样本占比的增加逐渐减小;当p>20%时,一类错误基本可以控制在5%以下。当delta_ratio=1和delta_diff=0时,(1-LCP或LSP)可以看作二类错误。当BCICR界值=60%时,无论目标区域占比多少,LCP的二类错误基本控制在10%左右,LSP的二类错误约为5%;当BCICR界值=80%时,LCP二类错误为40%左右,LSP的二类错误基本控制在20%左右。
(6)对于不同的抽样方式的模拟结果,可以看出从目标区域样本反复抽样扩至MRCT或非目标区域样本量大小的Bootstrap-Enlarge样本,较从MRCT或非目标区域样本中抽取与目标区域样本量相同的Bootstrap样本这种方式能更好地控制一类错误,因为可以将目标区域与MRCT/NL之间的疗效差异进行放大,尽可能地避免将无效的药物送上市,但同时可能导致二类错误的增大。在BCICR界值的选择时可以考虑采用较小的界值。
(7)BCICR界值的选择和LCP/LSP标准的事先定义都需要全面考虑各方面因素,权衡一类错误和二类错误的接受程度,进行充分的模拟分析后进行综合判断,并事先与各领域专家和药审监管机构充分沟通商定。
本文主要针对MRCT中区域间疗效的一致性趋势评价展开研究,重点探讨了MRCT-Estimand框架的构建以及Bootstrap法在疗效一致性趋势评价中的应用。在以下几个方面有所创新:(1 )根据最新的ICH指导原则E9(R1 ),给出构建MRCT-Estimand框架的不同思路及其考量因素,为估计目标(Estimand)框架在MRCT试验设计中的应用提供了参考;(2)运用Bootstrap技术解决了MRCT一致性趋势评价中不同区域样本量不均衡的问题,提出了Bootstrap置信区间覆盖率(BCICR)及相应的目标区域一致概率(LCP)和目标区域成功概率(LSP)指标,为新药在目标区域人群中疗效的评价提供了统计学方法支持,为MRCT中疗效趋势的一致性评价提供新的策略。(3)本研究的R语言代码可进一步整理汇总成R软件包,并利用R-Shiny开发成可视化界面,便于应用与推广,不仅可以用于MRCT中不同区域疗效一致性趋势的评估,还可以应用于各种亚组分析的场景。
其中最核心的问题就是如何科学地评价不同区域之间疗效的一致性或相似性,提供证据以支持各参与MRCT的国家和地区的上市决策。从方法学的角度来看,对疗效的一致性或相似性评价问题的考量主要集中在研究计划的试验方案设计阶段以及数据收集后的统计分析和结果解读阶段。看似不同的两个阶段,实则紧密相关:研究者或监管机构需要在试验设计阶段考虑好需要获得哪些数据才能更全面更科学地评价药物的真实疗效,如何处理过程中可能出现的伴发事件,如何有效地分析和解读数据等等;否侧,仓促开展试验收集上来的数据不足以验证科学问题,就无法达到研究目的,甚至可能造成极大损失。目前,已有不少研究者对MRCT从不同角度进行了较深入的方法学探讨,但仍有一些问题尚未被有效的解决。
首先,针对研发策略的制定和试验设计,ICH对E9指南进行增补,在ICH-E9(R1)中提出了估计目标(Estimand)框架,在指导更加科学、完善的临床试验的同时也为MRCT中的研究设计、试验操作与结果分析解读都带来了不同程度的复杂性。例如,倘若不同区域的药审监管机构对研究终点的要求不一致,亦或临床实践操作不一致,对伴发事件的定义也可能不尽相同,那么就会导致不同区域的监管机构要求采用不同的估计目标。这种情况下若采用MRCT,试验如何科学的设计和实施、各区域不同的内外因素等信息如何收集和整合、试验数据如何正确的分析和解读、目标区域人群疗效与总MRCT疗效的一致性或相似性如何恰当的评估,都是亟待解决的问题。
另一方面,在数据统计分析和结果解读阶段,已有学者和机构从不同角度提出针对不同区域间药物疗效的一致性进行趋势分析的方法,如定量交互作用检验、异质性定量评价法、假设检验法、置信区间法、多元定性方法等。申办方多采用日本药品和医疗器械管理局(Pharmaceuticals and Medical DevicesAgency,PMDA)推荐的方法一,即药物在目标区域的疗效不应低于总MRCT疗效的既定的比例;同时采用其他的方法进行敏感性分析以判断结果的稳健性。由于目标区域的样本量往往占总MRCT的比例较小,这种情况下,如何克服目标区域与非目标区域样本量的不均衡、如何准确地估计不同亚组人群的药物疗效才能合理地评价区域间疗效趋势的一致性或相似性,均尚未见完善的解决方案。
针对这些尚待讨论的问题,本论文将主要从以下两个方面着手展开研究:
1.试验设计阶段:估计目标(Estimand)框架在MRCT中的应用研究和探讨本文第一部分总结和分析了ICH-E9(R1)中最新提出的估计目标框架在MRCT中的应用所出现及可能遇到的试验设计和分析解读所存在的问题;构建了MRCT-Estimand框架,以及扩展型MRCT中估计目标框架,并通过举例探索各自的优劣势与适用条件,结合中国国情进一步给出合理的应用建议。对于不同因素差异产生的不同估计目标,会存在相应不同的考虑:
MRCT-Estimand框架1思路采用相同的研究设计方案,不存在因为估计目标的不同导致实验操作和统计分析等问题;但是可能存在不同地区针对不同种族人群产生的不同临床解读方面的问题。对于MRCT-Estimand框架2思路,主要问题在于如何科学地进行数据分析,评价疗效的一致性,并从临床角度对结果进行有效解读,同时考虑监管部门是否能够接受。此外,在试验操作层面,如何收集有效信息和所有相关数据。对于MRCT-Estimand框架3-5思路,不同地区可能涉及到不止一个估计目标,因此除了各地区药物审评机构的接受程度以及临床解读方面的考量,所采用的多个估计目标主次也可能略有不同,相互支持。对于共主要估计目标或当计划将某次要估计目标作为关键次要目标放在说明书里的话,便可能涉及统计学多重性校正问题。此外,同样存在试验操作方面的问题。
扩展型MRCT-Estimand框架6-10思路的基本考量点同MRCT-Estimand1-5思路;同时可能存在更多的问题。例如,倘若总MRCT人群的结果显示某伴随用药会对疗效结果产生正向或负面的效应,则有可能对目标区域扩展阶段的治疗方案产生影响,如伴随用药的使用等。此时,若对估计目标中伴发事件的定义以及目标区域后续的估计目标进行调整,则目标区域的估计目标定有别于总MRCT的估计目标,可能就无法与前期研究中目标区域的人群进行合并分析。所以,此处暂不建议采取方案的修订,防止在结果的解读时引入更多复杂性和不确定因素。
此外,对于涉及不止一个估计目标的情况,样本量可能会有所增大。其优势在于可以提供更多的安全性数据,为疗效的评估提供更多的信息;但样本量的增加会导致经济成本和时间成本的增加,有可能间接影响到无法在某个预期的目标地区开展临床试验。若定义估计目标的要素中仅人群定义或伴发事件略有差异,可以在设计阶段考虑是否可以合并疗效数据进行分析。同时,要需要考量MRCT-Estimand框架下总一类错误的控制问题。
2.数据分析阶段:采用Bootstrap法评价MRCT中药物疗效的一致性趋势
本文第二部分运用bootstrap再抽样的技术,对不同的样本人群进行有放回的再抽样,以获得样本量相同的Bootstrap样本,使得不同样本具有一定程度的可比性。并进一步对不同的Bootstrap样本的疗效参数进行估计和比较分析。
首先,通过模拟正态分布连续型变量数据,分析比较了MRCT中不同Bootstrap样本的概率密度函数值的分布和估计值的差异,并通过构建六种线性回归模型分析不同目标区域样本比例和目标区域样本疗效对概率密度值分布的影响。结果显示:随着目标区域样本占比的增加,相同目标地区疗效所对应的概率密度值也随之增大。与原概率密度相比,Bootstrap后的概率密度曲线更加集中;Bootstrap后的的样本疗效值更加接近总MRCT。对目标地区样本占比为5%至25%时六种不同概率密度的线性回归模型的比较中观察到:基于该模拟数据,与基于原MRCT样本疗效均值和标准差的正态分布所计算出目标地区疗效值所对应的概率密度所构建的模型1和模型2相比,Bootstrap之后的样本模型3和模型4中,目标地区样本量占比显示出了其统计学意义。且随着目标地区样本量所占比例的增大,及MRCT样本与目标区域样本疗效差值的变化,概率密度值的变化更加明显,更具向心趋势。Bootstrap法在一定程度上控制了MRCT中目标区域人群样本的选择偏倚。
进一步提出Bootstrap置信区间覆盖法(Bootstrap confidence interval coverage method, BCIC)及相应的Bootstrap置信区间覆盖率(Bootstrap confidence interval coverage rate, BCICR),并采用目标区域一致概率LCP(Local Consistency Probability)和目标区域成功概率LSP(Local success probability)对MRCT中药物疗效的一致性趋势进行评价。其中,BCICR将通过对bootstrap抽取的样本疗效和置信区间与其可比的等容量样本的疗效和置信区间的交叠关系进行探索研究;LCP指在MRCT成功的前提下,目标区域与非目标区域结果一致性的概率;而LSP指在MRCT成功的前提下,新药在目标区域疗效与非目标区域一致或优于非目标区域的概率。
针对连续型变量、二分类变量及时至事件型变量分别进行模拟研究,考虑了四种Bootstrap抽取方式,即:(1)从总MRCT抽取与目标人群样本量相同的Bootstrap样本;(2)从非目标人群抽取与目标人群样本量相同的Bootstrap样本;(3)从目标区域人群抽取与总MRCT人群样本量相同的Bootstrap样本;(4)从目标区域人群抽取与非目标区域样本量相同的Bootstrap样本。此外还生成了两种疗效效应参数:delta_ratio(目标区域样本的效应值与总MRCT或非目标区域疗效效应值的比值:如正态分布资料中为δL/δMRCT,二分类资料中为RL-trt/RMRCT-trt,生存资料中为HRL/HRMRCT)和delta_difference(目标区域样本的效应值与总MRCT或非目标区域疗效效应值的差值:如正态分布资料中为δL-δMRCT,二分类资料中为RL-trt-RMRCT-trt,生存资料中为HRL-HRMRCT)。因此,共有24种模拟场景。
通过比较目标区域疗效的效应值、所占样本比例及BCICR界值的不同组合,估计不同参数设置情况下BCICR、LCP和LSP的大小,分析其分布,计算目标区域中可得到趋势一致的结论的次数占总模拟次数的比例,以作为一致性趋势概率的近似估计值,进而评价目标区域与非目标区域之间疗效趋势的一致性;亦可用于探讨最优的BCICR界值的选定策略。
主要结果显示:
(1)对于不同类型数据的模拟结果,LCP和LSP的变化趋势大致相仿。具体数值和影响因素会有所差异。
(2)目标人群效应值越接近MRCT总样本人群疗效时,LCP越大。LSP随目标人群效应值的增大而增大,当目标人群效应值小于MRCT总样本人群疗效时,LSP随着二者差异的减小而增大;当目标人群效应值大于MRCT总样本人群疗效时,LSP随着二者差异增大而继续增大,说明目标区域成功的可能性更大。
(3)探索目标区域样本量比例p的变化对LCP和LSP的影响。delta_ratio在某范围内(该模拟情况下约为0.75~1.25时)或delta_diff在某一个范围内(该模拟情况下约为-0.25~0.25时),不同的p变化几乎不影响LCP和LSP的值,在不同的BCICR界值下都几乎趋于一个相对较稳定的数值。当目标人群效应值与MRCT总样本人群疗效差异较大时,目标区域样本占比p的增大将会导致一致性的降低(LCP减小),当然,目标区域疗效远好于MRCT总样本人群时,对于目标区域来说其成功的概率肯定更高(LSP增大)。
(4)探索BCICR界值对LCP和LSP的影响。二者总体来说会随着BCICR界值的增大而降低。当目标人群效应值与MRCT总样本人群疗效差异越大时,LCP和LSP越容易受到界值选择的影响。当二者差异越小时,LCP和LSP越不容易受到BCICR界值的影响,趋向于一个相对稳定的数值。举连续型变量的例子,当BCICR界值为60%,delta_ratio=0.75~1.25或delta_diff=-0.25~0.25时,无论目标区域样本占比多少,LCP均大于80%。当BCICR界值为80%、δL≥δMRCT时,无论目标区域样本占比多少,LSP基本>70%;当BCICR界值为60%、δL≥δMRCT时,LSP基本都在90%以上。总体上看,只要目标区域和MRCT总样本人群的疗效相近,LCP和LSP可以是一个相对稳定的指标,不易受到目标区域样本比例的影响。
(5)进一步从一类错误和二类错误的角度进行分析。当delta_ratio=0和delta_diff=-1时,即目标区域没有疗效时,所对应的LCP和LSP值可以看作是一类错误,随目标区域样本占比p的增大而迅速降低。结果显示,当p>10%、BCICR界值>80%、目标区域没有疗效时,LCP和LSP值均控制在20%以下;随着目标区域样本占比的增加逐渐减小;当p>20%时,一类错误基本可以控制在5%以下。当delta_ratio=1和delta_diff=0时,(1-LCP或LSP)可以看作二类错误。当BCICR界值=60%时,无论目标区域占比多少,LCP的二类错误基本控制在10%左右,LSP的二类错误约为5%;当BCICR界值=80%时,LCP二类错误为40%左右,LSP的二类错误基本控制在20%左右。
(6)对于不同的抽样方式的模拟结果,可以看出从目标区域样本反复抽样扩至MRCT或非目标区域样本量大小的Bootstrap-Enlarge样本,较从MRCT或非目标区域样本中抽取与目标区域样本量相同的Bootstrap样本这种方式能更好地控制一类错误,因为可以将目标区域与MRCT/NL之间的疗效差异进行放大,尽可能地避免将无效的药物送上市,但同时可能导致二类错误的增大。在BCICR界值的选择时可以考虑采用较小的界值。
(7)BCICR界值的选择和LCP/LSP标准的事先定义都需要全面考虑各方面因素,权衡一类错误和二类错误的接受程度,进行充分的模拟分析后进行综合判断,并事先与各领域专家和药审监管机构充分沟通商定。
本文主要针对MRCT中区域间疗效的一致性趋势评价展开研究,重点探讨了MRCT-Estimand框架的构建以及Bootstrap法在疗效一致性趋势评价中的应用。在以下几个方面有所创新:(1 )根据最新的ICH指导原则E9(R1 ),给出构建MRCT-Estimand框架的不同思路及其考量因素,为估计目标(Estimand)框架在MRCT试验设计中的应用提供了参考;(2)运用Bootstrap技术解决了MRCT一致性趋势评价中不同区域样本量不均衡的问题,提出了Bootstrap置信区间覆盖率(BCICR)及相应的目标区域一致概率(LCP)和目标区域成功概率(LSP)指标,为新药在目标区域人群中疗效的评价提供了统计学方法支持,为MRCT中疗效趋势的一致性评价提供新的策略。(3)本研究的R语言代码可进一步整理汇总成R软件包,并利用R-Shiny开发成可视化界面,便于应用与推广,不仅可以用于MRCT中不同区域疗效一致性趋势的评估,还可以应用于各种亚组分析的场景。