国际多区域临床试验中药物疗效一致性趋势评价方法的相关研究

来源 :空军军医大学 | 被引量 : 0次 | 上传用户:fengwei27149
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
药物的全球同步研发,已经成为一种共享全球研发资源的开发模式,可以控制不必要的资源浪费,有助于解决在关键市场上市时间的滞后问题,使患者有更早的机会获得更新更好的治疗方案。国际多区域临床试验(Multi-regional Clinical Trials, MRCT)的目的在于多区域同步研发、同步注册上市,提高药物研发的效率,以利于更多地区的患者接受新的更有效的治疗方案。然而,由于不同区域之间存在种族、医疗环境等对临床结果产生潜在影响的因素,新药同步注册对于各区域监管机构和申办方来说仍面临着各种各样的挑战。
  其中最核心的问题就是如何科学地评价不同区域之间疗效的一致性或相似性,提供证据以支持各参与MRCT的国家和地区的上市决策。从方法学的角度来看,对疗效的一致性或相似性评价问题的考量主要集中在研究计划的试验方案设计阶段以及数据收集后的统计分析和结果解读阶段。看似不同的两个阶段,实则紧密相关:研究者或监管机构需要在试验设计阶段考虑好需要获得哪些数据才能更全面更科学地评价药物的真实疗效,如何处理过程中可能出现的伴发事件,如何有效地分析和解读数据等等;否侧,仓促开展试验收集上来的数据不足以验证科学问题,就无法达到研究目的,甚至可能造成极大损失。目前,已有不少研究者对MRCT从不同角度进行了较深入的方法学探讨,但仍有一些问题尚未被有效的解决。
  首先,针对研发策略的制定和试验设计,ICH对E9指南进行增补,在ICH-E9(R1)中提出了估计目标(Estimand)框架,在指导更加科学、完善的临床试验的同时也为MRCT中的研究设计、试验操作与结果分析解读都带来了不同程度的复杂性。例如,倘若不同区域的药审监管机构对研究终点的要求不一致,亦或临床实践操作不一致,对伴发事件的定义也可能不尽相同,那么就会导致不同区域的监管机构要求采用不同的估计目标。这种情况下若采用MRCT,试验如何科学的设计和实施、各区域不同的内外因素等信息如何收集和整合、试验数据如何正确的分析和解读、目标区域人群疗效与总MRCT疗效的一致性或相似性如何恰当的评估,都是亟待解决的问题。
  另一方面,在数据统计分析和结果解读阶段,已有学者和机构从不同角度提出针对不同区域间药物疗效的一致性进行趋势分析的方法,如定量交互作用检验、异质性定量评价法、假设检验法、置信区间法、多元定性方法等。申办方多采用日本药品和医疗器械管理局(Pharmaceuticals and Medical DevicesAgency,PMDA)推荐的方法一,即药物在目标区域的疗效不应低于总MRCT疗效的既定的比例;同时采用其他的方法进行敏感性分析以判断结果的稳健性。由于目标区域的样本量往往占总MRCT的比例较小,这种情况下,如何克服目标区域与非目标区域样本量的不均衡、如何准确地估计不同亚组人群的药物疗效才能合理地评价区域间疗效趋势的一致性或相似性,均尚未见完善的解决方案。
  针对这些尚待讨论的问题,本论文将主要从以下两个方面着手展开研究:
  1.试验设计阶段:估计目标(Estimand)框架在MRCT中的应用研究和探讨本文第一部分总结和分析了ICH-E9(R1)中最新提出的估计目标框架在MRCT中的应用所出现及可能遇到的试验设计和分析解读所存在的问题;构建了MRCT-Estimand框架,以及扩展型MRCT中估计目标框架,并通过举例探索各自的优劣势与适用条件,结合中国国情进一步给出合理的应用建议。对于不同因素差异产生的不同估计目标,会存在相应不同的考虑:
  MRCT-Estimand框架1思路采用相同的研究设计方案,不存在因为估计目标的不同导致实验操作和统计分析等问题;但是可能存在不同地区针对不同种族人群产生的不同临床解读方面的问题。对于MRCT-Estimand框架2思路,主要问题在于如何科学地进行数据分析,评价疗效的一致性,并从临床角度对结果进行有效解读,同时考虑监管部门是否能够接受。此外,在试验操作层面,如何收集有效信息和所有相关数据。对于MRCT-Estimand框架3-5思路,不同地区可能涉及到不止一个估计目标,因此除了各地区药物审评机构的接受程度以及临床解读方面的考量,所采用的多个估计目标主次也可能略有不同,相互支持。对于共主要估计目标或当计划将某次要估计目标作为关键次要目标放在说明书里的话,便可能涉及统计学多重性校正问题。此外,同样存在试验操作方面的问题。
  扩展型MRCT-Estimand框架6-10思路的基本考量点同MRCT-Estimand1-5思路;同时可能存在更多的问题。例如,倘若总MRCT人群的结果显示某伴随用药会对疗效结果产生正向或负面的效应,则有可能对目标区域扩展阶段的治疗方案产生影响,如伴随用药的使用等。此时,若对估计目标中伴发事件的定义以及目标区域后续的估计目标进行调整,则目标区域的估计目标定有别于总MRCT的估计目标,可能就无法与前期研究中目标区域的人群进行合并分析。所以,此处暂不建议采取方案的修订,防止在结果的解读时引入更多复杂性和不确定因素。
  此外,对于涉及不止一个估计目标的情况,样本量可能会有所增大。其优势在于可以提供更多的安全性数据,为疗效的评估提供更多的信息;但样本量的增加会导致经济成本和时间成本的增加,有可能间接影响到无法在某个预期的目标地区开展临床试验。若定义估计目标的要素中仅人群定义或伴发事件略有差异,可以在设计阶段考虑是否可以合并疗效数据进行分析。同时,要需要考量MRCT-Estimand框架下总一类错误的控制问题。
  2.数据分析阶段:采用Bootstrap法评价MRCT中药物疗效的一致性趋势
  本文第二部分运用bootstrap再抽样的技术,对不同的样本人群进行有放回的再抽样,以获得样本量相同的Bootstrap样本,使得不同样本具有一定程度的可比性。并进一步对不同的Bootstrap样本的疗效参数进行估计和比较分析。
  首先,通过模拟正态分布连续型变量数据,分析比较了MRCT中不同Bootstrap样本的概率密度函数值的分布和估计值的差异,并通过构建六种线性回归模型分析不同目标区域样本比例和目标区域样本疗效对概率密度值分布的影响。结果显示:随着目标区域样本占比的增加,相同目标地区疗效所对应的概率密度值也随之增大。与原概率密度相比,Bootstrap后的概率密度曲线更加集中;Bootstrap后的的样本疗效值更加接近总MRCT。对目标地区样本占比为5%至25%时六种不同概率密度的线性回归模型的比较中观察到:基于该模拟数据,与基于原MRCT样本疗效均值和标准差的正态分布所计算出目标地区疗效值所对应的概率密度所构建的模型1和模型2相比,Bootstrap之后的样本模型3和模型4中,目标地区样本量占比显示出了其统计学意义。且随着目标地区样本量所占比例的增大,及MRCT样本与目标区域样本疗效差值的变化,概率密度值的变化更加明显,更具向心趋势。Bootstrap法在一定程度上控制了MRCT中目标区域人群样本的选择偏倚。
  进一步提出Bootstrap置信区间覆盖法(Bootstrap confidence interval coverage method, BCIC)及相应的Bootstrap置信区间覆盖率(Bootstrap confidence interval coverage rate, BCICR),并采用目标区域一致概率LCP(Local Consistency Probability)和目标区域成功概率LSP(Local success probability)对MRCT中药物疗效的一致性趋势进行评价。其中,BCICR将通过对bootstrap抽取的样本疗效和置信区间与其可比的等容量样本的疗效和置信区间的交叠关系进行探索研究;LCP指在MRCT成功的前提下,目标区域与非目标区域结果一致性的概率;而LSP指在MRCT成功的前提下,新药在目标区域疗效与非目标区域一致或优于非目标区域的概率。
  针对连续型变量、二分类变量及时至事件型变量分别进行模拟研究,考虑了四种Bootstrap抽取方式,即:(1)从总MRCT抽取与目标人群样本量相同的Bootstrap样本;(2)从非目标人群抽取与目标人群样本量相同的Bootstrap样本;(3)从目标区域人群抽取与总MRCT人群样本量相同的Bootstrap样本;(4)从目标区域人群抽取与非目标区域样本量相同的Bootstrap样本。此外还生成了两种疗效效应参数:delta_ratio(目标区域样本的效应值与总MRCT或非目标区域疗效效应值的比值:如正态分布资料中为δL/δMRCT,二分类资料中为RL-trt/RMRCT-trt,生存资料中为HRL/HRMRCT)和delta_difference(目标区域样本的效应值与总MRCT或非目标区域疗效效应值的差值:如正态分布资料中为δL-δMRCT,二分类资料中为RL-trt-RMRCT-trt,生存资料中为HRL-HRMRCT)。因此,共有24种模拟场景。
  通过比较目标区域疗效的效应值、所占样本比例及BCICR界值的不同组合,估计不同参数设置情况下BCICR、LCP和LSP的大小,分析其分布,计算目标区域中可得到趋势一致的结论的次数占总模拟次数的比例,以作为一致性趋势概率的近似估计值,进而评价目标区域与非目标区域之间疗效趋势的一致性;亦可用于探讨最优的BCICR界值的选定策略。
  主要结果显示:
  (1)对于不同类型数据的模拟结果,LCP和LSP的变化趋势大致相仿。具体数值和影响因素会有所差异。
  (2)目标人群效应值越接近MRCT总样本人群疗效时,LCP越大。LSP随目标人群效应值的增大而增大,当目标人群效应值小于MRCT总样本人群疗效时,LSP随着二者差异的减小而增大;当目标人群效应值大于MRCT总样本人群疗效时,LSP随着二者差异增大而继续增大,说明目标区域成功的可能性更大。
  (3)探索目标区域样本量比例p的变化对LCP和LSP的影响。delta_ratio在某范围内(该模拟情况下约为0.75~1.25时)或delta_diff在某一个范围内(该模拟情况下约为-0.25~0.25时),不同的p变化几乎不影响LCP和LSP的值,在不同的BCICR界值下都几乎趋于一个相对较稳定的数值。当目标人群效应值与MRCT总样本人群疗效差异较大时,目标区域样本占比p的增大将会导致一致性的降低(LCP减小),当然,目标区域疗效远好于MRCT总样本人群时,对于目标区域来说其成功的概率肯定更高(LSP增大)。
  (4)探索BCICR界值对LCP和LSP的影响。二者总体来说会随着BCICR界值的增大而降低。当目标人群效应值与MRCT总样本人群疗效差异越大时,LCP和LSP越容易受到界值选择的影响。当二者差异越小时,LCP和LSP越不容易受到BCICR界值的影响,趋向于一个相对稳定的数值。举连续型变量的例子,当BCICR界值为60%,delta_ratio=0.75~1.25或delta_diff=-0.25~0.25时,无论目标区域样本占比多少,LCP均大于80%。当BCICR界值为80%、δL≥δMRCT时,无论目标区域样本占比多少,LSP基本>70%;当BCICR界值为60%、δL≥δMRCT时,LSP基本都在90%以上。总体上看,只要目标区域和MRCT总样本人群的疗效相近,LCP和LSP可以是一个相对稳定的指标,不易受到目标区域样本比例的影响。
  (5)进一步从一类错误和二类错误的角度进行分析。当delta_ratio=0和delta_diff=-1时,即目标区域没有疗效时,所对应的LCP和LSP值可以看作是一类错误,随目标区域样本占比p的增大而迅速降低。结果显示,当p>10%、BCICR界值>80%、目标区域没有疗效时,LCP和LSP值均控制在20%以下;随着目标区域样本占比的增加逐渐减小;当p>20%时,一类错误基本可以控制在5%以下。当delta_ratio=1和delta_diff=0时,(1-LCP或LSP)可以看作二类错误。当BCICR界值=60%时,无论目标区域占比多少,LCP的二类错误基本控制在10%左右,LSP的二类错误约为5%;当BCICR界值=80%时,LCP二类错误为40%左右,LSP的二类错误基本控制在20%左右。
  (6)对于不同的抽样方式的模拟结果,可以看出从目标区域样本反复抽样扩至MRCT或非目标区域样本量大小的Bootstrap-Enlarge样本,较从MRCT或非目标区域样本中抽取与目标区域样本量相同的Bootstrap样本这种方式能更好地控制一类错误,因为可以将目标区域与MRCT/NL之间的疗效差异进行放大,尽可能地避免将无效的药物送上市,但同时可能导致二类错误的增大。在BCICR界值的选择时可以考虑采用较小的界值。
  (7)BCICR界值的选择和LCP/LSP标准的事先定义都需要全面考虑各方面因素,权衡一类错误和二类错误的接受程度,进行充分的模拟分析后进行综合判断,并事先与各领域专家和药审监管机构充分沟通商定。
  本文主要针对MRCT中区域间疗效的一致性趋势评价展开研究,重点探讨了MRCT-Estimand框架的构建以及Bootstrap法在疗效一致性趋势评价中的应用。在以下几个方面有所创新:(1 )根据最新的ICH指导原则E9(R1 ),给出构建MRCT-Estimand框架的不同思路及其考量因素,为估计目标(Estimand)框架在MRCT试验设计中的应用提供了参考;(2)运用Bootstrap技术解决了MRCT一致性趋势评价中不同区域样本量不均衡的问题,提出了Bootstrap置信区间覆盖率(BCICR)及相应的目标区域一致概率(LCP)和目标区域成功概率(LSP)指标,为新药在目标区域人群中疗效的评价提供了统计学方法支持,为MRCT中疗效趋势的一致性评价提供新的策略。(3)本研究的R语言代码可进一步整理汇总成R软件包,并利用R-Shiny开发成可视化界面,便于应用与推广,不仅可以用于MRCT中不同区域疗效一致性趋势的评估,还可以应用于各种亚组分析的场景。
其他文献
在目前的教室讲台语音系统中,存在无法实现有效地降低噪音和定向语音增强等问题。在麦克风阵列系统中,可利用阵列信号处理的相关知识,采集语音信号的空间信息,实现语音定位和对期望方向的语音信号进行增强。  本论文针对基于麦克风阵列的教室讲台语音增强系统进行研究,并在语音定位和语音增强算法研究的基础上,设计了基于麦克风阵列的教室讲台语音增强系统。本文的工作要点如下:  (1)研究了广义互相关法(GCC)在教
煤岩声发射信号中包含了大量的煤矿动力灾害前兆信息,通过对其进行检测与定位研究,可实现煤矿井下动力灾害预警,对保障煤矿安全生产和人身安全具有重要意义。但由于煤矿井下强机械噪声的干扰,导致煤岩声发射信号发生畸变甚至淹没在噪声中,严重影响了信号检测与声源定位。  以该问题为背景,本文对强机械噪声干扰下煤岩声发射信号检测与声源定位算法开展了系统的研究。主要研究内容如下:  (1)研究了强机械噪声环境下煤岩
学位
报警系统对现代工业的安全生产与高效运行具有十分重要的作用。然而,现代工业中的报警系统普遍存在着干扰报警过多的问题,严重影响了报警系统的性能。现代工业报警系统经常采用报警死区减少干扰报警的数量。但是,报警死区在实际应用中面临着两个尚未解决的基本问题:如何判断某个信号是否适合使用报警死区?如何设计最优报警死区宽度?本文的研究目标就是初步解决这两个基本问题,从而针对合适的信号,使用相应的报警死区,减少干
学位
热固性树脂基复合材料具有许多优异的性质,如耐高温、硬度大、耐化学试剂、尺寸稳定性好等,广泛应用于防护涂料、胶粘剂、浇铸材料、增强塑料等领域。热固性树脂基复合材料的性能与其分子结构密切相关,而分子结构在很大程度上取决于树脂体系以及与固化过程有关的固化温度、固化时间、固化程度等因素。所以,为了开发高性能热固性树脂基复合材料,必须对热固性树脂的固化过程进行有效监测,研究树脂体系和固化工艺对树脂固化过程和
该论文的主要目的是采用固相合成反应合成新型的[AMM′Q]型多元金属硒化物.经EDS表征,合成了十九个新的[AMM′Q]型多元金属硒化物.测定了KGeSe和KCuInSe的晶体结构.通过测定KGeSe,KCuInSe的反射光谱,探讨了这两种晶体的光吸收特性.探讨了固相合成反应的规律.
学位
该文使用截流法和流动法着重考察了O和CS、COS在光照和无光照条件下的反应.无光照条件下CS和O的反应对于组分CS和O分别表观为一次,-d[O]/dt=k[CS][O].无光照条件下COS和O的反应也有-d[O]/dt=k[COS][O],但是相对于CS和O的反应而言,COS和O的反应非常缓慢.在红外光谱中读出CS和O的反应,在CS和O不同的浓度比例时,产物是不同的.当[O]]时,O和CS的反应产
学位
该论文首次报道了碳化钨负载的SO/ZrO(PSZ)固体超强酸催化剂(WC/PSZ),并研究了该催化剂上的正戊烷反应情况及影响催化剂活性的各种因素,与载Pt的SO/ZrO催化剂相比显示出更佳的催化性能,应用BET、XRD、XPS和FTIR等分析手段对催化剂进行了表征,得到以下结论:1.常温下PSZ固体超强酸催化剂对正戊烷具有异构化和裂解的双重作用,主要产物分别为异戊烷和异丁烷.2.高温条件下,PSZ
学位
大气环境是一个巨大、复杂、多因素相互作用的系统。PM10指空气动力学直径DP≤10μm的气体或固体颗粒物。几乎所有的大气污染物都会成为PM10污染的组成部分。由于大气污染中可吸入颗粒物PM10的特殊组成结构、理化性质以及对人体产生的越来越明显的伤害,PM10的监测与治理在整个大气环境整治中具有重要的地位与作用。但是,由于PM10在时间、空间与数量上的随机性和不确定性,增加了政府与企业如何选择有效的
学位
第一部分RIG-I样受体基因多态性与HCV感染慢性化的关联研究  丙型肝炎病毒(hepatitis C virus,HCV)感染严重危害全人类的健康。根据感染持续的时间,HCV感染可被分为急性和慢性感染。急性感染指感染者不经任何治疗即可在感染6个月之内自行清除病毒,通常无明显症状。仅15%-45%的感染者可以自限清除HCV,其余60%-80%的感染者会发展为慢性感染。固有免疫系统是识别病毒的第一道
铁是人体所必需的微量元素,参与血红蛋白、肌红蛋白、氧化呼吸链等重要生命物质的合成。铁稳态代谢调控对维持机体健康十分重要。铁缺乏会出现缺铁性贫血;而铁的蓄积会导致细胞死亡、组织损伤,甚至引发疾病,如遗传性血色病、地中海贫血等。铁调素是由肝脏分泌,具有调控机体铁代谢作用的核心激素,可以通过诱导小肠上皮细胞和巨噬细胞表面的铁外排转运蛋白降解来抑制机体铁吸收和铁循环,维持机体的铁稳态平衡。  铁稳态失衡,
学位