论文部分内容阅读
目的:探索影响临床数据质量和试验周期的显著性因素,比较电子(E)和纸质(P)两种常见数据采集方式收集数的据在不同临床分期、不同采集地区、不同数据模块和不同临床试验中心数下差异率和疑问数据处理时间的分布情况,及两种方法各自数据差异率和处理时间的具体情况,为将来临床试验提供数据采集方法选择的实验依据,总结数据管理中数据监查和清理的最佳策略。方法:①收集来自某大型跨国制药企业数据库中、164个代谢疾病领域、一期到四期临床试验的历史数据,调查每个项目的基本情况包括:持续周期、进行地点、试验中心数、数据采集方式、所属分期、试验完成状态、数据收集模块、所属治疗领域、适应症类型、研究药物名、试验编号。②定义并量化临床数据的两个评价指标,即差异率和处理时间,并按照数据采集方式、采集地区、临床分期、数据模块、临床试验中心数进行分类,对各分类下的数据进行筛选、处理、并计算出数据差异率和处理时间。③采用一般线性模型,对经BOX-COX转换后的评价指标进行统计分析,筛选出影响两个评价指标的显著性因素,并采用非参数检验分析各影响因素下差异率和处理时间的分布情况,结合数据分布和均值、中位数统计量综合给出结论。结果:①除了试验中心数不是差异率的显著性影响因素,其他均显著:除了数据模块不是影响处理时间不同的显著性因素,其他因素均显著。对于电子方式采集的临床数据,采集地区对于差异率的影响不显著;对于纸质方式采集的数据,试验中心数对差异率、数据模块对处理时间不会造成显著性影响。②整体来说,E差异率(均值:8.37%,中位数:3.45%,下同)较P(6.27%,2.87%)高,疑问数据处理时间(14.44天,9.52天)较P(53.25天,32.22天)短。十个数据模块下,E和P差异率的分布和比较结果较混杂,没有规律可循。临床分期下,一期(Ⅰ)E差异率较P高,极端值多;二期(Ⅱ)E差异率较P高,极端值少;对于三期(Ⅲ)和四期(Ⅳ),E和P差异率分布没有显著性差异,数值上Ⅲ P高,Ⅳ E较高。对于不同采集地区,亚洲和拉丁美洲E采集的数据差异率较P高但极端值少;欧洲、北美洲两者差异率分布差异不具有显著性,数值上欧洲E较高,北美洲P稍高。对于不同的试验中心数,单中心试验E和P差异率分布没有显著性差异,数值上P稍高,多中心E较高。除了Ⅰ,所有模块、所有分期、所有地区、单中心及多中心试验F和P处理时间分布都具有显著性差异,且P较E远长,极端值多。③对于P采集的数据:COMT (17.13%,14.60%), MEDH (11.89%,10.29%), ADVE (7.41%,5.04%), DRGR (7.17%,3.25%)较其他模块差异率数值大,集中分布区域高。随着临床期数的增加,差异率成递增趋势;处理时间Ⅰ(13.63天,6.91天)最短,Ⅲ(76.81天,45.98天)最长。差异率欧洲(6.93%,3.32%)和拉丁美洲(6.74%,3.76%)较高,亚洲(3.43%,0.89%)最低;处理时间上拉丁美洲(99.38天,58.25天)最长,亚洲(22.00天,19.30天)最短。多中心(77.20天,47.96天)较单中心(33.37天,21.78天)处理疑问数据的周期长。④对于E采集的数据:COMT (23.03%,20.42%)、MEDH (25.04%,20.73%)、ADVE (11.85%,8.74%)、DRGR (7.81%,2.14%)、DEMG(7.68%,5.79%)较其他模块差异率数值大,集中分布区域高;LAB处理时间(26.01天,13.36天)较其他模块长。Ⅱ差异率(9.82%,5.80%)较高,Ⅰ(7.86%,2.65%)较低但极端值较多;拉丁美洲处理时间(25.41天,21.54天)最长,亚洲(7.98天,6.05天)最短;多中心试验差异率(9.80%,4.92%)较单中心(7.81%,2.71%)差异率高,处理时间(21.88天,16.77天)较单中心(11.47天,6.78天)长。结论:①数据采集方式是影响数据差异率和疑问数据处理时间的显著性因素,符合课题立意和预期。在临床数据收集、录入及核查清理的过程中,应综合考虑采集方法、临床分期、采集地区、数据模块对差异率,及采集方法、临床分期、采集地区、试验中心数对处理时间的不同影响。②整体来说,P在提高数据质量、可控稳定性方面较E占有优势;E在缩短时间周期、控制极端值方面占有优势。细分来看,数据模块对于采集方法的选择没有大的参考价值。对于工和Ⅱ,若预算允许可采用E采集临床数据,但需加强对于数据质量的监管,如可增加前期数据质量监管环节或从优化电子系统的功能上考虑;在预算不允许的情况下,采用P方式可提高数据质量;Ⅲ E较P可提高数据质量、减少极端值、并大大缩短试验周期;Ⅳ则需根据实际情况如试验持续时间、试验地点、纳入病例数、试验设计复杂程度等来综合选择采集方法。在亚洲和拉丁美洲采用E采集临床数据时可较好地控制极端值现象,缩短试验周期,但在控制数据质量和可控稳定性方面略显不足,需结合项目预算和当地医疗条件来考虑;欧洲由于涉及国家众多需根据实际情况综合选择;对于北美洲进行的临床试验,E具有较大的优势。对于单中心试验可倾向于用E采集数据,多中心在时间允许的情况下可倾向于选择P方式。③选择P采集临床数据时,应加强对COMT、MEDH、ADVE、DRGR模块,1、2临床,欧洲和拉丁美洲地区的数据监察力度,提高培训、及对试验方案的依从程度,吸取如日本等数据质量较高地区的管理经验,尽量防止数据大面积缺失的现象;简化后期(2、3)临床、拉丁美洲及多中心试验的数据处理流程,提高各方对于疑问数据的反应、处理及反馈速度。④选择E采集临床数据时,应加大对COMT、MEDH、ADVE、DRGR、DEMG模块,Ⅱ及多中心试验的数据收集和监管力度;简化后期临床、拉丁美洲及多中心试验的数据处理流程,提高各实验室标准的统一化程度,及对疑问数据响应的一致化程度以优化实验室模块疑问数据处理时间过长的问题;在试验开始前应做好充分的准备,如人员培训、系统性能设定及前期安全维护等工作,控制Ⅰ极端值的数量。