临床数据质量评估框架与系统研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:d34276
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
临床数据中包含了大量患者疾病发展和诊断治疗信息,是发现临床证据、推进医学创新的重要资源。然而,临床数据的质量问题却成为有效利用数据的一大阻碍。开展临床数据质量评估,客观发现数据的质量问题,对于改善数据质量、促进数据有效利用意义重大。数据质量评估往往由评估人依据相关数据质量理论知识,针对具体场景定义数据质量评估项,再执行相应的质量评估。然而,目前无论是评估项的定义还是评估的执行都受到过多人为主观因素影响,导致评估结果出现偏差与不一致,难以客观反映数据的真实质量水平,主要体现在:1.针对现有研究中数据质量指标抽象程度过高的问题,本论文整合分析相关文献中临床数据维度与评估指标,针对实际项目中数据质量问题对指标进行分解、复用、合并和归纳,构建了临床数据质量评估框架。通过专家评分对其进行效度验证,并根据专家建议进行完善。最终该框架涵盖5个数据质量维度,包含41项临床数据质量评估指标。实验证明,相较于传统评估框架,本论文的评估框架能更为精确地对应具体场景中的数据质量问题,从而更具备客观性和可操作性。2.虽然大部分评估指标执行时可采用基于规则的质量评估工具,但针对特定的应用场景往往需要人工编辑数百乃至上千条评估规则,耗时耗力且容易疏漏出错,而且仍然存在像“数据与原始数据一致”之类的评估指标不能简单利用规则实现,需要依赖人工进行评估,执行时易受评估人主观经验等因素影响。综上,由于缺乏一个全面覆盖评估指标的自动化临床数据质量评估系统,很难保证评估指标执行上的一致性。针对以上问题,本论文研究更精确且可计算的临床数据质量评估框架,在此基础上开展自动化临床数据质量评估的关键技术研究、系统开发与应用实践。本论文主要工作包括:1.针对现有研究中数据质量指标抽象程度过高的问题,本论文整合分析相关文献中临床数据维度与评估指标,针对实际项目中数据质量问题对指标进行分解、复用、合并和归纳,构建了临床数据质量评估框架。该框架涵盖5个数据质量维度,包含41项临床数据质量评估指标。通过专家评分对指标进行效度验证,并根据专家建议完善指标。实验证明,相较于传统评估框架,本论文的评估框架能更为精确地对应具体场景中的数据质量问题,从而更具备客观性和可操作性。2.针对现有研究中数据质量指标缺乏具体量化实施步骤的问题,本论文构建了临床数据质量评估本体;对指标评估条件、评估对象、质量约束进行结构化表达;针对每项自然文本表达的评估指标,进一步定义可被机器自动识别的评估项的形式化表达范式;从而建立了一套完整描述从评估指标概念到评估执行过程的可计算的临床数据质量评估框架。实验表明,本论文提出的可计算评估框架可表达典型数据质量标准的所有评估项,减少评估项定义时主观经验导致的偏差,提高数据质量评估的一致性。3.针对框架中可用规则表达和执行的评估指标,本论文提出了一种基于规则自动化生成的数据质量评估方法。在数据集具备规范化表达的信息模型(以open EHR模型为例)时,可自动提取出模型表达文件中蕴含的质量约束信息;基于评估指标的形式化表达范式构建对应的规则模板,以此自动生成计算机可执行的数据质量评估规则。相比传统方法,该方法解决了目前大量规则定义仍然依赖人工的问题,提高评估规则定义效率的同时大幅减少由主观经验导致的评估误差。4.针对框架中数据溯源指标评估依赖人工开展,仅依靠单一数据源进行溯源,难以保证评估结果的一致性与准确性的问题。本论文基于典型临床应用场景——疾病注册数据库开展案例研究,利用临床丰富的数据资源,提出一种面向纸张、文本数据的多数据源自动溯源技术。临床实践表明,该方法相较于传统单一数据源溯源方法,能更快速、全面、准确地发现数据中的质量问题。5.基于本论文提出的质量评估框架,设计并实现了可高度扩展的自动化临床数据质量评估系统,可针对不同评估指标动态“插入”最合适的评估模块,并自动执行数据质量评估,从而可适应不同场景的临床数据质量评估需求。6.基于上述方法和系统,本论文建立了一套面向实际应用场景的临床数据质量评估实施指南,并在冠状动脉疾病注册研究数据集上进行了应用验证。通过与传统评估框架进行对比,不同临床专家基于本论文的临床数据评估框架所构建的评估项具有更好的全面性与一致性,自动化评估系统的应用也进一步减少了评估结果的人工偏差,并提升评估效率。
其他文献
心肌缺血是造成心源性猝死(SCD)的主要原因,缺血导致心肌电生理特性改变,从而促进电交替的发生,在心电图中表现为T波电交替(TWA),TWA具有重要的临床应用价值,它既可以用来对SCD进行危险分层,也能作为预测心律失常发生的重要指标。因此,探究心肌缺血下,形成心脏电交替的离子机制,并探究影响TWA特征的因素,对临床诊治具有重要的指导意义。心肌缺血和高钾、多酸、缺氧有关,这些缺血成分会让细胞膜上离子
学位
心血管疾病是威胁人类健康的头号杀手,其发病率和死亡率在全球范围内呈逐年上升趋势,并趋于年轻化。室性心动过速(室速)和心房颤动(房颤)是临床上常见的心脏疾病,由于室速和房颤的内在发生及维持机制尚未得到充分研究,导致临床治疗策略和手段仍存在诸多不足,包括术中成功率不高,术后复发率高等。鉴于临床及实验研究的局限性,国际上越来越多的研究小组利用计算机仿真建模来研究各种心脏疾病的发生及维持机制,并利用这种方
学位
随着近年来临床数据的快速积累,基于回顾性数据的临床决策支持研究已成为医学信息学领域的一项研究重点。然而,现有决策支持研究大多着眼于对单一特定疾病的针对性建模,往往忽视了临床实践中广泛存在的疾病关联关系;少数研究已基于多标签学习范式对疾病关系加以利用,但现有通用算法仍无法满足临床决策支持的诸多领域需求。因此,研究面向决策支持任务的领域性多标签学习方法,实现疾病关联信息高效利用,对提升临床决策支持研究
学位
制动摩擦副和轮轨摩擦副是车辆系统中两个重要的摩擦接触副,其工作稳定性直接影响列车的正常运行以及行车安全。当摩擦副发生自激振动时,往往会引起接触部件之间产生振动和冲击,并传递到相关连接部件,加速部件的磨损和疲劳损伤等故障,同时产生剧烈尖叫噪声,降低乘车舒适性。轮轨系统的钢轨波磨和车轮多边形磨耗是典型的轮轨损伤问题,严重影响轨道结构及其相关零部件的精度、可靠性和使用寿命。已有研究发现,摩擦自激振动可能
学位
磁共振化学交换饱和转移(CEST)成像因可以探测到人体内多种低浓度代谢产物而被广泛应用于各类疾病的临床诊断。然而,CEST成像技术仍面临主磁场(B0场)频率漂移、饱和时间不足、饱和强度不均匀、饱和方案待优化等诸多技术挑战导致CEST成像的稳定性和敏感度仍不能满足临床需求。在本文中,我们旨在解决这些技术挑战,以提高CEST成像稳定性和敏感度。1.本文提出了基于梯度回波读出的频率稳定CEST序列用于B
学位
肺部疾病是肺脏病变或全身性疾病的肺部表现。随着人口老龄化、疾病年轻化等问题日益凸显,未来肺部疾病患病人数也会显著增多,尤其是肺癌和肺部感染对人体生命健康构成了极大威胁。目前临床上肺部疾病诊断技术通常是侵入性或辐射性的,尚未实现快速便捷的无创筛查。此外,化疗作为常见的肺癌治疗方法,药物引起的心脏毒性也须预先评估。本文致力于研究乐甫(Love)型声表面波传感器的设计与制造方法,自主搭建了一套基于该传感
学位
尿液是生物疾病标志物的重要来源,因为尿液易于收集,含有较少的蛋白质,而且直接反映了肾脏的病理变化。尿液分析常被用作常规的医学检查,可用于癌症,泌尿疾病等疾病的早期诊断。尿液中疾病标志物的检测方法有很多,包括色谱法,电化学法,荧光光谱和比色法等,其中比色法由于灵敏度高,操作简便,检测快速,能更好的普及基层,更符合疾病早期筛查的要求。因此比色法作为现场快速检测疾病标志物的手段大有潜力。本论文研究了纳米
学位
随着我国医疗信息化的不断发展,电子病历在临床诊疗中发挥着越来越重要的作用。电子病历中包含患者的检查异常、指标变化趋势、疾病风险因素等非明示化疾病隐含信息,对于临床诊疗、风险预警和早期筛查具有重要的临床价值。然而在临床实践中,电子病历中的隐含疾病信息并未得到充分利用:医疗专科化使得医生对于其他科室疾病的临床信息不敏感、不关注,对于患者数据中隐含疾病风险因素容易忽略。同时,患者跨机构就诊造成电子病历数
学位
磁共振成像(MRI)作为现代医疗影像体系中的一个重要组成部分,得到了越来越广泛的应用。其中,作为必不可少部件之一的梯度线圈,为图像重建提供了重要的空间编码信息。为设计出更高性能的梯度线圈,提高其产生的梯度强度,增加梯度切换速率,减少线圈自身的阻抗,以满足不断提高的成像要求,愈发复杂的空间结构以及更加严格的工程限制,梯度线圈的设计方法也随之不断发展。为适应MRI对梯度线圈性能不断增长的需求,本文以有
学位
图像去噪是计算机视觉领域的一大基础性问题,长久以来备受学者们关注。近年来,深度学习的迅速发展也为图像去噪拓展了新的研究方向,基于卷积神经网络的去噪方法相比传统先验方法取得了去噪指标上的大幅提升。然而目前常见的去噪网络模型在实用性方面仍面临诸多问题,例如:去噪网络模型只能针对特定噪声训练而无法同时应对多种类型的噪声;模型在剔除噪声的同时难以保留图像的细节特征;深层网络堆叠导致的模型运行消耗增加。本文
学位