论文部分内容阅读
背景:
随着经济水平的提高和生活方式的改变,妊娠期糖尿病的患病率在世界范围内呈上升趋势,已成为最常见的孕期并发症之一。妊娠期糖尿病的发生不仅会导致严重的不良妊娠结局,母亲及其子代发展为2型糖尿病等代谢相关疾病的风险也会明显增加,使得整个医疗保健系统和家庭的经济负担、照护负担加重。在疾病发生之前识别高危人群并进行干预是疾病预防的主要策略,故越来越多的研究者开始关注妊娠期糖尿病的早期预测及早期干预,以延缓甚至避免妊娠期糖尿病的发生。目前现有风险预测研究中,尚缺乏基于风险因素量化分析基础上建立的快速稳定的早期风险预测模型,因此难以实现高危人群的精准识别。而且现有的干预研究缺乏有效的理论指导,干预内容大多来源于归纳总结而非基于系统循证,且难以满足不同个体的个性化需求,另外由于时间和花费等原因,干预方式很难做到持续性实施及大规模推广。在此背景下,基于数据挖掘运用机器学习算法训练妊娠期糖尿病高危人群早期发病风险预测模型,实现高危人群筛选,并开展基于理论分析、最佳证据指导的妊娠期糖尿病高危人群干预传播模式和干预技术研究是十分必要的。
目的:
1.基于数据挖掘,运用机器学习算法训练妊娠期糖尿病发病风险预测模型,完成妊娠期糖尿病高危人群的早期识别;
2.基于理论研究,进行理论融合构建妊娠期糖尿病高危人群干预传播模式,并与专业信息技术人员合作,搭建妊娠期糖尿病高危人群干预微平台;
3.验证妊娠期糖尿病高危人群干预传播模式和微平台的应用效果。
方法:
本研究分为三个部分。
第一部分,基于前瞻性队列研究设计,选取2017年11月~2018年8月,在青岛市市南区、崂山区、黄岛区妇保所及青岛大学附属医院建档、产检的妊娠期女性为研究对象,采用问卷调查法建立妊娠期糖尿病发病风险预测的电子健康档案数据库。基于Python,分别采用医学领域中较常用的逻辑回归、决策树、随机森林、梯度决策树、支持向量机、人工神经网络等6种算法进行建模,比较6种算法对妊娠期糖尿病发病风险预测的准确率,选择预测准确率最优的算法构建妊娠期糖尿病发病风险预测模型。
第二部分,基于理论研究,融合慢性病管理模型、马莱兹克系统传播模式,确定妊娠期糖尿病高危人群干预传播模式。以该模式为指导,进行服务提供系统设计,循证最优的妊娠期糖尿病高危人群干预策略,并与信息技术人员合作,基于微信公众号及微信小程序,搭建妊娠期糖尿病高危人群干预微平台。
第三部分,妊娠期糖尿病高危人群干预传播模式的预试验研究。2018年10月~2019年3月,在青岛大学附属医院产科门诊招募孕周小于等于16周,经妊娠期糖尿病发病风险预测模型筛查属于妊娠期糖尿病高危人群的个体为研究对象,随机分为干预组(n=30)和对照组(n=30)。对照组给予常规门诊教育,干预组在对照组基础上,基于妊娠期糖尿病高危人群干预传播模式,使用妊娠期糖尿病高危人群干预微平台进行干预。采用招募率、失访率及干预组的学习依从性初步分析干预传播模式的可行性;干预3个月后通过分析两组研究对象妊娠期糖尿病发生情况、孕期体重增加、空腹血糖水平、妊娠期糖尿病知识改变、积极度及自我管理行为方面的改变,初步探讨干预模式的潜在作用;运用半结构式访谈挖掘研究对象对妊娠期糖尿病高危人群干预微平台的使用体验。
结果:
第一部分,本研究纳入1625名妊娠期女性,采集到有效数据4806条,经数据清洗,定义了体格检查、既往史、个人史、家族史、专科检查、实验室检查、饮食运动习惯等67个妊娠期糖尿病相关预测指标。
首先纳入全部67个指标,共得到3265条数据,建立数据集F1,结果显示,6种算法预测模型的测试集准确率为0.90~0.98、AUC(ROC曲线下面积)为0.50~0.84,但阳性病例预测正确率仅为0~68.29%。其次纳入全部4806条数据,共得到38个指标,建立数据集F2,结果显示,6种算法预测模型测试集准确率为0.75~0.89、ROC曲线下面积为0.71~0.87、阳性病例预测正确率为72.38%~79.44%。
为探讨F2缺失的指标对模型的影响,选取F1的3265条数据、F2的38个指标建立数据集F3,结果显示,6种算法预测模型的测试集准确率为0.90~0.94、ROC曲线下面积为0.50~0.66,阳性病例的预测正确率降至0~32.92%。
基于数据集F2,6种算法预测模型中,随机森林算法所训练预测模型的训练集准确率为0.91,仅略低于决策树算法所训练的模型(0.92),其他指标如测试集准确率为0.89、ROC曲线下面积为0.87、阳性病例识别正确率为79.44%、阴性病例识别正确率为94.56%、总体正确率为88.69%,均高于其他算法所训练的预测模型。
第二部分,基于慢性病管理模型,融入马莱兹克系统传播模式,形成了妊娠期糖尿病高危人群干预传播模式(The Intervention and Communication Model,ICM),模式包含4个关键要素:传播者(communicator,C)、讯息(message,M,本研究中指基于循证的妊娠期糖尿病高危人群干预策略)、媒介、接受者(reciever,R,本研究中指妊娠期糖尿病高危人群)。在卫生保健系统和虚拟社区的支持下,以妊娠期糖尿病高危人群为核心,通过传播者和接受者之间的有效互动,完成健康信息的有效传播,达到接受者健康行为的改变及维持,最终改善健康结局。
以省属三级甲等综合医院为依托,组建了权威性好、积极主动的服务团队。通过系统检索,纳入14篇指南,提取妊娠期糖尿病高危人群干预策略;采用血糖水平、孕前体重指数、孕周3个个性化分类标签,将妊娠期糖尿病高危人群分为64个亚组,同步将干预策略与其逐一匹配、编码,导入妊娠期糖尿病高危人群干预微平台。形成的妊娠期糖尿病高危人群干预微平台由宣教端和用户端组成;宣教端由用户列表、资料管理、智能推送、消息群发、随访调查、用户留言等6个模块构成;用户端由个人中心、健康指导、信息反馈3个模块构成。
第三部分,招募的60例研究对象中,干预3个月后共有57例研究对象完成了资料收集,干预组28人,对照组29人。干预模式的可行性分析结果显示,研究对象招募率为64.52%,样本失访率为5%,其中干预组6.67%,对照组3.33%;研究对象妊娠期糖尿病高危人群干预微平台的平均使用时间为18.79?5.83小时,学习依从率为100%。
干预3个月后,干预组和对照组研究对象中分别有11人、13人被诊断为GDM,差异无统计学意义(χ2=0.179,P=0.672);干预组研究对象干预期间体重平均增加(8.53±3.48)kg,低于对照组(11.83±6.92)kg,具有统计学差异(t=2.220,P=0.031);两组研究对象的空腹血糖水平无显著性差异。除血糖管理维度外,干预前后两组研究对象的糖尿病知识改变具有统计学差异(P<0.05);干预组中患者积极度量表的认知(t=3.347,P=0.001)、技能(t=5.685,P<0.001)、行动(t=2.824,P=0.007)3个维度评分均高于对照组,信念(t=1.896,P=0.063)维度评分与对照组差异无统计学意义;干预组中妊娠期糖尿病孕期自我管理行为问卷的膳食控制行为(t=5.288,P<0.001)、体重管理行为(t=4.516,P<0.001)2个维度评分高于对照组,运动管理行为(t=0.126,P=0.900)、血糖监测行为(t=-0.289,P=0.774)、定期复查行为(t=0.992,P=0.326)3个维度评分与对照组差异无统计学意义。
访谈6名研究对象,研究对象对妊娠期糖尿病高危人群干预微平台的使用体验为:该平台的感知有用性及易用性强并愿意分享;知识的针对性较强,被无效信息干扰少;功能全面,专业性、实用性强;担心个人信息的安全和隐私。
结论:
1.经初步探讨,随机森林算法所训练的妊娠期糖尿病发病风险预测模型性能最佳,对妊娠期糖尿病的早期预测具有较好的参考性,可以用于妊娠期糖尿病高危人群的初步筛查。
2.本研究基于慢性病管理模型,融入马莱兹克系统传播模式,形成的妊娠期糖尿病高危人群干预传播模式,并基于此模式构建妊娠期糖尿病高危人群干预微平台,以研究对象为中心,注重宣教者和研究对象的有效互动,可以实现干预策略的智能化、个性化精准推送。
3.经初步验证,本研究构建的妊娠期糖尿病高危人群干预传播模式可行性好,在降低疾病的发生风险、提升高危人群疾病相关知识水平、积极度和自我管理行为等方面,具有潜在的积极作用;同时平台的便利可及性好,易于被公众接受,方便分享、传播,研究对象的使用体验较好。
随着经济水平的提高和生活方式的改变,妊娠期糖尿病的患病率在世界范围内呈上升趋势,已成为最常见的孕期并发症之一。妊娠期糖尿病的发生不仅会导致严重的不良妊娠结局,母亲及其子代发展为2型糖尿病等代谢相关疾病的风险也会明显增加,使得整个医疗保健系统和家庭的经济负担、照护负担加重。在疾病发生之前识别高危人群并进行干预是疾病预防的主要策略,故越来越多的研究者开始关注妊娠期糖尿病的早期预测及早期干预,以延缓甚至避免妊娠期糖尿病的发生。目前现有风险预测研究中,尚缺乏基于风险因素量化分析基础上建立的快速稳定的早期风险预测模型,因此难以实现高危人群的精准识别。而且现有的干预研究缺乏有效的理论指导,干预内容大多来源于归纳总结而非基于系统循证,且难以满足不同个体的个性化需求,另外由于时间和花费等原因,干预方式很难做到持续性实施及大规模推广。在此背景下,基于数据挖掘运用机器学习算法训练妊娠期糖尿病高危人群早期发病风险预测模型,实现高危人群筛选,并开展基于理论分析、最佳证据指导的妊娠期糖尿病高危人群干预传播模式和干预技术研究是十分必要的。
目的:
1.基于数据挖掘,运用机器学习算法训练妊娠期糖尿病发病风险预测模型,完成妊娠期糖尿病高危人群的早期识别;
2.基于理论研究,进行理论融合构建妊娠期糖尿病高危人群干预传播模式,并与专业信息技术人员合作,搭建妊娠期糖尿病高危人群干预微平台;
3.验证妊娠期糖尿病高危人群干预传播模式和微平台的应用效果。
方法:
本研究分为三个部分。
第一部分,基于前瞻性队列研究设计,选取2017年11月~2018年8月,在青岛市市南区、崂山区、黄岛区妇保所及青岛大学附属医院建档、产检的妊娠期女性为研究对象,采用问卷调查法建立妊娠期糖尿病发病风险预测的电子健康档案数据库。基于Python,分别采用医学领域中较常用的逻辑回归、决策树、随机森林、梯度决策树、支持向量机、人工神经网络等6种算法进行建模,比较6种算法对妊娠期糖尿病发病风险预测的准确率,选择预测准确率最优的算法构建妊娠期糖尿病发病风险预测模型。
第二部分,基于理论研究,融合慢性病管理模型、马莱兹克系统传播模式,确定妊娠期糖尿病高危人群干预传播模式。以该模式为指导,进行服务提供系统设计,循证最优的妊娠期糖尿病高危人群干预策略,并与信息技术人员合作,基于微信公众号及微信小程序,搭建妊娠期糖尿病高危人群干预微平台。
第三部分,妊娠期糖尿病高危人群干预传播模式的预试验研究。2018年10月~2019年3月,在青岛大学附属医院产科门诊招募孕周小于等于16周,经妊娠期糖尿病发病风险预测模型筛查属于妊娠期糖尿病高危人群的个体为研究对象,随机分为干预组(n=30)和对照组(n=30)。对照组给予常规门诊教育,干预组在对照组基础上,基于妊娠期糖尿病高危人群干预传播模式,使用妊娠期糖尿病高危人群干预微平台进行干预。采用招募率、失访率及干预组的学习依从性初步分析干预传播模式的可行性;干预3个月后通过分析两组研究对象妊娠期糖尿病发生情况、孕期体重增加、空腹血糖水平、妊娠期糖尿病知识改变、积极度及自我管理行为方面的改变,初步探讨干预模式的潜在作用;运用半结构式访谈挖掘研究对象对妊娠期糖尿病高危人群干预微平台的使用体验。
结果:
第一部分,本研究纳入1625名妊娠期女性,采集到有效数据4806条,经数据清洗,定义了体格检查、既往史、个人史、家族史、专科检查、实验室检查、饮食运动习惯等67个妊娠期糖尿病相关预测指标。
首先纳入全部67个指标,共得到3265条数据,建立数据集F1,结果显示,6种算法预测模型的测试集准确率为0.90~0.98、AUC(ROC曲线下面积)为0.50~0.84,但阳性病例预测正确率仅为0~68.29%。其次纳入全部4806条数据,共得到38个指标,建立数据集F2,结果显示,6种算法预测模型测试集准确率为0.75~0.89、ROC曲线下面积为0.71~0.87、阳性病例预测正确率为72.38%~79.44%。
为探讨F2缺失的指标对模型的影响,选取F1的3265条数据、F2的38个指标建立数据集F3,结果显示,6种算法预测模型的测试集准确率为0.90~0.94、ROC曲线下面积为0.50~0.66,阳性病例的预测正确率降至0~32.92%。
基于数据集F2,6种算法预测模型中,随机森林算法所训练预测模型的训练集准确率为0.91,仅略低于决策树算法所训练的模型(0.92),其他指标如测试集准确率为0.89、ROC曲线下面积为0.87、阳性病例识别正确率为79.44%、阴性病例识别正确率为94.56%、总体正确率为88.69%,均高于其他算法所训练的预测模型。
第二部分,基于慢性病管理模型,融入马莱兹克系统传播模式,形成了妊娠期糖尿病高危人群干预传播模式(The Intervention and Communication Model,ICM),模式包含4个关键要素:传播者(communicator,C)、讯息(message,M,本研究中指基于循证的妊娠期糖尿病高危人群干预策略)、媒介、接受者(reciever,R,本研究中指妊娠期糖尿病高危人群)。在卫生保健系统和虚拟社区的支持下,以妊娠期糖尿病高危人群为核心,通过传播者和接受者之间的有效互动,完成健康信息的有效传播,达到接受者健康行为的改变及维持,最终改善健康结局。
以省属三级甲等综合医院为依托,组建了权威性好、积极主动的服务团队。通过系统检索,纳入14篇指南,提取妊娠期糖尿病高危人群干预策略;采用血糖水平、孕前体重指数、孕周3个个性化分类标签,将妊娠期糖尿病高危人群分为64个亚组,同步将干预策略与其逐一匹配、编码,导入妊娠期糖尿病高危人群干预微平台。形成的妊娠期糖尿病高危人群干预微平台由宣教端和用户端组成;宣教端由用户列表、资料管理、智能推送、消息群发、随访调查、用户留言等6个模块构成;用户端由个人中心、健康指导、信息反馈3个模块构成。
第三部分,招募的60例研究对象中,干预3个月后共有57例研究对象完成了资料收集,干预组28人,对照组29人。干预模式的可行性分析结果显示,研究对象招募率为64.52%,样本失访率为5%,其中干预组6.67%,对照组3.33%;研究对象妊娠期糖尿病高危人群干预微平台的平均使用时间为18.79?5.83小时,学习依从率为100%。
干预3个月后,干预组和对照组研究对象中分别有11人、13人被诊断为GDM,差异无统计学意义(χ2=0.179,P=0.672);干预组研究对象干预期间体重平均增加(8.53±3.48)kg,低于对照组(11.83±6.92)kg,具有统计学差异(t=2.220,P=0.031);两组研究对象的空腹血糖水平无显著性差异。除血糖管理维度外,干预前后两组研究对象的糖尿病知识改变具有统计学差异(P<0.05);干预组中患者积极度量表的认知(t=3.347,P=0.001)、技能(t=5.685,P<0.001)、行动(t=2.824,P=0.007)3个维度评分均高于对照组,信念(t=1.896,P=0.063)维度评分与对照组差异无统计学意义;干预组中妊娠期糖尿病孕期自我管理行为问卷的膳食控制行为(t=5.288,P<0.001)、体重管理行为(t=4.516,P<0.001)2个维度评分高于对照组,运动管理行为(t=0.126,P=0.900)、血糖监测行为(t=-0.289,P=0.774)、定期复查行为(t=0.992,P=0.326)3个维度评分与对照组差异无统计学意义。
访谈6名研究对象,研究对象对妊娠期糖尿病高危人群干预微平台的使用体验为:该平台的感知有用性及易用性强并愿意分享;知识的针对性较强,被无效信息干扰少;功能全面,专业性、实用性强;担心个人信息的安全和隐私。
结论:
1.经初步探讨,随机森林算法所训练的妊娠期糖尿病发病风险预测模型性能最佳,对妊娠期糖尿病的早期预测具有较好的参考性,可以用于妊娠期糖尿病高危人群的初步筛查。
2.本研究基于慢性病管理模型,融入马莱兹克系统传播模式,形成的妊娠期糖尿病高危人群干预传播模式,并基于此模式构建妊娠期糖尿病高危人群干预微平台,以研究对象为中心,注重宣教者和研究对象的有效互动,可以实现干预策略的智能化、个性化精准推送。
3.经初步验证,本研究构建的妊娠期糖尿病高危人群干预传播模式可行性好,在降低疾病的发生风险、提升高危人群疾病相关知识水平、积极度和自我管理行为等方面,具有潜在的积极作用;同时平台的便利可及性好,易于被公众接受,方便分享、传播,研究对象的使用体验较好。