论文部分内容阅读
目的:随着医疗信息化建设水平的不断提高,医疗卫生行业积累了海量的结构化和非结构化数据。通过有效的数据挖掘技术,探究其蕴含的丰富的信息价值,为医疗卫生各行业的决策提供有力支持。 方法:以区域卫生信息平台上积累的海量数据为主要研究对象,并对其进行清洗、整理和标准化处理后,采用融合型大数据(Hive、MapReduce、SQL数据库等)技术构架,建立医院、科室服务质量及传染病的监测、预警的应用案例分析。①案例一:采集2010-2014年5所医院的电子病历信息,筛选11个指标体系,构建GLMM分析模型、拟合、AIC验证,利用R语言进行统计分析,进行动态可视化展示。②案例二:采集2010-2014年某市第一人民医院各临床科室信息,确定具有代表性的11个指标,建立主成分分析法,结合R语言进行统计分析,选出前三个主成分进行评价,对得到综合评价的进行排序。③案例三:采集登革热病人信息、互联网数据及气象数据等,基于AIC准则,构建支持向量机模型(SVM),结合R语言进行统计分析,通过ArcGIS技术进行可视化展示。 结果:①案例一:疾病的诊疗状况与医院的综合情况、病人的性别、年龄、保险的种类、治疗的费用及DRG的种类之间有统计学意义(p<0.01)。通过对疾病诊疗情况的实时动态监测,可以分析出:1)不同疾病在不同医院的诊疗情况;2)同种疾病在不同医院的诊疗情况;3)同一医院对不同疾病的诊疗情况。②案例二:前三个主成分的特征值大于1,且累积贡献率达到81.156%。综合函数评分排名前三名:心血管科、消化科、妇产科;最后三名:疼痛科、皮肤科、口腔科。③案例三:传染病爆发的关键因素:人口密度、房价、8-10月份最大温度的天数、9月份最低湿度的天数、7月份降雨的天数。通过GIS动态展示可以得出:黄色和橙色代表登革热正在爆发区域;黄色预示着该地区登革热将有一定程度的控制区域。绿色则代表着安全区域,即没有发现登革热流行的区域;红色则表示复发区域。 结论:本研究以成熟的大数据分析平台为依托,通过对海量数据的分析,实现医疗资源的合理优化配置,发病率的监控预测,完善考核机制等,为医疗卫生行业管理者提供决策支持,为病人高效的提高就医导向,节约时间,医院提高诊疗效率质量,最大限度的降低医疗事故的发生。也可以监控并及时对公共卫生事件做出积极的预警,加强区域范围内的人群健康管理,优化医疗卫生产业链,推进某市医疗卫生事业的发展,为深化医疗体制改革提供新的思路。