论文部分内容阅读
社区卫生服务是我国公共卫生服务的重要组成部分,是个人或者家庭与国家医疗卫生服务系统之间的最基本环节,是满足居民基本健康需求的较为理想的医疗服务模式。从世界范围来看,最近的几十年来社区卫生服务模式发展非常迅猛。我国城市社区卫生服务起步并不算晚,只是目前出现了医疗资源过度向大医院集中、医疗费用持续增长、看病难、看病贵等问题。因此,医疗卫生服务体系的改革重心将会从以诊疗为主的康复服务体系过渡到以预防为主的社区卫生服务体系。在这种情况下,进一步完善社区卫生服务体系,显得尤为重要与紧迫。完善社区卫生服务体系也是解决我国医疗卫生服务体系困境的一个最重要的突破口。 目前,我国的社区卫生服务中心的信息化程度较高。但是信息系统数据的完整性与对数据的利用率有待进一步提高。由于,社区医院与居民的关系非常紧密,接触也非常频繁,比如每年的体检、预防接种、小病的防治、慢病的管理与治疗等都可以在社区医院完成。这样,社区卫生服务中心就全整地保留了所辖地区居民的健康状况相关的信息资料,为综合地评价每一位居民的健康水平提供了可能与保障。 本文在分析和整理某社区卫生服务中心的信息系统数据库的基础上,通过预测社区居民一些常见慢性疾病的健康指数,综合评价社区居民的健康状况,为评价与预防社区居民常见病提供数据上的支持。论文的研究内容主要包括六个部分:疾病健康指标体系的分析与建立、医疗数据集数据前处理、降维方法研究、聚类分析与孤立点检测研究、疾病预测模型集研究、疾病辅助识别分类方法研究等。论文的核心思想是利用慢性疾病事先呈现的外部特征数据集进行聚类分析,通过聚类来分析疾病的内部分类机理,从而提高慢病健康指数预测模型的精度。本文的研究思路是在建立慢病预测模型体系结构的基础上,重点研究了早期肝病的辅助诊断分类模型和中风风险预测模型,研究的主要内容有: (1)研究针对医疗卫生数据集的慢性疾病预测模型体系结构,并以早期肝病诊断与中风风险预测为例验证了方法体系的有效性。在研究总体预测体系结构中的数据前处理、聚类分析、降维处理、分类和预测模型等各个方法的同时,不断完善社区居民健康指数指标体系。预测模型体系结构是一个有机的整体,各个部分之间有着紧密的联系,又有明显的区别,医疗数据流的方向可以根据具体的预测问题进行灵活地调整。 (2)由于数据集前期特征提取质量的好坏会对预测模型的精度造成极其深远的影响,针对社区卫生服务中心的数据库,本文选择了一种适合于社区卫生服务中心的数据前处理方法。本课题首先利用Visual Stdio2010和MATLAB2008R对信息系统数据库数据进行了数据清洗、数据集成与变换、数据归约等三个部分的程序处理,提取了175*14的早期肝病特征数据集、2343*28的中风风险特征数据集和394*28的健康人群特征数据集,并对这些数据集进行了初步分析。 (3)重点研究了慢病早期的辅助诊断分类方法。在提取了慢病早期原始化验数据集的基础上,研究针对体检等样本不平衡条件下的慢病早期辅助诊断方法。辅助诊断方法主要分为降维可视化、萤火虫优化算法的参数优化和支持向量数据描述的辅助诊断等三个主要的步骤,为慢病的早发现与早治疗提供了技术上的支持。该方法在早期肝病的辅助诊断中验证了方法的有效性。 (4)重点研究了慢病风险指数的预测模型集。首先,研究建立慢病健康指数指标体系;然后,针对目前特征选择算法的缺陷,研究一种新的结合属性特征度量和有用程度的特征选择算法;第三,依据慢病风险数据集的特征选择的重要性评价结果,结合基于密度与距离的快速峰值聚类算法与具有较好孤立点检测功能的超椭球算法,研究适合于慢病特征数据集的多椭球快速密度聚类算法;第四,为了辅助识别患者的类型,针对聚类分析聚类簇,研究改进的多核支持向量机分类算法;最后,针对聚类簇的结果,研究基于支持向量机回归和极限学习机的慢病风险健康指数的预测模型集。该方法体系在中风的风险预测中验证了方法的有效性。