论文部分内容阅读
随着计算机、网络技术的快速发展,我国医院信息化程度不断提高,都已建立了自己的医院信息系统。而目前,几乎所有的医院信息系统都是各自独立的,这势必会造成区域内医疗信息的冗余,更加重要的是病人在不同医疗机构、不同时期的医疗信息无法得到有效关联,从而为病人的就诊带来了不便。社保卡虽然是病人的主标识,但其覆盖率有限,并不能够完全解决病人医疗信息关联的问题。本文将主数据管理的相关理论方法引入到病人基本信息管理中,实现了病人主索引医院信息系统,从而使病人在不同医疗机构、不同时期的医疗信息得到有效关联。 由于实际生产环境中病人基本信息的数据质量较差,为了提高主数据管理对于相似重复数据辨别的准确性,本文针对病人基本信息相似度评价模型与病人基本信息相似性预测模型进行建模分析。病人基本信息相似度评价模型针对每个用来区分不同主数据实体的属性采取不同的相似度评价方法,从而提高了相似度评价模型的准确度,为病人基本信息相似重复性预测提供了可靠的判断依据。 病人基本信息相似性预测模型根据病人基本信息相似度评价模型处理得到的病人基本信息相似度评价结果对病人基本信息的相似重复性进行判断,将相似重复的病人基本信息归并在一起,从而实现了对病人医疗信息的关联。本课题在对人工智能领域多种先进分类算法的分析比较基础上,提出并采用ADABOOST集成学习算法与决策树ID3算法相结合的改进算法对病人基本信息相似性预测模型进行建模。该算法可有效解决经典ADABOOST集成学习算法只能解决二值分类问题以及决策树ID3算法存在偏向多值属性和过多对数运算的问题。本文通过二叉树结构解决了多值分类的问题,通过麦克劳林公式对决策树ID3算法进行了简化,并通过引入权系数解决了决策树ID3算法的偏向多值属性问题。实验结果表明,基于改进后的ADABOOST算法与决策树ID3算法所建立的多决策树分类器,其分类精度与速度均比基于单独决策树ID3算法或基于原始的ADABOOST算法(与决策树dD3)算法所建立的分类器有所提高,工作效率也大大高于人工处理相似重复数据。将多决策树分类器引入到主数据管理中,可提高其在医院信息系统应用中的智能化水平。 最后,本文基于Eclipse集成开发平台,Java编程语言,Web Service、JMS、Dojo等技术实现了病人主索引医院信息系统,从而将不同医疗部门、机构的病人医疗信息有效地关联在一起,减少了数据冗余,促进了区域医疗健康快速地发展。