论文部分内容阅读
本文在医疗保险相关项目中利用分类挖掘算法,实现了对医疗保险费用分析的决策支持应用,本文在项目应用的基础上主要讨论了以下一些问题:
(1)分析了目前某市医疗保险制度运行中出现的问题,提出项目开发的起因。明确项目的目的是找出影响医疗保险费用上涨的原因;
(2)项目的基础是某市已有的医疗保险管理信息系统中的大量数据,这些数据具有一定的可靠性和真实性,文章尝试利用数据挖掘技术来解决医保运行时出现的问题;
(3)分析了项目的特点,确定了利用分类算法作为数据挖掘的算法;
(4)对分类算法进行基于应用的改造,一方面引入了先验知识的权值参数,另一方面引入了经过改造的分类器集成方法;
(5)利用数据仓库的概念,对医疗保险信息系统中的数据进行抽取、清洗、转换和加载;
(6)利用REW(Random Ensemble based on Weight)算法以及经过预处理的模型数据来进行数据挖掘任务,得到了一些比较实用的有启发意义的规则,为某市医保中心完善医保制度提供辅助的决策支持。
本文的主要特色如下:
(1)结合先验知识的决策树集成和改进的决策树个体生成算法
本文的思路集中在找到一种将决策树集成和人的经验相结合的方法,并应用到医疗保险的项目中来。基于此,本文在现有决策树集成算法上进行改进,同时充分利用领域内的先验知识,提出了一种新的决策树集成的算法REW。大体的思想是:文章改进现有的决策树个体生成算法,让每个决策树单体对特定的分类类别有所偏向。同时文章对属性也进行基于先验知识的加权,使之对属性的选择再一次倾向于较为重要的属性,最后综合所有决策树的结果,利用一定的合成算法得到最终的分类结果。
(2)基于医疗保险背景的数据挖掘应用
文章利用数据挖掘中的分类分析方法,建立了个人参保客户的分类模型和单位参保客户的分类模型。本文采用决策树集成的数据挖掘方法来对某市医疗保险管理系统中的参保客户数据进行分析。
本项目的数据挖掘系统已经大体完成功能的实现,目前运行状况良好,基本达到了项目设计的要求,取得了初步的应用成效。