论文部分内容阅读
随着我国基本医疗保险覆盖范围的不断扩大,定点零售药店和定点医疗服务机构数量的不断增加,违规使用医疗保险基金的现象也越来越多,医疗保险欺诈的手段也越来越隐蔽,仅利用传统的医疗保险审核方式来加强医疗保险基金的监控难度也随之增大。近年来,随着全国各地医疗保险信息化建设的不断推进,大数据和数据挖掘等新技术的不断发展,如何利用这些新技术、新方法有效地提升医保基金监管,实现传统人工审核与大数据技术的融合,是亟需探讨和研究的课题。医保两定机构,即定点零售药店和定点医疗服务机构作为医保服务的提供方,是一些违规贩药人员倒卖药品的主要活动场所,贩药人员通过自有或者收购的医保卡频繁的到一个甚至多个定点零售药店和定点医疗服务机构刷卡购药,然后将所购药品进行贩卖并从中获取高额利润。“十二五”期间深化医药卫生体制改革规划暨实施方案中明确要求,各级医保部门需加强对定点零售药店和定点医疗服务机构的监管,加大对欺诈骗保行为的处罚力度。因此,为创新监督模式,提升监管效能,有效地保障医保基金的合理使用,本文基于上海市定点零售药店和定点医疗服务机构的购药数据及参保人审核数据,结合机器学习和医保监督工作经验,利用数据挖掘技术从海量数据中智能甄别医保异常购药可疑人员。医保异常购药行为复杂且多变,本文首先对购药数据和参保人审核数据进行清洗和基础统计描述,结合上海市医疗保险门急诊就诊和医疗费用监督管理办法,对2018年全年数据进行初步筛选并确定研究样本数据集,根据定点零售药店和定点医疗服务机构的特点提取异常购药行为特征,然后通过假设检验观察选取的特征在正常购药人与异常购药人之间是否有显著差异。在建立异常购药模型阶段,利用训练集数据使用Logistic回归、Ada Boost和XGboost三种算法分别建立模型,然后使用测试集数据利用建立的回归和分类模型进行运算并生成混淆矩阵,通过混淆矩阵得到模型的准确率、错误率、精度、特异度、灵敏度等评估指标,为了更加直观有效的评估分类器的效果绘制了ROC曲线并计算AUC值,评估结果显示XGboost算法效果较好。最后,为提升模型效果,探索能够提升模型准确性的方案,使用关联规则算法进一步挖掘定点零售药店购药明细数据中存在关联性的药品,并将其作为二级特征变量再次使用分类算法建模,实验结果表明,本文提出的使用关联规则Apriori算法与XGboost算法相结合的混合模型,在基本医疗保险异常购药行为分析上具有较好的效果。