基于医保数据的智能审核研究与应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:kalok
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前医疗保险行业存在大量的医保记录数据,为了更好的保障医疗保险基金合法使用,需要优化对欺诈骗保的审查手段,加大对医保基金的监管力度。本文基于大规模的医保数据,研究改进聚类及分类算法,将聚类及分类算法应用于医保数据集,设计并实现医保智能审核模型。本文主要研究内容如下:1.为了更有效地利用医保无标签数据,本文首先采用聚类算法对无标签医保数据进行聚类分析。由于传统K-Means存在容易陷入局部最优的问题,本文提出了改进的蚁狮优化与K-Means相结合的聚类模型ALO-KM。该模型首先通过蚁狮优化算法帮助K-Means选择初始簇中心,在迭代过程中再利用蚁狮优化算法更新样本簇的簇中心,削弱了K-Means对初始簇中心的敏感程度。然后提出了基于高斯分布的改进随机游走策略,能够更加全面地搜索解空间,实现对蚁狮优化算法搜索能力的提高。实验证明本文提出的模型在多个指标上都提高了医保无标签样本的划分纯度和聚类效果,有效地解决了医保无标签数据利用率低以及K-Means易陷入局部最优的问题。2.为了更有效地同时利用医保数据中的无标签样本和有标签样本,提高对骗保行为的分辨能力,本文设计了K-Means与逻辑回归相结合的KM-LR模型。首先提出K-Means迭代训练中特征距离向量的概念,在K-Means训练后将特征距离向量映射为逻辑回归模型的回归系数;然后通过逻辑回归训练后学习到的模型对样本进行划分,并分别求得划分后两类的簇中心,再进行下一次整体的迭代。这种交互式的训练模式紧密地连接了聚类与分类两个部分,有效地提高了医保数据的利用率。通过实验证明了KM-LR算法有效地优化了对医保数据的分辨能力,在多种评价指标上均较大地提升了分类精度,达到了同时利用医保无标签样本与有标签样本的目的。3.为了给医保智能化审核与信息化监管提供现代技术支撑,本文构建了基于大数据的医保智能审核系统。该系统可以利用医保数据进行多种模型训练,包括本文提出的ALO-KM与KM-LR,可以由用户上传需要审核的数据样本进行医保防骗审核,可以通过不同的统计图表进行对比分析,最后提供了可视化界面为用户展示各个功能模块的结果。
其他文献
本文对汽车的电磁兼容性进行了研究。经过阅读大量关于电磁兼容和汽车电器设备结构原理方面的文献资料,总结了国内外关于电磁兼容研究的现状和进展,并结合国际上电磁兼容方面
农村稳则国家稳,农村和则天下和。我国是一个农业大国,解决好农村社会纠纷对治国安邦意义重大。那么,如何培养农民的自我保护意识,让他们“敢于维权、善于维权”?本栏目以近
招苏台河水功能区在2013~2017年最严格水资源制度考核中,水质达标率持续偏低,为重污染河流。通过污染源调查及估算,结果,招苏台河面源污染问题较为严重,重点对畜牧养殖业进行
水利水电施工是一个涉及面较广的系统工程,开发一套自动化程度高的管理系统,对施工过程中的各种档案进行系统管理,对提高施工管理效益及水平具有非常重要的作用。水利水电施工档
2000年以来,国家加大了对农村和中、西部义务教育的经费投入。为了评估政策的落实效果,给国家义务教育经费投入政策提供科学参考,本研究采用全国30个省(自治区、直辖市)的城
上世纪八十年代以来,数学教育的核心问题逐渐被确定为解决数学问题,迄今为止,它仍然是数学教育界所研究的重点问题。中国的数学教育家以及数学教育工作者向来都非常重视研究学生
<正>近两年,受国内外乳制品市场的影响,河北省奶牛养殖发生了较大变化,大量奶牛养殖场退出或转型。奶牛场退出经营的主要原因在于:经营管理不善,乳企对奶牛场的过多管控,融资
自国内成立第一家报业集团至今已有11年时间,期间我国大陆相继成立了40家报业集团。这11年时间报业集团化改革取得了重要成果。但是由于报业的特殊性质,在实际运行过程中,报业集
在市场经济的发展过程中,国家对经济的宏观调控与市场调节互相结合,互相补充,共同保证和促进经济的发展。由于这两种机制结合的具体情况颇不相同,从而形成不同的经济模式。我国作
填埋场水量和水位控制是实现其无害化管理的关键。以国内某大型填埋场为研究对象,利用水量平衡方法分析了多年均降雨和瞬时暴雨工况下渗滤液产量和水位的变化,计算结果与现场