基于Hadoop的面向医疗云数据的Apriori算法的研究与改进

来源 :海南大学 | 被引量 : 0次 | 上传用户:XFZWY
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
医疗领域的科学技术近几年发展迅速,卫生保健费用和成果之间的差距越来越大是最重要的问题之一,许多发达国家正在为弥补这一差距进行许多努力。因此,迫切需要提高医疗质量,增加数据可用性和分析能力,这是医疗大数据时代的驱动力。面对医疗数据较为庞大的规模,传统的数据挖掘方法显得有些捉襟见肘,从传统的数据挖掘方法中改良出一种更好用的数据挖掘算法也成为科研工作者们致力于研究的方向,与此同时,云计算技术的兴起也给大数据处理带来了新的选择。论文的主要工作如下:(1)针对Apriori算法的基本思想、实现流程以及存在的缺陷,提出一种基于Hadoop的面向医疗云数据改进的IM Apriori算法,该算法将减少候选项目集数量,且大大减少用于计算支持度的时间。(2)传统的Apriori算法有两个主要的瓶颈:频繁扫描数据库、生成大量候选集。针对Apriori算法的固有缺陷,进行了一些相关的改进:首先,采用新的数据库映射方式,避免重复扫描数据库;然后进一步修剪频繁项集和候选项集,以提高加入效率;使用重叠策略来计算支持度以实现高效率。将IM Apriori算法在Hadoop平台进行了实现,使得算法能够有效的减少数据库扫描次数,改善了Apriori算法的输入/输出瓶颈问题,相较于传统Apriori算法而言改进后的算法有很大的优势。(3)最后在Hadoop平台将改进后的算法进行仿真实验,将改进后的算法与传统Apriori算法以及引进对比的BITXOR算法和其他几种关联分析算法进行相关对比实验,对实验结果进行充分的对比和分析,实验证明了本文提出的改进算法相对于传统的和其他改进算法具有更高的效率和优越性。
其他文献
差异教学是一种有别于传统"分班制"的教学方法,其尊重学生之间客观存在的能力差异,更加科学有效,旨在帮助所有学生都能得到一定成长。文章分析了小学数学教学中差异产生的原
苏州博物馆自2012年至今打造了一系列以古代书画为主的极具本馆个性与特色的展览。这些展览是根据苏州的城市精神与气质,结合苏博书画藏品状况而量身定制。扎实的学术研究是
随着医疗信息化进程的推进,医疗数据日益增长。在此背景下,传统的关联规则挖掘算法在医疗大数据中存在算法运行时间过长的问题。云计算平台的出现为该问题提供了有效的解决方
目的观察羧甲基茯苓多糖钠体外抗单纯疱疹病毒I型(HSV-I)的作用。方法采用细胞病变抑制试验法,观察羧甲基茯苓多糖钠对因感染HSV-I而引起的猪肾传代细胞病变的保护作用。结果
为探讨叶下珠属植物对单纯疱疹病毒Ⅱ型的抑制作用 ,采用地鼠肾细胞株 (BHK)和原代兔肾细胞对 8种叶下珠属植物水提物进行了体外抗单纯疱疹病毒Ⅱ型作用的研究。结果显示 :除
串联式组合桩复合地基是一种新型的桩体复合地基型式,由“固体”与“散体”构成的上下同轴串联桩体,其中“固体”为2种不同刚度的粘结性材料构成,分别为素混凝土与浆固碎石,
一、分类耻垢分枝杆菌(mycobacterium smegmatis)和龟分枝杆菌、偶发分枝杆菌一样,均为快速生长的分枝杆菌。近年来由龟分枝杆菌、偶发分枝杆菌引起的感染暴发流行国内也有许
克拉伦斯·厄尔·吉迪恩只是一个普通的囚犯,但是他向美国联邦最高法院寄去的一封申诉信,彻底地改变了美国法律史的进程。经过最高法院的审判,吉迪恩案成为美国司法制度史上
目的研究新生儿医院感染(HAI)危险因素及血清降钙素原(PCT)、C-反应蛋白(CRP)和25羟维生素D3[25(OH)D3]检测价值。方法选取2017年1月-2018年12月海南省人民医院(海南医学院附
钢结构因其构件可工厂制作,现场安装而广泛应用于工业与民用建筑。为提高结构的抗侧刚度,设置支撑是一种有效手段。而作为理想支撑杆件的圆钢管,连接节点形式多样,但兼具制作