基于Hadoop的中医病案数据挖掘系统研究与设计

来源 :青岛科技大学 | 被引量 : 8次 | 上传用户:cabinwyq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代科学技术的进步与发展,加快了医学信息的数字化,医疗系统包括中医系统也在快速的健全和完备,随之而来的是中医病案数据量的急剧突增,如何利用这海量的中医药数据来防控疾病,诊断疾病,提供优化方案,辅助诊治,是当前业内专家高度关注的课题。传统单机平台下对大数据集的挖掘处理常受困于数据存储和计算空间不足的窘境,其计算效率无法明显提高。在此背景下,本文提出了基于Hadoop平台的两种中医数据挖掘方案来处理庞大的中医数据,采用并行化Apriori算法对中药、症状和证型混合数据进行挖掘;采用并行化K近邻分类算法对未知的症状群进行分类,预测其归属证型。同时基于Hadoop平台搭建了中医病案数据挖掘系统,主要研究内容如下。首先对两种经典数据挖掘算法进行并行化改造,针对Apriori算法并行计算过程中会产生大量键值对以及节点IO频繁读写等不足之处,设计优化方案,借助Hbase存储中间过程数据,同时以迭代组合递归的方式代替传统的自连接方式来产生候选项集,从而有效的提高迭代计算速率,加速频繁项集的产生;对K近邻算法进行并行化设计,对症状等级量化取值,并归一化处理,减少由于症状域值不同对距离计算的影响,进而更加客观的对症状组进行分类。然后在搭建好的Hadoop2.0集群中,利用并行化改造后的Apriori算法,对中医哮喘病案数据进行挖掘分析,获得了中药配伍规律、用药与证型、症状的配伍规律以及症状与证型之间关联关系,同时基于KNN分类算法对症状群进行预测归属的证型。实验结果表明,其挖掘结果与理论基本匹配,具有一定的实际指导意义。最后系统借助Webservice技术,实现以Hadoop集群作为服务端,以Swing技术构建客户端界面进行交互的C/S架构方案,建立基于Hadoop的中医病案挖掘系统。该系统主要集成了集群配置、病案数据管理和数据挖掘三大功能模块。通过对系统的各个功能模块的测试,结果表明该系统具有良好的交互性和较完备的功能。
其他文献
在现代化教学管理背景下,传统的学生成绩管理方法、手段和工作效率已经不再适用。只有通过现代化计算机系统来管理学生成绩,实现成绩管理工作流程的系统化、规范化和自动化,
释明权制度对修正辩论主义的形骸化、明确当事人之间的诉讼关系,进而实现公平地解决纠纷发挥着重要作用。法官的释明包括消极的释明和积极的释明,释明内容主要为请求内容的释
女书是世界上惟一的女性文字,是女性身份建构的途径之一。作为女性意识高度发展的产物,女书的出现标志着女性身份建构的开始。在女书作品中,女性试图通过强化女性身份、颂扬
预浸料是由树脂浸润连续纤维或织物得到的组合物,通常树脂体系呈B阶段,是复合材料的中间体。环氧树脂作为最常用的中温固化预浸料树脂基体,必须具有良好的断裂韧性从而使预浸
目的比较Septodent无砷失活剂与砷剂用于牙髓失活的效果。方法将300颗需进行牙髓失活治疗的患牙随机分成2组,分别用非砷类牙髓失活剂(Caustinerf fort,Septodent,法国)和三氧
互联网技术日新月异的发展使得传统的金融活动越来越不能满足人们的需要,虚拟货币应运而生。虚拟货币自诞生之日起就备受金融界和学术界关注,目前仍处于发展的初级阶段。文章
刑事纠纷中的双方和国家都可以被视为经济人,根据经济学的成本收益理论,对于重视获得补偿的被害人和有支付能力的加害人,从和解中获得的利益要大于从正规诉讼程序中获得的利
校园篮球文化的建设对学生的全面素质提高具有重要的促进意义,加强校园篮球文化建设是积极发展社会篮球,探索扩大篮球基础之路的重要方式。探讨高校篮球文化的内涵、结构、功
文章介绍了美国主要的交叉口尾气污染扩散模型,并对模型进行了比较评价,探讨了传统交叉口扩散模型的缺陷;介绍了国内外交叉口尾气扩散研究的最新发展动态,最后提出了提高模型