基于MapReduce的中医药并行数据挖掘服务

来源 :浙江大学计算机科学与技术学院 浙江大学 | 被引量 : 0次 | 上传用户:fongyifei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着中医药信息化的进一步深入,更广泛的中医药临床数据被规范化整理,形成了大量标准的中医药数据库,使得中医药信息的数据量进一步膨胀,而原有的单机版DartSpora数据挖掘软件无法满足这种对海量数据进行挖掘的要求。针对这种新的需要本文提出了基于MapReduce的中医药并行数据挖掘服务框架,来满足中医药研究对更高性能计算能力的要求,这种方法可以充分利用已有的高性能集群的计算能力,为DartSpora平台提供更强大的后台支撑。同时,这种服务方式又具有一定的通用性,可以为一些非领域内的挖掘要求服务。在这个针对中医药研究的并行服务框架中,具体实现了以下内容:(1)设计并实现了可视化交互平台,以及可编程的Web Service服务。(2)在并行框架集成的算法库中,具体开发了a)针对单图的频繁模式发现算法,并应用到中医方剂组成配伍的研究中;b)实现了简化点式互信息算法,并把其应用于中医临床数据。
其他文献
随着工业信息化进程的不断加快,软件行业发展与企业信息化战略关系日益紧密,企业对软件系统的功能性要求越来越丰富,而在成本预算上却希望尽量的降低。SaaS(Software-as-a-Se
随着网络技术的普及和社会信息化程度的提高,各个应用领域所积累的信息资源在网络上飞速增长,网络服务已逐渐成为了人类获取知识的必要渠道,百科知识库正是其中最为广泛应用
射频识别(RFID)技术是一种非接触自动识别技术,该技术凭借标签体积小、成本低、非接触识别、自动识别等特点,已广泛应用于多个领域。但是,由于易受外部环境的干扰和射频信号
随着嵌入式软件的广泛应用以及开发技术的日新月异,相对于硬件的日益稳定,软件却频频出现故障。作为保证软件质量的最有效手段的测试技术,因此越来越引起软件用户以及开发人
作业车间调度问题,经过了半个多世纪的研究,取得的丰富的理论成果。柔性车间调度问题是对作业车间调度问题的扩展,由于其具有路径柔性的特点,相比较普通的作业车间调度问题来
随机共振自从在上个世纪八十年代被提出以来,经过将近三十年的发展,在理论和实验研究中取得了很多成果,也应用于物理、化学、生物学、通信、信息论、电子学、光学、超导、神
目前,我国电子政务进入了快速平稳的发展时期,其在建设过程中积累了大量的决策案例,这些案例记录了当时的决策情景、处理办法、决策执行的结果等。基于案例的推理(Case-Based
半监督学习是人工智能研究领域的一种有效方法,主要是用于解决在标签样本数量不足的情形下模型的训练和分类(或识别)问题。现实生活中受各种主观或客观条件的影响,标签的样本的数
市政工程造价系统一直以来由于其自身的复杂性和变化性,至今未有人性化的计量计价软件。随着软件工程和软件复用的飞速发展,在当前最新的软件复用技术上设计新的工程造价系统
网络已经成为人们生活中不可或缺的一部分,然而网络入侵严重影响了网络的正常运行与使用,甚至会给用户带来了巨大的损失,网络安全已经成为一个重要的研究课题。网络安全通常