基于大数据的康复设备数据管理和分析的设计与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:markhai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着可移动式康复设备的发展以及用户健康意识的增强,康复医疗数据呈现爆发式增长,传统的医疗信息化建设已经不能承担海量数据的存储和分析工作。Hadoop作为主流的开源大数据技术,提供了分布式计算与存储的能力,建设以Hadoop为基础的新一代医疗大数据平台,将有效缓解海量数据的存储与分析难题。针对海量数据的存储与分析挑战,以实验室研发的康复设备采集的医疗数据为背景,首先分析了康复设备(手势游戏、平衡称、助步车)的实际业务需求,然后提炼为功能性需求,并针对不同的功能模块进行用例分析,最后设计并实现了基于Hadoop架构的医疗大数据平台。平台包含数据的采集、存储、分析和可视化四个模块,数据采集模块使用开源Sqoop、Flume工具,数据存储模块使用HDFS分布式文件系统,针对医疗小图片直接存储导致的检索效率低下问题,设计基于Sequence File技术的小文件合并方案。数据分析模块一方面使用Hive搭建数据仓库,通过维度建模方法进行指标统计分析,另一方面使用关联分析Apriori算法,通过该算法挖掘疾病间的关联性,更全面的帮助医生了解患者的患病类型。为解决Apriori算法导致的计算性能低下问题,将该算法改成基于Map Reduce形式的分布式算法。通过测试证明,单机版的Apriori算法计算所消耗的时间是分布式形式的18~20倍,有效的证明了分布式算法的高效性。数据可视化系统使用SSM框架作为后台,前端使用ECharts开源可视化库,以动态图表的形式向用户展示统计数据。以Hadoop为基础的医疗大数据平台,其高可用性、高可靠性、弹性扩容等优势有效的保障了海量数据的存储与计算。通过对系统进行功能测试和性能测试,系统可对外提供稳定的服务,达到预期设计目标。
其他文献
随着纳米光电薄膜制备工艺越来越成熟,工艺监控对于薄膜光学常数和厚度测量的精度要求越来越高。光谱椭偏仪测量薄膜厚度和光学常数具有精度高、非接触性、非破坏性和测量速度快等优点。光谱椭偏仪系统模型通常假定平行光入射到厚度均匀薄膜上实现测量,因此薄膜反射前后的偏振光都假定为完全偏振光。然而在实际椭偏测量过程中,存在厚度不均匀、有限带宽、数值孔径和散射引起的退偏效应。由于薄膜非退偏光学特性建模计算光谱无法准
目的:探讨剪切波弹性成像技术对下肢深静脉血栓分期的应用价值。方法:选取106例下肢深静脉血栓患者(106条患肢),按照发病时间分为急性期组(发病时间 30 d,n=24)。运用剪切波弹性成像技术测量血栓的杨氏模量值,对各组的杨氏模量值进行组间统计学分析;运用ROC曲线分析得出不同时期血栓的杨氏模量值的截断点
党史学习教育开展以来,中盐吉林盐业有限公司党委结合公司实际,制定了活动方案,广泛征集群众意见,围绕群众“急难愁盼”问题,扎实开展“我为群众办实事”实践活动。截至目前,各项活动有序推进,并取得了阶段性成效。保障社会民生需求开展“学雷锋,进社区”志愿服务活动。3月5日,公司党委组织志愿者服务队前往永信社区,与地方党组织开展结对共建,开展“学雷锋,进社区”志愿服务活动。
期刊
随着中国在计算机芯片技术领域的不断发展,国内自主研发GPU领域更是创新不断。但由于参数没有进行系统的统计的原因,对于目前自主研发显卡与市面上流通的一般显卡在性能上有多大差距,相关研发人员并没有一个量化的认识。而市场上没有能支持自主显卡的基准测试系统,无法获得相关数据。因此设计一款能够覆盖包括自主显卡在内各式显卡,以及能够运行在各个常见PC操作系统上的基准测试系统是十分必要的。本文主要研究内容是显卡
在学术领域中常常需要通过关键字对论文进行分析,关键字提供了高度概括性的论文信息,是对论文进行信息检索、自动分类、自动聚类和观点挖掘的基础。随着网络信息量的迅速增加,手工标识关键字费时费力且主观性强,因此论文关键字自动生成成为了研究热点。传统的关键字自动生成算法主要通过统计数据进行关键字生成,没有考虑到文本中的语义信息。随着深度学习和自然语言处理学科的快速发展,现今的关键字生成算法能够利用序列到序列
随着互联网技术的飞速发展,网络信息越来越丰富,消息传递越来越即时,互联网成为了人们日常获取信息的重要来源。面对浩瀚的互联网信息,人们想要获取自己想要的信息变得越来越困难。若一个网站能够实时捕获用户浏览行为,提供给用户个性化服务,会得到用户的认可和青睐。获取用户的行为轨迹,即时提供个性化信息服务,成为一个网站长期发展的重要一环。基于插件的用户点击流分析系统主要分为数据采集模块、数据预处理模块、数据仓
图像分割是进行图像理解、分析的基础。准确的分割对后期理解图像有重要的意义,是当前图像处理领域的热点。采用水平集的图像分割算法,凭借其多信息融合性、高度的灵活性和自由的拓扑变换等优点,受到了国内外学者的广泛关注。目前,水平集方法还处于发展阶段,仍没有一种处理各类图像的通用分割算法,处理灰度分布不均、多目标等复杂背景的图像效果不理想。因此,在理论和应用方面有待于进一步完善和研究。在此背景下,本文对基于
随着互联网和电子商务的飞速发展,网购已经成为我们日常生活中的一部分。在网购时,用户除了要看商品本身描述信息之外,其他已购买用户的评论也是重要参考指标。对商品评论进行情感分析,对用户来说可以知道商品的真实口碑,从而决定是否购买;对商家来说,通过了解商品的市场口碑情况,调整销售策略从而增加营收。由于商品评论文本偏口语化,机器学习的方法过度依赖人工提取特征,导致机器学习方法在进行商品评论情感分析时有较大
近些年来,随着大数据技术的发展越发成熟,大数据早已不只是作为一个概念而存在,各个行业均开始把大数据技术应用到各自的企业生产环境中去。自TDH(Transwarp Data Hub)发行以来,经过多年的发展,其产品体系不断完善,性能不断提高,它相比于开源Hadoop,对于集群的管理更加集中,避免了集群管理和升级的诸多难题。然而即使这样,它对集群的管理仍然不能覆盖集群中的各个方面,对于大规模的集群,其
随着互联网技术的不断发展和网络信息化的建设与普及,我国的电子商务飞速发展,人们越来越喜欢在电商平台中购买商品,与此同时,电子商务系统也面临着诸多挑战,因此,如何设计一个功能完善、易于维护、可扩展性强的电子商务网站是重要的研究热点。另外,随着电子商务的发展,商品的种类和数量越来越丰富,消费者需要花大量的时间和精力在海量商品中寻找感兴趣的商品。因此,一个能够解决信息过载和信息迷失问题的个性化推荐系统也