浅谈大数据技术及医疗应用

来源 :电子乐园·中旬刊 | 被引量 : 0次 | 上传用户:moowoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:本文浅谈大数据相关技术及当前大数据库处理架构Hdadoop,其中包括分布式文件系统HDFS、分布式数据库HBase,MapReduce模型及工作流程,并且对大数据在医疗应用方面进行举例及分析。
  关键词:大数据技术;医疗应用分析
  一、大数据关键技术
  Hadoop是开源分布式计算平台,提供了分布式基础架构,支持多平台运行,Hadoop核心技术包括分布式文件系统HDFS、分布式数据库HBase和MapReduce分布式并行编程。分布式文件系统HDFS能够实现较高的读写速度及容错率,能够在廉价的集群上运行,拥有很好的拓展性。Hadoop是分布式处理软件架构的典范,包含了众多的子项目,其中还包括Zookepper,Hbase、Hlive、Pig等功能组件。涉及分布式并行编程、分布式数据库、分布式文件系统、NoSQL数据库、云数据库、流计算、图计算等等相关技术。Hadoop官方推荐使用Linux操作系统,需要在集群的每个终端电脑上创建Hadoop用户,安装JAVA虚拟机,并且设置SSH登录权限,以便于启动集群中Hadoop守护进程。对于分布式集群而言,需要通过配置文件对各个组件协同进行配置。
  HDFS(分布式文件系统)能够运行在廉价服务器上,在设计之初就将服务器故障作为常见问题来考虑,充分考虑的硬件的不稳定性。HDFS可以保证硬件不稳定的情况下也能保证文件以文件流的形式访问文件系统中的数据。HDFS分布式文件系統为了减少寻址开销,64MB为单位,以块的形式进行存储及读取。HDFS中名称节点(NameNode)和数据节点(DataNode),而名称节点拥有两个核心数据结构,FsImage和EditLog。FsImage用于保存文件系统的树形结构及文件结构的元数据,而EditLog记录了所有对文件的创建、删除等。FsImage文件加载在内存中,所有操作记录在EditLog中,当重启名称节点时,通过EditLog还原FsImage为最新记录。数据节点(DataNode)是文件系统中的数据存储节点,用于数据存储和读取,并定期向名称节点发送该服务器上所存储的块列表信息。HDFS采用主从结构模式进行内部管理, HDFS集群包含一个名称节点,多个数据节点。一个文件会被切分成多个数据块,数据块会被分布存储到各个数据节点上。当客户端需要访问一个文件时,首先通过名称节点查找到这个文件所有的块数据节点的位置,客户端直接并行访问数据节点以提高数据访问速度。
  HBase是高可靠、高性能、可伸缩、面向列的分布式数据库,主要用来存储非结构化和半结构化的松散数据。HBase分布式数据库一般使用HDFS文件系统用来存储底层数据,使用行键、列族、列限定符、时间戳对数据进行检索,时间戳是为了保证每个单元格对同一份数据存在多个版本,不同版本通过时间戳进行辨别。HBase数据库中的表由行和多个列族组成,表中的每个列都归属于一个列族,访问表中数据时,列族作为列的前缀进行访问的,例如,School:Name,通过四维坐标的形式,访问Hbase表中的数据,即[行值,列族,列,时间戳]的形式。HBase数据库是基于列式存储方式进行数据存储,以列为单位,具有相似属性值得数据会被连续存放在一起,而一行中的数据会以列为单位被分开存储,而传统关系型数据库中一行数据会被连续存放在存储磁盘页中,当我们需要访问其中某些属性值时,必须将整行数据所有属性值查询一遍,存放在内存中,对于大数据量时会造成IO资源及内存资源紧张。列式数据库适合于大批量数据的查询,仅需处理可用的查询列,与其无关的数据列则无需响应,但是当需要一个完整的数据元组时将从各个数据磁盘页中将数据进行重组和封装,以拼凑成完成元组数据,这对于联机型事务和实时业务而言,会造成资源极度消耗。
  MapReduce是关于大数据的核心并行计算模型,将大规模集群上并行计算进行具体抽象为Map和Reduce两个函数,编程人员只需要实现Map和Reduce函数,而不需要关系进程调度、负载、分片、容错等具体细节,Map函数是作为数据输入函数,数据来自于大数据集被分割成的小数据块,这些小的数据块可以独立的、并行的被多个Map任务来处理,数据块格式是任意形式的,如文档、图片、二进制格式都可以。Reduce函数的输入来自于Map处理后的结果,将具有相同键值对的数据以某种方式组合在一起,形成一个合并文件或结果Map函数处理结果后通常会形成<key,value>形式的中间结果,而Reduce函数的作用则是将多个Map函数生成的结果进行合并,将相同key键值的数据合并在一起,以某种计算方式进行最总合并,最终得到我们想要的结果。
  二、医疗应用
  数据特别适合医疗数据的分析和汇总,由于患者的数据非常庞大,患者的数据可以来自于物联网可穿戴设备、也可以来自于医院内的HIS、RIS、PACS、LIS、EMR等系统数据,同时这几年随着医改不断深化,医保数据及DRGS数据分析都离不开大数据的支持,在医院管理层面,领导层更希望得到整个区域患者来院及分布,某类疾病的患者外流原因及数量,医院人员的工作效率等等,都需要大数据技术的支持,可以说大数据技术将影响医院未来管理的方向,能够让管理者更宏观的通过数据对医院的整个运营状态进行把控,并给予相应的原因分析。人类基因测序、区域健康大数据、流行病学的追溯及预测、智慧医疗都是大数据研究的范畴。医疗健康大数据蕴含着巨大的价值,越来越多的人注重自身的健康管理,通过自身的查体健康档案,可以通过大数据预测未来发生某种疾病的风险,并给予健康指导及健康规划、健康诊疗方案。大数据的发展特别能够推动各自医院朝着智慧医院方向发展,促进更多智能化患者服务,更好的为患者提供服务。
  参考文献
  [1]张卜月.大数据技术原理与应用探微[J].通讯世界,2019,26(01):138.
  作者简介:薛凯,男,山东省青岛市,1990年5月,本科,高级系统架构师,软件设计师,青岛市黄岛区人民医院信息中心工作,主要从事软件维护、软件开发
其他文献
摘要:随着大数据技术的迅猛发展,其在各行各业中的应用越来越广泛、深入,在提高生产生活效率的同时,也推动了社会进步。电力行业是我国重要的基础性、支柱性产业,在国民经济中占有举足轻重的地位。在电力行业运营的过程中,产生了大量的数据,这些数据具有数量大、关系复杂等显著特点,适合大数据技术的深入应用。  关键词:大数据;电力营销  电力企业要想生存、发展,必须紧跟时代发展潮流,构建大数据管理中台,实行信息
期刊
摘要:计算机云计算作为一种现代化新型计算机模式,其涉及到的数據存储技术可以使大规模数据实现高效存储、管理及处理,使存储数据具有更高安全性,计算机用户通过使用云计算可以实时访问数据,并对大规模数据实现顺畅传输。在大数据时代背景下,云计算的数据存储能够更充分的满足大量数据管理需求,为用户带来更多高效、可靠、安全的数据服务。为了使计算机云计算数据存储获得更广泛的应用,实现更深层次的发展,需要进一步优化数
期刊
摘要:近年来在经济发展和科技进步的驱动下,我国工业水平得到迅速发展,在工业领域应用广泛的电子技术水平也得到显著提高,这对促进产业升级和提高人民生活水平都具有积极意义。电子技术中,加强测控技术的引入与应用,能够使电子技术更加可靠,更加准确快速地获取信息,往往能够推动电子技术的发展。本文将重点研究测控技术在电子技术中的应用,仅供参考。  关键词:测控技术;电子技术;工业发展  一、引言  近年来在经济
期刊
摘要:互联网是当今最为热门的学科之一,不断对其深入研究和挖掘利用,会对社会产生重大变革。在物联网内应用电子信息技术,能够不断的融合物联网内全部的环节,可以让物联网提供给人们更好的服务。另外,电子信息技术融合物联网发展,对物联网发展的作用起到非常关键的影响,两者之间是相辅相成的。本文对此展开分析探讨。  关键词:电子信息技术;物联网;应用  1物联网与电子信息技术的概述  1.1物联网  伴随科技水
期刊
摘要:当前,信息技术发展快速,以云计算技术为载体的信息技术发展,成为新时代计算机网络发展的重要领域。从实际而言,网络云计算技术实现了信息技术的新发展,能够在新的技术空间,实现计算机信息技术的拓展性应用,符合新时代的发展需求。因此,应当深入开展计算机网络云计算技术的研究与分析,为网络信息技术的发展提供了新的方向,在新的时代视域空间,构建网络云计算技术的发展维度,适应新的时代环境。  关键词:现阶段;
期刊
摘要:在科技创新和不断发展的形势下,越来越多先进的技术也逐渐在社会生产以及人民群众的生活中得到了广泛的应用,为人们的生活提供了诸多的便利。其中物联网技术也逐渐进入到广大人民群众的视野中,实际上物理网就是先进信息技术中的一类,在物联网系统中,计算机通信技术是最重要的内容,是我国计算机技术产业与传统通信技术融合发展的产物,有效弥补了传统通信中的不足。但是在传输信息的过程中也会受到一定因素的影响,导致通
期刊
摘要:在互联网大数据时代下,人们消费行为习惯和企业的营销格局发生深刻变化,传统的营销理念和营销模式已经无法有效地服务企业营销战略的实施,企业亟需在新的营销模式逻辑中,运用新的营销理论来实现营销模式创新。本文将通过介绍互联网大数据时代对企业营销的影响,同时,为企业管理者提供了有实践价值的建议。  关键词:互联网大数据;营销模式;创新路径  随着互联网大数据时代的到来,互联网大数据使每个行业紧密地联系
期刊
摘要:进入21世纪以来,随着我国电力系统的快速发展和深入改革,各种新型电力技术得到了广泛应用并取得了良好的效果。近年来,智能电网发展过程中覆盖范围和产生的影响正在不断提高,而电力调度作为智能电网运行的一个重要工作内容,关系到电力调度和配送等多个方面的问题。为了保证电力调度的顺利进行,我国在近些年建立了电力调度数据网络,通过这种方式可以实现电力的自动化调度,从而实现电力调度工作效率和效果的提高。但是
期刊
摘要:电力工程管理质量是确保我国日常生活生产的重要基础,因此为了更好地降低大规模停电以及能源供应不力现象出现的概率,就需要针对其中存在的不足之处进行针对性的改进策略制定,进而为促进电力行业的健康发展奠定良好基础。本文将对电力工程管理中存在的不足之处进行改进策略的探究。  关键词:电力工程;管理;不足;改进  1 引言  电力工程管理需要专业的管理方式、管理人才以及管理体系融入,才能更及时地对输电过
期刊
摘要:在我国建筑施工中,大体积混凝土结构是比较常见的结构形式,由于受到各种因素影响,其建设质量关系到房屋建筑整体建设质量。本文旨在研究大体积混凝土结构施工技术经常发生的问题,探析有效的处理办法,进而提升土木工程建筑的品质,给今后的工作带来借鉴意义。  关键词:大体积混凝土结构施工技术;土木工程建筑;应用探析  近年来在科技进步与经济发展的双重驱动下,我国建筑技术取得辉煌发展,大体积混凝土结构施工技
期刊