基于云计算的海量电子病历文本分析系统研究

被引量 : 0次 | 上传用户：tpxlw

【摘要】

：

电子病历是医疗卫生信息化的重要研究领域。作为病人在医疗机构历次就诊过程中产生和被记录的完整、详细的临床信息资源,结构化的电子病历中还包含有大量的非结构化文本信息,

【作者】

：

郭建

【发表日期】

：

2011年期

【关键词】

：

电子病历非结构化信息云计算 UIMA Hadoop

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

电子病历是医疗卫生信息化的重要研究领域。作为病人在医疗机构历次就诊过程中产生和被记录的完整、详细的临床信息资源,结构化的电子病历中还包含有大量的非结构化文本信息,例如以自然语言记录的临床表现等医疗记录。在医院内部或跨医院的区域范围内电子病历数据是海量的,如何在海量的电子病历数据资源中对其中的非结构化文本信息进行标注和分析,从而建立索引以供查询是一个亟待解决的问题。针对上述问题,本文在深入分析非结构化信息管理架构UIMA(Unstructured Information Management Architecture)规范和云计算编程模型MapReduce等相关技术基础上,提出了一种在云计算环境下基于UIMA对海量电子病历中的非结构化文本信息进行分析并建立索引的解决方案,设计并实现了相应的原型系统。与传统的文本分析系统相比,本文工作具有以下特点:1)将UIMA框架与云计算编程模型MapReduce相结合,提出了一种在云计算环境下基于UIMA对海量电子病历中的非结构化文本信息进行分析并建立索引的解决方案。该方案既利用了基于MapReduce的云计算环境的并行处理能力,又保持了基于UIMA规范的系统架构的开放性,可根据不同的分析需求开发部署不同的分析引擎。2)基于上述解决方案的原型系统提供对基于跨机构文档共享规范XDS(Cross-Enterprise Document Sharing)的电子病历数据中心的接口,并可根据云计算平台Hadoop的输入要求对电子病历中的非结构化文本信息进行预处理;原型系统对这些非结构化文本信息的分析和索引建立实现并行处理。3)开发实现了一个基于UIMA规范的中文分析引擎。该引擎以开源的中文分词软件IKAnalyzer为基础,结合外部的受控医学词汇CMV(Controlled Medical Vocabulary)服务,可标注分析结构化电子病历中用自然语言记录的非结构化中文文本信息。实验数据和原型系统的应用情况表明,该系统是可行及有效的。

其他文献

创新财政绩效评价和行政事业资产管理工作推进财政科学化精细化管理

<正>随着经济社会的发展,财政支出规模和行政事业单位资产规模越来越大。2008年,江苏一般预算支出3201亿元,据2007年全省行政事业单位资产清查,资产总额达5862亿元。这些庞大

期刊

绩效评价中介机构事业单位资产江苏省财政厅科学化精细化管理

新型正压无针连接式留置针在儿科的临床应用

目的观察正压无针连接式留置针在儿科患者治疗中的临床使用效果。方法将2009年6—8月行静脉输液治疗1岁以上的患儿100例随机分为对照组和观察组,每组各50例,对照组使用普通密

期刊

新型正压无针连接式留置针输液护理

区域经济学理论体系的构建

在阐述我国区域经济学发展概况的基础上 ,分析了区域经济学的研究领域 ,并提出以区域经济研究四大内容(区域经济发展、区域经济关系、区域经济政策和区域经济管理 )、理论组

期刊

区域经济学理论体系

漫谈舞台艺术实践——小提琴演奏艺术教学随想之二

<正>音乐艺术是人类心理的产物,音乐起源于劳动而始于自娱.情之所至,从乐而舞、手之舞之、足之蹈之,所以音乐最早就已具有了表演的性质.随着人类文明的提高,音乐文比也从粗俗

期刊

小提琴演奏艺术音乐表演艺术演奏者

一种输油管道用热媒加热炉结构分析及优化设计研究

输油管道加热炉是长距离输油管道的主要设备之一,是将燃料燃烧产生的热量传递给被加热介质而使其温度升高的一种加热设备。在油气集输系统中,起防凝降粘作用。随着石油工业的

学位

热媒加热炉有限元分析ANSYS优化设计二次开发

濮城沙一下油藏CO2驱提高采收率研究

针对目前世界上大部分油田采用注水开发面临着需要进一步提高采收率和水资源缺乏的问题,国外近年来大力开展了二氧化碳驱油提高采收率（EOR）技术的研发和应用。这项技术不仅能满

学位

CO2驱油驱油机理现场试验注入工艺

成都市住宅宗地价格影响因素研究

在构建土地特征价格模型的基础上,利用数据检验了成都市住宅宗地价格的影响因素及其对地价的溢价效应。可为成都市土地出让、转让价格的完善提供依据,也为政府合理投放公共资

期刊

住宅宗地土地价格溢价值

基于码分多址技术的光纤光栅传感系统

目前,传感网最常用的复用技术由于受各种因素的限制很难满足许多大型结构需要大量FBG的监测要求。此外由于同时测量多个FBG存在光谱混叠现象,使得传感网中FBG传感器的复用数

学位

传感网复用技术光纤Bragg光栅FBG码分多址CDMA相关解调技术

基于黏度时变性的水泥–玻璃浆液扩散机制研究

工程地质灾害治理中,注浆是最常用的方法,浆液的扩散运移规律对工程设计和施工具有重要的意义。采用SV振弦式黏度计测定水泥–玻璃(C-S)浆液的黏度时变性,通过函数拟合获得黏

期刊

土力学C-S浆液黏度时变性扩散机制数值模拟

内部控制机制在公立医院固定资产管理中的应用

公立医院固定资产管理影响医院规模和综合实力的提升。文章从内部控制角度出发,阐述公立医院固定资产管理机制的内涵和特点,内部控制与公立医院固定资产管理的关系,分析我国

期刊

内部控制公立医院固定资产管理

基于云计算的海量电子病历文本分析系统研究

与本文相关的学术论文