基于云计算的海量电子病历文本分析系统研究

被引量 : 0次 | 上传用户:tpxlw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子病历是医疗卫生信息化的重要研究领域。作为病人在医疗机构历次就诊过程中产生和被记录的完整、详细的临床信息资源,结构化的电子病历中还包含有大量的非结构化文本信息,例如以自然语言记录的临床表现等医疗记录。在医院内部或跨医院的区域范围内电子病历数据是海量的,如何在海量的电子病历数据资源中对其中的非结构化文本信息进行标注和分析,从而建立索引以供查询是一个亟待解决的问题。针对上述问题,本文在深入分析非结构化信息管理架构UIMA(Unstructured Information Management Architecture)规范和云计算编程模型MapReduce等相关技术基础上,提出了一种在云计算环境下基于UIMA对海量电子病历中的非结构化文本信息进行分析并建立索引的解决方案,设计并实现了相应的原型系统。与传统的文本分析系统相比,本文工作具有以下特点:1)将UIMA框架与云计算编程模型MapReduce相结合,提出了一种在云计算环境下基于UIMA对海量电子病历中的非结构化文本信息进行分析并建立索引的解决方案。该方案既利用了基于MapReduce的云计算环境的并行处理能力,又保持了基于UIMA规范的系统架构的开放性,可根据不同的分析需求开发部署不同的分析引擎。2)基于上述解决方案的原型系统提供对基于跨机构文档共享规范XDS(Cross-Enterprise Document Sharing)的电子病历数据中心的接口,并可根据云计算平台Hadoop的输入要求对电子病历中的非结构化文本信息进行预处理;原型系统对这些非结构化文本信息的分析和索引建立实现并行处理。3)开发实现了一个基于UIMA规范的中文分析引擎。该引擎以开源的中文分词软件IKAnalyzer为基础,结合外部的受控医学词汇CMV(Controlled Medical Vocabulary)服务,可标注分析结构化电子病历中用自然语言记录的非结构化中文文本信息。实验数据和原型系统的应用情况表明,该系统是可行及有效的。
其他文献
<正>随着经济社会的发展,财政支出规模和行政事业单位资产规模越来越大。2008年,江苏一般预算支出3201亿元,据2007年全省行政事业单位资产清查,资产总额达5862亿元。这些庞大
目的观察正压无针连接式留置针在儿科患者治疗中的临床使用效果。方法将2009年6—8月行静脉输液治疗1岁以上的患儿100例随机分为对照组和观察组,每组各50例,对照组使用普通密
在阐述我国区域经济学发展概况的基础上 ,分析了区域经济学的研究领域 ,并提出以区域经济研究四大内容(区域经济发展、区域经济关系、区域经济政策和区域经济管理 )、理论组
<正>音乐艺术是人类心理的产物,音乐起源于劳动而始于自娱.情之所至,从乐而舞、手之舞之、足之蹈之,所以音乐最早就已具有了表演的性质.随着人类文明的提高,音乐文比也从粗俗
输油管道加热炉是长距离输油管道的主要设备之一,是将燃料燃烧产生的热量传递给被加热介质而使其温度升高的一种加热设备。在油气集输系统中,起防凝降粘作用。随着石油工业的
针对目前世界上大部分油田采用注水开发面临着需要进一步提高采收率和水资源缺乏的问题,国外近年来大力开展了二氧化碳驱油提高采收率(EOR)技术的研发和应用。这项技术不仅能满
在构建土地特征价格模型的基础上,利用数据检验了成都市住宅宗地价格的影响因素及其对地价的溢价效应。可为成都市土地出让、转让价格的完善提供依据,也为政府合理投放公共资
目前,传感网最常用的复用技术由于受各种因素的限制很难满足许多大型结构需要大量FBG的监测要求。此外由于同时测量多个FBG存在光谱混叠现象,使得传感网中FBG传感器的复用数
工程地质灾害治理中,注浆是最常用的方法,浆液的扩散运移规律对工程设计和施工具有重要的意义。采用SV振弦式黏度计测定水泥–玻璃(C-S)浆液的黏度时变性,通过函数拟合获得黏
公立医院固定资产管理影响医院规模和综合实力的提升。文章从内部控制角度出发,阐述公立医院固定资产管理机制的内涵和特点,内部控制与公立医院固定资产管理的关系,分析我国