电子病历信息抽取系统的设计与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:jbue520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在国内,经过几十年不断的使用和改进,电子病历功能日趋完善成熟。结构化和非结构化两种记录形式是电子病历医疗数据的主要存储格式,非结构化格式便于表达各种医疗概念及事件,至今是临床治疗过程的主要记录形式。而目前医院多个系统需要从电子病历文本病程中抽取各种相关的数据,为了解决这个问题本文针对医院电子病历病程设计一个能自动灵活抽取医学命名实体和实体关系的方案,该方案基于中文分词软件对电子病历病程进行分词、词性标注;然后采用模板和机器学习技术,其中规则用于有着显著语言学特征的文本信息,SVM用于个性化描述语言学特征不明显的文本信息。实现抽取患者症状、疾病史、用药史、检查项目、治疗手段等医学实体信息,还能抽取治疗、疾病、症状、检查、疾病诊断分类间相互关系信息的系统。实验分析发现,SVM比单独采用规则具有更好的抽取效果,而规则也为特征学习提供了很好的辅助作用。论文主要包括以下内容:1)为实现电子病历信息抽取,首先解决中文的分词问题。在确定需求和目标,分析比较现有工具后选定ICTCLAS作为分词工具。以GATE为基础,逐步实现我院批量病程的分词、句法分割、语法标记、词表收集、规则定义等。2)对电子病历文本中有显著语言学特征的数据,主要采用JAPE规则和收集医学词表的方法对其进行抽取研究。3)对电子病历中个性化描述、语言学特征不明显的信息,借助支持向量机在大规模电子病历数据上,通过上下文特征、词的语言符号特征、语义特征等的学习来进行识别研究。对于实体识别,使用实体本身和其周围的词汇语言特征。而关系抽取涉及两个实体各自的NLP特征以及这两个实体相结合的特征,每对实体的共现则通过标识符来实现。针对小规模训练集存在正例偏少、负例偏多的不平衡问题,使用SVM结合不均匀边缘的算法,正例使用大的边缘参数方法对文本分类效果有显著提高。4)采用面向对象的开发方法,三层结构B/S软件模型,运用Visual Studio 2013、SQL 2008等计算机软件开发技术设计实现电子病历信息抽取系统,并将之应用到医院的EMR环境中。试验结果表明该系统可满足日常医院对电子病历文本信息抽取的临床需求,为方便文本数据的查询和进一步深度应用提供了基础。
其他文献
普乐可复(FK506)和环孢素同属神经钙调蛋白(calcineurin)抑制剂,都能阻断钙调磷酸酶的作用,进一步影响白介素-2(IL-2)等多种细胞因子的产生,抑制T细胞的活性。FK506还能抑制TH2细胞(辅
全球化浪潮在全方位推进,为了在全球化进程中变被动力为主动,最关键产就是要增强民族凝聚力。为此,首先要进行民族整合,即进行国内各种力量的整合,尤其是进行民族文化整合和民族经
介绍了某硫酸厂320 kt/a冶炼烟气制酸装置更换转化工序Ⅳ换热器的实践,重点介绍了转化工序工艺流程、施工步骤和现场布置。更换Ⅳ换热器后,装置转化工序平稳运行,SO2转化率恢
本文就马克思研究劳动、交往和分工三者之间关系,展示人类历史演进的机制,阐述了马克思主义学说历史理论的形成.
动态目标的检测与跟踪是机器视觉领域的重要研究课题之一,旨在通过对视频图像的分析,获取被测目标的空间位置、运动状态等信息,这些信息是机器视觉系统完成诸如行为分析等其
随着全球化进程的日渐加快和扩展,从哲学的角度对全球化进程加以分析,通过历史性索其脉络和动因,分析当今全球化在经济、政治、文化以及伦理等多方面的特殊发展进程,是理论上
1StatementandReductionofthePro┐blemInthispaperweinvestigateproblemQ:Findacomplexfunctionw(z)=u(z)+iv(z),x=x+iywhichsatisfiest...
目的探讨心理护理对输卵管结扎术受术者的影响。方法对输卵管结扎术受术者进行全程心理护理,观察受术者术中合作程度、疼痛度以及术中、术后不良反应。结果受术者术中能合作与
随着社会科技的发展,人们对能源的需求与日俱增,传统化石能源资源有限,必然会面临枯竭。因此,以太阳能光伏为代表的可再生新能源在世界范围内受到了广泛的关注。并网逆变器作
《关于费尔巴哈的提纲》以人的本质理论为起点,为思想政治教育学提供了丰富的理论资源财富,是思想政治教育活动实践的重要行动指南。不论是马克思主义创立者对人的本质和实践