基于电子病历的深度神经网络预测模型研究与应用

来源 :郑州大学 | 被引量 : 0次 | 上传用户:bazzi89
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子病历中蕴含着海量的有价值信息,对电子病历的挖掘可以极大的提高医疗诊断效率,提高临床诊断的及时性、准确性,还可以降低医疗成本,为互联网医疗提供便利。本文利用深度学习方法,通过建立深度神经网络来搭建预测模型,同时结合传统的机器学习方法,在电子病历匿名化、胎儿体重预测和疾病分类预测等方面进行了预测模型构建的尝试。本文的主要工作有:(1)提出了基于文本骨架的循环神经网络匿名化模型,为电子病历难以被研究者使用的难题提供了新的解决方案。文本骨架是抽取出的电子病历的文本结构,它可以帮助循环神经网络更好的识别出隐私实体。本文在两个英文数据集和一个中文数据集上对基于文本骨架的循环神经网络匿名化模型进行了实验,结果表明文本骨架方法可以有效的提升神经网络的识别准确率。与现有的性能最优的模型对比也证明文本骨架方法在匿名化任务中有优异的表现。在中文数据集中文本骨架模型达到了近99%的识别准确率,在英文数据集中也达到了高于98%的识别准确率。(2)针对胎儿体重预测任务,提出了基于深度神经网络的胎儿体重预测模型。传统的公式计算方法严重依赖于医疗领域知识和医疗经验,本文提出的基于深度神经网络的方法无需对参数进行人工选择,只需大量训练数据即可训练出准确的预测模型。除此之外,本文还介绍了从电子病历中提取参数的方法,以及针对数据缺失值补全的策略。实验表明,基于深度神经网络的胎儿体重预测模型优于公式预测方法与基于传统人工神经网络的模型,降低了8.9%的预测误差。进一步的分析还表明本文提出的缺失值补全方法能够有效的加强对深度神经网络的训练。(3)本文提出了基于w-KNN的疾病预测模型。预测模型首先需要对于半结构化的病历进行处理,将其自顶向下的处理为结构化病历,对于参数中的自由文本短语,将其进一步的映射为词典中的症状。w-KNN的另一个优势在于,算法不仅可以进行疾病的预测,还可以找出与新样本最相似的历史样本。实验表明基于w-KNN的疾病预测模型可以有效的基于患者病历对疾病进行分类预测。
其他文献
自WTO在全球积极倡导贸易便利化开始,中国不仅积极的参与贸易便利化行动,致力于消除这类“贸易非效率”障碍,而且还在国内大力推进贸易便利化进程,贸易成本不断下降,贸易便利
人工挖孔桩因其施工简单、工期短、造价低、承载力大等优势在工程施工中应用广泛,与此同时,其作业危险性也被施工企业广泛关注,为保证人工挖孔桩安全施工,本文运用LEC法对人
为了应对内部资源不足和外部市场变化,组织往往通过建立跨组织团队的方式从事创新活动。跨组织团队是这样一种团队:团队成员来自不同的合作方组织,共同完成合作任务。例如,苹
个性化的叙述与描写语言,丰富的色彩语汇,柔软的吴语神韵以及积极修辞的神来之笔,构建了杨绛文学语言的庞大体系,同时形成了平常中见雍容典雅的独特语言风格.
在论证内部基准分析对中石化海外原油供应链绩效优化适用性的基础上,将评价指标体系从原油采购量和协同合作两个视角进行归纳分类。根据内部基准分析原理,当中石化从供应链内
经历改革开放初期、90年代和21世纪三个不同历史阶段,大学生的留学现象发生了翻天覆地的变化,大学生的留学意识也悄然发生着变化.从对于留学的"初醒"状态成长为多元化形态,呈
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
为了解小麦高分子量谷蛋白亚基(HMW-GS)组成与品质之间的关系,对177份黄淮南片地区小麦品种(系)的HMW-GS组成及其品质进行了检测。结果表明,177份材料在Glu-A1位点上有3种亚
【正】 一、国际化经营——世界经济发展的趋势。 世界经济发展经验表明:一个国家在现代化过程中,在大量引进、利用外资的同时,都毫无例外地主动向海外投资,开展国际化经营,
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技