结合构成特征的症状上下位关系自动识别方法研究

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:xuhuangyun1118
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着医疗信息化的发展,各种医疗知识库被构建。医疗知识库包括通用的医疗术语标准和针对某一类医疗实体(疾病、药品等)构建的专门知识库,但目前没有标准的症状知识库。而作为医疗实体的重要组成部分,症状实体及实体间的上下位关系对于电子病历文本分析、医疗知识问答和临床决策等应用系统均有着重要作用。因此,症状的实体识别和上下位关系识别是一项重要的任务。由于中文症状描述更像是句子而非词语,因此在上下位关系识别过程中,会有大量未登录词,同时症状词对在语料中的共现也很稀疏,所以目前已有的上下位关系识别方法并不适合于症状实体。  基于症状间上下位关系识别的难点,本文将症状之间的上下位关系抽取看作一个分类问题,提出了基于症状构成特征的上下位关系自动识别方法。具体来说,本文首先将症状按照预定义的构成成分进行切分和成分标注,然后将症状构成特征作为分类特征,又增加了上下位词典特征和通用特征这两类特征,训练了SVM分类模型进行上下位关系的抽取。该方法取得了较好的准确率和召回率,但是无法很好地解决未登录词的问题,因此本文又提出了一种基于带注意力机制的双向GRU方法进行症状上下位关系的识别。本文使用双向GRU对中文症状进行向量建模,通过接收字向量或词向量,辅以注意力机制,以充分考虑症状的内在结构和语义信息。实验结果证明,本文提出的方法比其他现有的上下位关系抽取方法更有效。同时,该方法可以通用于疾病等其他医疗实体的上下位关系识别任务中。
其他文献
为了在嵌入式Linux中能够方便快捷地使用“非易失性”的嵌入式存储卡,有必要对嵌入式Linux中的存储卡驱动开发加以研究,从而构筑一个嵌入式Linux的存储子系统。根据嵌入式Lin
随着Web的不断增长,人们对Web信息检索系统提出了更高的要求。Web信息检索也逐渐成了互联网研究中的一个热点。近年来,又有一些学者提出了面向特定主题的Web信息检索方法,以满足
Web服务以其独特的魅力越来越受到IT领域的广泛重视,而由于其基于网络的特性,安全问题就不可避免地成为开发者和公司的最大关注点。现有的Web服务安全机制确实在很大程度上保护
随着软件规模的不断扩大,软件错误也越来越容易产生。尽早地检测软件中的错误是软件开发过程中的一个重要任务,也是降低软件开发成本的主要手段。特别是针对人机交互操作较多的
软件测试是保障软件质量的重要方法。组合测试是一种有效的黑盒测试方法,能够有效地探测由参数交互引发的软件失效。组合测试数据生成是组合测试领域重要的研究方向。近年来,基
我国网民规模和互联网普及率迅速提升,其中网络游戏用户占整体网民很大比重。在近些年我国的游戏行业市场中,客户端网游的市场持续增长,电子竞技在客户端网游收入中占比越来越大
网络管理系统中的安全管理有两层含义,即网络的安全管理和安全的网络管理。相应地,安全管理子系统的功能也可分为两部分,一是网络管理系统本身的安全,二是被管网络对象的安全
随着科学可视化技术的成熟和发展,医学成为虚拟现实(VR)的主要应用领域之一。VR在医学领域上的一类重要应用是手术仿真系统,就是专门用来模拟在手术过程可能遇到的各种现象的虚
决策树分类学习算法是使用最广泛、实用性很强的归纳推理方法之一,在机器学习、数据挖掘等人工智能领域有相当重要的理论意义与实用价值。 在各种决策树学习算法当中,最有影
随着嵌入式系统和移动通信的快速发展,WAP逐渐成为通信界关注的热点话题之一。世界上许多设备制造商和应用开发商,特别是欧洲,已推出多种基于WAP的系统和应用,许多WAP无线数