面向医学知识图谱构建的实体关系抽取研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:sanxin327
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着医疗信息化的不断发展,蕴含着丰富医学知识的各类医学文本的数量激增,对高效地利用文本中有价值的信息造成困难。知识图谱因能够对海量结构化文本知识进行表示,实现知识的快速查询而被广泛使用。同时医学知识图谱作为驱动智慧医疗服务与应用的关键基石,有助于临床辅助决策、智能导诊等应用的发展。医学文本中大部分是结构并不明确的为半结构化和非结构化文本,无法直接存入医学知识图谱。关系抽取因能够实现医学文本的语义结构显式化,成为医学知识图谱构建的关键技术,因此本文针对不同类型文本进行了实体关系抽取研究,所做的主要工作有:(1)针对医疗领域中的半结构化文本,以构建药品知识图谱为目标,采用BERT-Bi LSTM-CRF模型进行了关系抽取研究。该模型通过BERT语言模型获得输入文本序列的深层次语义表示,并输入至Bi LSTM层进行进一步的语义编码;通过CRF层处理输出标签之间的依赖关系,获得文本的最优标注序列,实验结果中F1值分别达到94.9%和95.7%;其次基于药品文本中已有的半结构化信息构建了药品与多种实体间的结构化关系;最后为了解决多源药品知识的局限性和表示方式的差异性,分别从模式层和数据层两个层面构建了中文药品知识图谱(Chinese Medicine Knowledge Graph,CMKG)。(2)针对医疗领域中的非结构化文本,提出了一种融合外部医学知识的多头关系抽取模型Ro KE-PN-Mhead。模型在嵌入层使用Ro BERTa预训练模型对输入文本进行编码,并融入外部医学知识以增强文本的语义信息。同时将嵌入层向量输入指针网络进行实体识别,并根据抽取出的实体向量采用多头选择机制进行实体关系抽取。在医学数据集CMe IE上的实验结果表明,相比其他深度学习模型,Ro KE-PN-Mhead模型在进行医学关系抽取时能取得更好的效果,F1值达到59.14%。以及在通用领域数据集Du IE 2.0上验证了去除外部医学知识后模型进行关系抽取的有效性和可拓展性,F1值达到70.55%。
其他文献
学位
阿尔茨海默症(Alzheimer’s Disease,AD)是神经退行性疾病中最为常见的一种,在发病率、患病率和致残率上具有较高的比例,给人类健康生活带来了严重的威胁。AD的主要临床表现为认知功能损伤,生活自理能力丧失,且伴有不同程度的神经精神症状及行为障碍。AD致病机制尚不清楚,目前主要有Aβ学说、Tau蛋白代谢异常学说等几种假说。AD治疗方法主要包括药物与非药物疗法。当前的药物疗法可以缓解AD
近年来,自然语言处理领域发展迅速,深度神经网络得到了广泛的应用。同时,在互联网、人工智能等技术蓬勃发展的大背景下,各大手机音乐软件为了实现功能多样性和丰富用户的体验,歌曲的智能搜索和推荐功能逐渐兴起并普及,对于歌词的情感分析是实现这些功能的关键技术。在一首歌曲中,旋律与歌词相辅相成,它们共同传达着歌曲所表现的情感与内涵。其中,歌词不仅包含着语义信息,还可以作为音频信号的旋律、结构和节奏特性的载体,
在半导体材料,天体物理,理论物理等领域,许多问题都可以归结为非线性退化方程问题。对具有应用背景的退化的非线性偏微分方程是当今研究的焦点和热点。本文主要研究了一类非线性退化椭圆和抛物方程解的存在性与正则性,全文安排如下:第一章主要介绍关于这类非线性退化方程的背景和研究现状,简要介绍本文的主要工作。第二章简要给出本文所涉及的一些基本空间和重要不等式。第三章主要研究下列具有低阶项的非线性退化椭圆方程:此
医疗信息物理融合系统(Medical Cyber-Physical Systems,MCPS)是以保障生命安全为重要前提的网络化、智能化的医疗系统。MCPS中的医疗数据由采集得到的患者的身体参数数据和患者的医疗就诊记录数据组成,是一个典型的大数据系统,传统的MCPS数据库采用集中式的数据存储结构,将全部数据存储于一个中心数据库中,一旦中心数据库遭到入侵,所有数据将面临严重的威胁,而区块链(Bloc
近年来,推荐系统广泛应用于众多商业网站,不仅方便了用户对信息的检索,提升了用户的体验,还为企业创造了巨额的利润。在众多推荐算法中,协同过滤是当前最为主流的算法。尽管协同过滤算法在推荐系统中效果较好,但是仍存在着数据稀疏、算法可扩展性差以及冷启动等问题。因此,本文将研究推荐系统中的协同过滤算法,并针对该算法存在的问题提出一些解决方案。具体工作如下:(1)提出一种基于偏好模型和类别属性的协同过滤算法P
学位
随着计算机和传感器技术的快速发展,机器人的种类也从一开始一些完成简单任务的工业机器人,延伸到农业、医疗、教育、航空航天等领域。机器人技术蓬勃发展的同时,如何实现机器人的精准实时定位和导航也成为机器人研发的热点问题之一。同步定位与地图构建(SLAM)方法在解决机器人定位难、精度差和传感器要求高等问题上有特殊意义。本文在传感器的选择、传感器的融合技术、地图构建和导航算法做出对比分析,提高机器人定位导航
实例分割是计算机视觉领域的一项新兴的综合型任务,这一综合性任务同时涉及了图像分类、物体检测和语义分割三个子任务。实例分割是自动驾驶、三维重建等工作的底层任务,在工业界有很好的应用前景,受到众多学者和工业界人士的关注。近年来,伴随着深度学习的发展,实例分割从无到有,逐渐发展分化为两步式方法与一步式方法。当前实例分割普遍存在分割掩膜不精细、定位检测框无法包含完整物体等问题。本文针对上述的两个关键问题,
滑动轴承因为其良好的抗震耐磨性、易拆装性、承载力大、工作转速高等优点,所以被广泛应用在汽车、核能、航空航天、工程机械等各个重要领域。而确保滑动轴承稳定,平稳的工作则是设计的关键。所以轴承的工作特性研究一直是它正常运转的焦点问题。目前有许多文献研究了制造加工误差对滑动轴承系统工作特性的影响,但是有关粗糙度误差对于滑动轴承系统工作特性的研究还有待深入。本文主要针对滑动轴承轴颈存在粗糙度误差对轴承系统运