基于深度网络的药物关系抽取算法研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:D159357
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
药物关系抽取(Drug-Drug Interaction Extraction,DDIE)任务主要研究如何利用自然语言处理技术从生物医学文献中自动抽取出两种药物之间存在的相互作用。DDIE任务的研究对减少药物安全事故、降低医疗成本,具有十分重要的意义。过去解决DDIE任务的主流方法是基于特征及核函数的方法,但是该类方法往往需要手动提取多种复杂的特征,费时费力。随着深度学习技术的发展,一些研究者已经成功地将深度学习技术应用于DDIE任务上,并且取得了比核函数方法更好的结果。本文尝试采用多种深度学习网络解决DDIE问题,最终提出了一种CNN-GRU方法,获得了比该领域现有方法更好的性能。现有DDIE领域的研究中,基于深度学习的方法大部分都是以词向量和距离向量作为输入,这些方法所用的模型大都结构简单,分类能力不足。针对这些问题,本文第二章提出一种改进的多层CNN网络模型。该模型仅采用Glo Ve词向量作为输入,同时模型中设置了多个卷积层,并分别为每个卷积层设置了池化层,提高了模型的分类能力。本文在DDIExtraction 2013竞赛提供的公开数据集上对所提出的模型进行了训练和评估,取得了74.9%的F值,比现有的最好结果提高了2.7%。本文第二章提出的改进的多层CNN网络模型分类能力较好,但无法很好地提取出输入文本中包含的序列信息。针对这一问题,本文第三章在现有的区域化CNN+LSTM模型基础上进行改进,提出一种BNCNN-LSTM模型以更好地解决DDIE任务。该模型结合了区域CNN网络和LSTM网络的优点,既能挖掘出每个区域内的局部特征信息,也能挖掘出区域间包含的序列信息,因此在实验中表现出了比改进的多层CNN网络模型更好的性能(F值为76.4%)。同时,本文在该模型中加入了批量正则化层,有效地加快了模型的训练速度。本文第三章提出的BNCNN-LSTM模型结构较为复杂。为了简化该模型,本文第四章尝试在BNCNN-LSTM模型上进行改进,采用结构更为简单的GRU网络替换LSTM网络,同时去掉模型中的批量正则化层,提出一种CNN-GRU模型。该模型不仅结构更为简单,同时在DDIExtraction 2013数据集上展示出了比BNCNN-LSTM模型更好的分类性能。
其他文献
以近平滑假丝酵母ATCC 7330为实验菌株,通过均质破碎、离心、双水相处理后,最终获得的近平滑假丝酵母ATCC 7330中所含的粗酮基还原酶,并同时建立了一个简单高效酶活检测方法,为酮基还原酶的获取创造了一个方便快捷的实验方案,也为此酮基还原酶的进一步相关研究奠定了坚实的实验基础。本实验研究结果如下:1.研究了近平滑假丝酵母ATCC 7330酶活的测定方法,并通过不断地改进优化,最终确定了使用均
近年来,大量学者开始关注中国文化的翻译,而中国特色词汇的翻译是其中的一个分支。文化特色词是指某种语言或某个民族中特有的词汇或表达法。而中国特色词反映的是中国博大精深的传统文化和与时俱进的社会主义先进文化。习近平主席作为国家主席和人民领袖,代表着中国形象,在治国理政实践中发表了一系列重要讲话,他的语言风格朴实平和,具有感染力和号召力。习主席演讲中的四字词、专有名词和古语等都反映了中国特色。本文以语境
锂硫电池具有理论能量密度高(2600Wh kg-1)、成本低和环境友好等优点,被认为是最有前途的储能系统之一。然而,锂硫电池仍然存在硫电子导电率低、可溶性多硫化物导致的“穿梭效应”以及硫正极的体积膨胀等问题尚待解决。因此,探究具有高容量和优异循环稳定性的锂硫电池仍是当前广大研究人员的研究热点。本文基于极性MXene(Ti_3C_2Tx)材料,将氧化石墨烯(GO)和导电聚合物分别插入MXene片层构
氯化氨基酸不仅能在体内中性粒细胞中,通过髓过氧化物酶利用过氧化氢和氯离子产生的有效氯氯化氨基酸生成;也能在体外水消毒处理过程中,通过氨基酸与含氯消毒剂生成。研究表明,氯化氨基酸本身及其代谢降解产物都具有较高的细胞毒性和遗传毒性,因此,有关氯化氨基酸及其代谢降解的研究引起了广泛关注。然而,受目前的分析检测手段所限,对于氯化氨基酸降解机制的认识还存在不足。为此,本论文运用量子化学方法,以甘氨酸、丙氨酸
我国胡萝卜种植面积和总产量均稳居世界第一,但大多数地区仍然采用人工收获与半机械化收获并存的收获方式。人工收获劳动强度大、效率低,半机械化收获存在经济成本高等问题,无法满足胡萝卜规模化收获要求。松土铲作为胡萝卜联合收获机重要部件,现有研究主要针对中耕期深松铲进行结构设计,并未结合胡萝卜生产模式及收获农艺要求研制专用松土铲,常规深松铲适应性差,影响机具作业质量及功耗。因此,亟需开展与胡萝卜收获模式相匹
超分辨率重构技术在实际应用中具有重要的意义,分辨率更高的图像能够为许多基于图像的任务提供更多发展的可能。然而在现实世界中,高分辨率的图像与视频在获取时往往受到很多其它因素的限制。因此,设计实现高效的超分辨率重构算法成为了计算机视觉领域的重要任务。目前,超分辨率重构技术根据重构对象的不同,主要分为面向单幅图像的超分辨率重构技术和面向视频的超分辨率重构技术。其中,面向单幅图像的超分辨率重构技术通过算法
近年来,随着电动汽车技术的不断成熟,加之又能缓解城市环境问题,越来越被人们所接受,但是电动汽车行驶里程也成了制约其发展的关键因素。在城市路网中存在大量的信号交叉口,如何对电动汽车进行合理的路径规划,降低能耗提升续航里程具有十分重要意义。本文针对城市信号交叉口和能耗问题对电动汽车进行路径规划,并结合不同风格驾驶员的能耗差异,对信号交叉口处电动汽车的能耗影响因素进行研究。具体研究内容如下:(1)对比分
镁离子电池负极材料的研究主要集中在镁金属和过渡金属及其合金上,其在充放电过程中存在严重的体积膨胀等问题,这使得镁离子电池存在安全隐患。低价锰基化合物电化学反应电位较高,能够避免金属镁的析出,并且具有理论比容量较高、成本低和环境友好等优势,是一种非常有研究价值和应用前景的镁离子电池负极材料。本文尝试利用Mn S、MnCl_2和MnF_2作为镁离子电池负极材料,系统地研究了电极材料的制备方法、物理化学
机载雷达具有良好的海陆空监视能力和对低空突防目标的预警能力,弹载雷达具有卓越的低空突防能力,二者都具有重要的军事应用意义。机载/弹载等高空雷达平台,当处于对海下视工
为了确保电力系统设备的安全运行,在系统运行时需要较低的接地电阻,而接地装置的冲击特性又直接关系着电力系统输电线路的防雷保护效果。输电线路杆塔接地的主要作用是在线路遭受雷击后,将雷电流在大地中扩散泄导,以保证线路具有一定的耐雷水平。一般来说,降低输电线路的冲击接地电阻是提高输电线路耐雷水平、维护电网安全稳定运行的最有效手段。因为接地装置的冲击散流特性和冲击接地电阻与接地装置在工频条件下的特性有所不同