基于多模态表示学习的药物相互作用预测研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:YNiit562552379
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
药物-药物相互作用(Drug-Drug Interaction,DDI)是指同时或先后服用两种以上药物时,其中一种药物使另一种药物的药理效应发生改变的现象。尽管同时使用多种药物通常会提高治疗效果,但某些组合会出现不需要的DDI,从而导致意料之外的不良药物反应(Adverse Drug Reaction,ADR)。作为一种特殊类型的不良反应,ADR不仅会影响患者的健康,严重情况下甚至会导致死亡。及早地发现和识别DDI能有效防止医疗事故的产生,值得患者、临床医生和医学研究人员关注。随着数据的不断增多,如何从大量复杂多模态数据中更加精准有效地捕捉药物关键特征,以及如何建立一个适应力强、准确度高的模型,仍是一个值得研究的问题。本文针对两类药物相互作用预测展开研究,一类是小分子药物(Small Molecule Drug,SMD)相互作用预测,另一类是SMD和生物制药(Biotech Drug,Bio D)相互作用预测。传统的SMD相互作用预测仅仅是将不同的特征向量进行拼接,而没有考虑特征之间的深层次交互信息和冗余信息。针对这一问题,本文提出了一种基于特征重构和多维注意力机制的DDI预测方法FM-DDI,有效地提取不同模态之间的交互信息并去除冗余,以用于SMD相互作用预测。此外,随着Bio D的发现,由于SMD和Bio D之间的异构性,无法使用传统的DDI预测方法对SMD和Bio D两种类型药物之间的相互作用进行预测。针对这一问题,本文提出了一种基于多模态表示学习的DDI预测方法Multi-SBI,有效地融合异构数据中的复杂信息,以用于SMD和Bio D相互作用预测。论文主要的研究内容和创新点具体如下:(一)提出了一种基于特征重构和多维注意力机制的深度学习方法FM-DDI,用于小分子药物(SMD)相互作用预测。模型首先输入多种药物亚结构特征,并加以组合以减少由单一类型亚结构表示引起的信息缺失。其次,特征重构从异构数据源(药物分子指纹和关联信息)中提取维度低、信息量丰富的药物特征。最后,基于多维注意力机制的深度神经网络模型赋予关键特征维度较高注意力权重,从而有效地捕捉关键信息。与几种最先进的药物相互作用预测方法相比,FM-DDI实现了显著的性能改进。在精神类疾病药物的案例研究中,FM-DDI预测的具有最高置信度的10个DDI中有7个在最新版Drug Bank中得到了验证,进一步证明了FM-DDI提取和学习药物特征以预测SMD相互作用的有效性。(二)提出了一种基于多模态表示学习的深度学习方法Multi-SBI,用于小分子药物(SMD)和生物制药(Bio D)的相互作用预测。考虑到SMD和Bio D之间的异质结构和复杂网络关系,模型首先使用多模态特征来充分表示小分子药物和生物制药的结构信息和网络关联。其次,引入了一种基于正样本无标记学习的欠采样方法PU-sampling,从无标签数据集中获取高置信度的负样本。最后,应用深度神经网络进行药物相互作用预测。实验结果表明,多模态表示学习可以更全面地表示异构药物中的药物特征,PU-sampling可以有效去除未标记样本中的噪声,并且Multi-SBI的性能显著优于其他先进的相互作用预测方法。在对Drug Bank 5.1.0的回顾性分析中,具有最高置信度的20个预测结果中有14个在最新版本的Drug Bank中得到验证,进一步证明了Multi-SBI通过学习药物复杂多模态特征以预测SMD和Bio D相互作用的有效性。
其他文献
越来越多的会计师事务所在执业时大量利用信息技术,这不仅提高了审计效率,还影响了审计师的职业道德决策过程。本文探讨了审计信息化程度对道德强度与道德决策模型间关系的影响。研究表明,审计信息化程度可以调增道德强度和道德认识以及道德强度和道德判断之间的关系,而未调节道德强度与道德意图间的关系。分组检验发现,在更爱惜声誉的四大会计师事务所组、40岁以下审计师组、项目经理及合伙人组中,审计信息化程度又进一步显
期刊
报纸
氨基酸作为构成蛋白质的要素在生物及化学领域具有广泛的研究价值。解析氨基酸的结构和功能是人们能够理解并探寻地球生命早期起源的重要途径之一。在研究中,对氨基酸低聚物的结构功能关系的全面表征是有必要的,而这离不开光谱学技术的应用。分子的组织结构性能通常取决于其内部的特异性和非特异性相互作用的组合,比如共价键、离子键、范德华力、氢键等。对于弱相互作用,尤其是氢键的相互作用的研究,对于量子化学建模而言通常更
学位
通过计算机模拟光波的干涉、衍射过程得到的全息图被称为计算全息图,其不仅可以完整记录和再现光波的振幅和相位,而且还具有低噪声和高再现性的优点。与传统的光学全息相比,它还可以生成虚拟物体的全息图。由于相位调制的光学效率较高,在大多数情况下,纯相位型全息图是全息显示的一个更好的选择。然而,传统的基于迭代优化的相位型全息图生成算法在计算速度和图像精度之间的内在的权衡限制了计算全息图在实时显示方面的应用。近
学位
歌舞片是好莱坞类型电影的重要组成部分,具有区别于其它类型的独特范式、艺术形式和审美风格。在经历了诞生初期、快速发展及成熟期、“再次探索”等阶段后,好莱坞歌舞片于新世纪开启了新一轮创作热潮。而芭蕾因其独特的形式美感和浪漫色彩受到歌舞片的青睐,曾作为好莱坞歌舞片的主要舞蹈元素之一被使用,但其叙事性未被充分挖掘,也未对类型范式产生较深影响,更多是作为丰富歌舞表达的众多艺术形式之一,并于上世纪60年代受到
学位
<正> 笔者于1963年10月治疗一例中风患者时,发現足太阴脾經的隐白穴,对下肢瘫痪有較好效果。茲将初步經驗介紹于下,以供参考。王××,女,35岁,家庭妇女,住院号:63807。患者于妊娠期素有头昏、目眩,于1963年9月20日上午入院,早产一死嬰。随之出現抽
期刊
近年来学术领域的研究得到了各方支持,大量的研究成果不断涌现,快速有效地对学术资源进行分类显得尤为重要。然而相较于一般的独立文本分析,学术资源具有信息来源广泛,信息发布自由以及种类繁多的特点。而知识图谱可以统一不同数据来源的结构,能有效的整合资源,对信息进行组织和管理。本文在构建图谱时不仅仅考虑科研成果的语义信息,并且对图谱中的关系信息进行挖掘。从分类的角度出发,本文提出了基于图注意力的学术资源分类
学位
二维过渡金属磷硫化合物CoPX3(X=S,Se),作为一种低维磁性半导体材料,其独特的平面结构、性能以及潜在的器件应用价值,使得它们有望在未来成为自旋电子器件的重要组成部分。由于磁涨落效应和电子自旋的稳定性会随维数的降低而增大,因此在正常的环境条件下,该材料具有良好的稳定性。基于密度泛函理论(DFT)和蒙特卡洛模拟(MCs),本文主要研究了二维CoPS3和CoPSe3的基态结构、电子结构、磁学性质
学位
能源是影响人类社会发展的关键问题,氢气作为一种高效、环保、无污染的能源具有巨大的优势。通过选取合适的光电极材料,可以利用可再生的太阳能实现光电化学(PEC)分解水制氢,这是当前国内外的研究热点。碲锌镉(CdZnTe)是一种性能优异的II-VI族直接带隙化合物半导体,由于其理想的光学带隙、良好的电荷输运特性、低漏电流、低噪声等特性,使其在高能辐射探测器、太阳能电池、光电化学(PEC)分解水制氢等领域
学位
2019年12月以来,新型冠状病毒肺炎(Corona Virus Disease 2019,COVID-19)在全球的爆发,对日常生活造成了严重的影响。计算机断层扫描(Computed Tomography,CT)结果是COVID-19诊断的重要依据之一,已被纳入国家诊断标准。在实际诊断流程中,医生首先对病灶区域大致分割,再根据病灶内部特征进行诊断,对应于医学图像处理中的病灶分割和疾病分类任务。基
学位