基于深度神经网络的RNA-蛋白质相互作用预测方法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:chen3712331
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质和RNA分子的相互作用在许多细胞过程中起着重要作用,例如基因表达,转录和翻译。它们之间的相互作用需要先确定哪些蛋白质可以与RNA结合,即确定RNA结合蛋白;其次,该RNA结合蛋白的特定残基将与RNA的特定核苷酸相结合以执行其细胞功能,如果结合错误或失败,那么可能会导致生物细胞功能紊乱,进而引起各种生物遗传疾病。对于RNA-蛋白质相互作用的研究,高通量技术的全基因组预测方法虽然准确性非常高,但它们仍然非常耗时且成本高昂。幸运的是,高通量技术生成的数据可以作为算法模型的训练数据,以揭示RNA-蛋白质的绑定模式。鉴于RNA-蛋白质相互作用预测在生物学上的重要性,本文基于深度神经网络对RNA-蛋白质相互作用预测方法进行研究,主要工作包括以下两点:1.RNA结合蛋白的预测。本文提出了一种预测RNA结合蛋白的新方法,即Deep Bto D。首先,它设计了一个k-Bto D编码,该编码考虑到了k-核苷酸的组成信息及其相对位置信息,并形成了一个局部模块。其次,它设计了一个嵌入注意力机制的多尺度卷积模块,即ms-focus CNN,用于进一步学习更有效、更多样、更具有鉴别力的高级特征。最后,全局信息被认为是对局部模块的补充,通过集成学习整合两个独立模块。该方法分别在两个数据集上进行训练和测试,结果表明整合k-Bto D编码的局部信息和RNA序列的全局信息,是一个可以高度识别RNA结合蛋白的强有力的鉴别方法。2.RNA-蛋白质相互作用核苷酸位点的预测。本文提出了一种方法DFpin来预测RNA中与蛋白质相互作用的核苷酸。首先,为了保留更多的关键性核苷酸位点,本文重点设计基于特征相似性的去冗余方法,即根据RNA单核苷酸组成去除特征冗余数据,保持RNA样本多样性的同时避免冗余数据的残留。此外,为了提取关键的抽象特征并避免过度拟合,本文使用深度森林模型的级联结构来预测蛋白质相互作用的核苷酸。本文分别在三个数据集上对DFpin预测方法进行训练和测试,结果表明该方法表现出优秀的分类能力,同时展示了基于特征相似性的冗余去除和深度森林对于提高预测蛋白质相互作用核苷酸精确度的重要性。
其他文献
RGBT视觉跟踪旨在结合可见光(RGB)和热红外(Thermal)模态的互补优势实现鲁棒的视觉跟踪,是计算机视觉领域中的一个热点研究课题。近几年,基于深度学习的RGBT跟踪方法取得了一定的进展,根据融合方法的不同主要可以分为以下两种类别。一类方法旨在探索融合模态特定表示和模态共享表示。另一类方法旨在利用注意力机制预测模态权重,实现不同模态的自适应融合。虽然这些方法都取得了不错的性能,但是忽略了多模
学位
作为公共图书馆向家长和孩子们展示的一张名片,少儿阅读推广活动品牌在一定程度上代表着图书馆的整体形象,同时还搭载了图书馆面向少儿群体推行的阅读推广服务的内涵和价值。因此公共图书馆开展少儿阅读推广活动品牌化能够利用品牌效应有效提升公共图书馆本身的社会影响力和知名度。但是总体来看,目前我国对于公共图书馆少儿阅读推广活动品牌化的相关研究文献数量较少,且大多都是集中于某个具体案例的研究,缺乏对活动品牌化实践
学位
零样本学习是计算机视觉和迁移学习领域的一个重要的研究课题。零样本学习的任务是依据一些已知类别的图像数据,然后辅以相关的先验信息,进而学习出一个泛化能力强大的模型来实现对未知类别的图像样本的分类。尽管研究者们提出了许多方法来解决零样本学习问题,但是它仍然是一个具有挑战性的课题。近些年来,基于图卷积网络模型的零样本学习方法在零样本学习领域取得了优异的性能。这些方法的主流思路是利用图卷积网络模型来对不同
学位
多视图的表示学习旨在利用来自不同角度或不同数据源的特征学习数据的表示。对于图结构数据,多图学习的目的是通过多个图结构数据的协同学习,挖掘多个视图间的互补信息。近年来,图神经网络(Graph Neural Networks,GNNs)在图结构数据的表示学习方面取得了巨大的成功。现有的图神经网络模型通常可以分为图卷积网络、图注意力网络、图自编码器和图生成网络等。然而,许多传统的图神经网络模型利用固定的
学位
车辆路径问题广泛存在于生活中的诸多方面,如街道垃圾清理、物流配送、集装箱码头堆场作业等。作为求解车辆路径问题的常见方法,元启发式算法可以在合理的时间内获得一个较好的路径方案。然而,随着问题规模的增加,已有元启发式方法往往会出现效果变差、耗时变得不可接受等问题,因此如何提高元启发式算法处理大规模车辆路径问题的能力是一个具有挑战的问题。此外,由于不同的元启发式搜索策略在不同问题实例上往往具有不同的性能
学位
稀疏多目标优化问题(Sparse Multi-Objective Optimization Problems)由于其在机器学习、网络科学及其他许多领域都具有广泛的应用,近年来愈加受到进化计算领域的关注和研究。但现有多目标进化算法在稀疏多目标优化问题上的性能仍然有待进一步研究,目前尚没有专门针对稀疏多目标优化问题设计的性能评价指标。现有的性能评价指标仅关注算法在目标空间的收敛性和多样性而忽视了决策空
学位
深度神经网络广泛应用于许多领域,但仍然面临对抗攻击带来的风险。对抗攻击是对输入样本添加不易察觉的扰动来产生对抗样本,并欺骗神经网络将样本识别为错误的类别。为了提高深度神经网络对于对抗攻击的鲁棒性,国内外的研究者们分别从攻击和防御的角度出发进行了各种研究。在对抗攻击方面,包括密集对抗攻击和稀疏对抗攻击;在对抗防御方面,包括对抗训练和其他数据增强方法等。现有的攻击算法大多为密集对抗攻击或扰动明显的稀疏
学位
随着传感器的普及率不断提升,摄像机被布置在城市的每一个角落。摄像机网络常被用于区域监控,灾难响应,环境监控等等。在多个相机复杂场景下,可检测的视野范围更广阔,但是如何更好地利用多个相机的数据,是一个重要的问题。同时,仅通过人工检索的方式已经不能满足人们的需求。因此,需要一个能在多个相机环境下进行有效目标跟踪的算法来代替人工检索。多个相机间的目标跟踪,即利用多个摄像机协同完成对目标的跟踪过程,是目标
学位
图像分类、目标检测和语义分割是计算机视觉领域的三个基本任务。目标检测要求同时确定图片中目标的类别和位置。遥感图片中的目标具有任意的旋转方向,且目标尺寸差异较大,因此检测难度更大。本文主要研究基于单阶段检测框架与卷积区域重配准的遥感图像中的旋转物体检测算法,主要贡献如下:(1)基于卷积区域重配准的遥感单阶段目标检测研究本文提出一种由粗糙到精细的单阶段目标检测器,主要包括一个增强的特征金字塔网络、多尺
学位
数字媒体技术的日益普及,使数字信息的传输和共享更加便捷。但信息传输中存在如信息泄露、信息遭篡改等信任问题,严重威胁信息安全。因此,作为一门能够在密文信号中嵌入识别信息、无误差地提取信息并无损恢复原始信号的关键技术,密文图像可逆信息隐藏(Reversible Data Hiding in Encrypted Images,RDHEI)技术逐渐成为信息安全与多媒体处理领域的交叉研究热点。本文探究现存R
学位