基于深度学习的蛋白质分类预测方法研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:guangtoucx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是基因表达的产物,是生命中的基本元素,具有维持生物体生命活动的重要作用,这使得蛋白质组学成为后基因组时代生命科学中重要的研究领域。准确预测蛋白质,对蛋白质进行精准分类,对研究其结构及功能具有重要的意义。随着后基因组时代的发展,蛋白质数据激增,通过传统的生物实验的方法确定蛋白质类别耗时费力。因此,开发一种利用理论方法与计算技术预测蛋白质的方法是非常有必要的。本论文主要基于深度学习算法,研究两类与疾病相关的蛋白质:网格蛋白与DNA结合蛋白,并分别创建了两种蛋白质的预测模型,对其进行在线识别分析。本文具体内容如下:1、基于混合深度学习模型的网格蛋白预测。网格蛋白是一种连接蛋白,由网格蛋白介导的内吞作用在生命活动中及其重要。此外,网格蛋白的缺失还影响着许多重大疾病的发生。因此,识别网格蛋白对维持生命体的健康具有重要意义。在此,我们使用网格蛋白的原始序列信息,利用氨基酸物理化学性质分组进行特征编码,引入卷积神经网络及长短时记忆神经网络,构建一个混合预测模型Deep CLA。交叉验证和独立测试的结果表明,利用混合深度模型可以有效提升预测性能,同时与现有的预测工具性能相比,Deep CLA预测性能更优越。这也为之后进行更深层次分析网格蛋白的结构与功能提供了线索。2、基于深度残差网络的DNA结合蛋白预测。DNA结合蛋白主要作用是与DNA结合并影响着人体内DNA转录、复制和选择性剪接等多种生物过程。我们收集了所有的DNA结合蛋白数据,基于K空间氨基酸对组成对蛋白质序列进行编码,以便模型可以提取有效的特征,并引入深度残差网络中的残差块构建了一个新的模型Deep-DBPNet。通过实验结果分析并与之前的预测工具比较,该模型进一步提高了DNA结合蛋白的分类效果。
其他文献
图像配准是建立同一场景的图像之间的对应关系,在计算机视觉、医学图像处理、材料力学以及遥感等领域有广泛应用。单应矩阵估计是图像配准任务中的关键问题。由于实际成像系统存在几何畸变,线性仿射变换模型不准确,匹配对点坐标构成的是矛盾方程,因此传统方法对于单应矩阵估计并不可靠。深度学习提取大样本的内在规律和多尺度高维特征,通过数据驱动的方式拟合出更可靠的估计模型。在图像配准任务中,光照变化、实际数据缺少标签
伴随社会的高速发展,对能源的需求也是与日俱增。化石能源的消耗,导致的空气污染、温室效应和能源匮乏等问题不得不引起人们的重视。另外,中国争取在2060年前实现碳中和的目标,对于清洁能源的使用提出了更高的要求。风作为一种清洁可再生能源,对风速进行精准预测对于提高风力发电效率,指导农业生产和保障大型比赛现场等具有重要意义。本文首先分析了某气象站2017年24个观测点全年的3小时间隔历史气象数据,对气象数
伴随着现代遥感科学技术的不断完善与发展,卫星所获取的影像数据的空间、时间和光谱分辨率也在不断提高,为我国农业、水域等领域提供了数据支撑。然而,目前单一卫星传感器获取的影像数据无法同时兼顾高空间分辨率和高时间分辨率。因此,国内外学者提出了许多遥感图像时空融合方法,来生成同时具有高空间分辨率与高时间分辨率的遥感图像。本文基于深度学习的理论,对遥感图像时空融合问题进行研究,内容如下:(1)本文中将现有的
远程庭审依托网络视频技术,具有突破时空限制的优势,与重大疫情防控期间刑事案件审理与秩序维护需要相契合。从实践来看,远程庭审运行潜藏多重风险,技术性要素欠缺与庭审规范化要求相背离,程序规范阙如使其与权利保障要求存在张力,线上审理形式对庭审实质化有所冲击,从而对社会审判需求呈弱回应性。为弥补社会需求旺盛而远程庭审制度供给不足之间的矛盾,应提升远程庭审对信息化技术的适应力,以权利保障与庭审实质化为着力点
随着大数据时代的到来和人工智能技术的飞速发展,预测模型的研究已成为人工智能领域的一个重要分支,现已被广泛应用于智慧工业、智慧医疗、智慧金融等多个领域。近年来,基于机器学习算法的智能预测已开始应用于自然灾害监测、工业数据预警、医疗辅助诊断等领域,并取得了良好的效果。传统机器学习模型存在特征提取不充分、泛化能力不足等问题,从而导致模型的预测性能不佳。以深度学习算法为代表的深度神经网络凭借其高效的深层特
随着互联网的飞速发展,信息过载的问题日渐突出,推荐系统是为解决信息过载而提出的一种解决方案,它从海量信息中筛选出符合目标用户兴趣偏好的那一部分。而评分预测任务是推荐系统中最主要的任务之一,准确预测用户对未知物品的评分,才能达到更好的推荐效果。为了解决推荐系统中的任务,人们提出了许多种推荐算法,这些算法或利用不同的数据、或采取不同的方式分析数据,分为不同种类。本文的工作围绕推荐系统中的评分预测任务。
作为一种光学微结构,微透镜阵列已被广泛应用于通讯、照明、成像等领域,超精密加工技术是当前创成微透镜阵列的主要方法之一。近年来国内外许多研究机构对微透镜阵列的结构设计、加工工艺等做了研究,但针对超精密加工对刀误差对微透镜阵列创成的影响研究却存在不足。本研究从分析对刀误差产生的原因入手,设计了新型超精密车铣加工对刀方法;建立对刀误差对微透镜阵列创成的影响模型,并通过实验验证。主要研究内容如下:1)面向
方面级情感分析更细粒度,能分类出一段文本中不同方面的情感极性,它的关键点在于如何根据文本中给定方面表示出与上下文间的隐式关系。基于注意力机制的方法可以很好的关注到文本中方面的重要性,深度学习方法可以自主学习提取特征,在特征表达上表现更好。为了更有效的提取文本的情感特征信息以增强分类效果,本文针对用户评论文本进行了基于深度学习的方面级情感分析研究,主要工作如下:(1)提出了基于多注意力机制的混合神经
在一体化实现快速发展的同时,长三角区域污染防治形势依然严峻,加快构建长三角区域污染防治一体化发展协作机制迫在眉睫。协调沪苏浙皖污染"联防共治"是一项长期而艰巨的系统工程。应立足长三角大气、水等污染防治的现状,针对区域污染防治困境,从协作治理角度完善长三角污染防治协作机制,探寻源头防控、统筹协作、强化制度、协同推进的污染防治"共保联治"新路径,推动长三角污染防治协作取得更大成效。
如今以自然语言回答为特点的自动问答系统已经成为服务人类的重要的人机交互方式。非完备信息博弈游戏如竞技麻将,有着巨大的玩家基础,玩家在进行博弈游戏的时候,需要事先了解大量的博弈知识,玩家在互联网上进行搜索,却无法快速得到准确的知识。针对这一问题,本文对非完备信息博弈领域的自动问答系统进行研究,构建了融入深度学习技术的非完备信息博弈问答系统。旨在满足玩家的学习需求,起到辅助决策的作用,提升玩家的博弈游