基于多视角多标签学习的RNA结合蛋白识别方法研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:lixjiea875623
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
RNA结合蛋白(RBP)是一类伴随RNA调控代谢过程,且与RNA结合的蛋白质的总称。一种RBP可能存在多种靶标RNA,其表达缺陷会造成多种疾病。通过寻找功能结构相似的RBP可以为治疗癌症等疾病的RNA疗法提供帮助。在RBP识别的过程中,一个关键的步骤是获取RNA有效特征和使用RBP之间的结合相似性网络来学习它们之间的联系。本文针对上述描述的RBP识别提出了两个多视角多标签特征学习的新策略,较已有的RNA序列特征提取和RBP识别方法,本文所提算法在效果上的表现都有显著提升。如下为本文基于RNA序列识别RBP的两个主要工作:1)第一个工作是提出了一种基于深度特征学习的多视角多标签RBP识别算法。该算法首先将RNA序列转化为氨基酸序列和二肽成分,使用one-hot编码和统计技术构造初始多视角特征。然后使用卷积神经网络从中提取维度小,辨识度高的多视角深度特征;进一步使用基于投票机制的CC多标签分类器对上游所获取的多视角深度特征进行分类模型构建。实验研究表明,使用卷积神经网络提取到的三个视角深度特征,其分类精度与传统的SVM,BP神经网络和决策树特征提取方法相比高17%以上;使用多视角深度特征识别算法的分类效果较单视角深度特征比平均高5%以上;加入多标签学习算法后,平均精度提升3%以上。2)第二个工作是以CC多标签学习算法为基础,提出了一种在多视角场景下的多标签学习CC算法,其在原先工作的基础上,增加了RNA语义视角,改进二肽视角为多间隙二肽视角,同时摒弃了多标签学习之后的投票机制,改用多标签特征学习算法,来将多视角特征学习和多标签学习衔接融合起来,既保留了多视角深度特征的辨识度,又提升了CC多标签分类器对每个标签的学习能力。实验结果表明,两种新视角的深度特征分类精度较传统特征提取方法相比平均高出23%以上;多标签特征学习技术相比投票机制的集成学习,预测效果高5%以上。
其他文献
人体行为识别是人工智能、模式识别以及机器学习等领域中最重要的研究方向之一,是计算机视觉和多媒体分析领域的热点研究课题,在安全监控、人机交互、医疗诊断、视频分类等领域都有着重要的学术意义和巨大的应用价值。虽然人体行为识别方法在早期的研究过程中已经取得了较大的进步,但是在实际应用中人体行为识别数据常受到光照变化、复杂背景、遮挡和人体自身等因素的影响。这使得人体行为识别研究始终是十分具有挑战性的课题。现
近年来,随着人工智能与机器视觉技术飞速发展,行人检测和跟踪技术因其具有重要的学术研究价值和商业价值,受到人们广泛关注,基于检测的目标跟踪算法逐渐成为研究的热点,其中检测器的性能对算法最终的跟踪性能起着至关重要的作用。论文沿用基于检测的跟踪框架,对基于卷积神经网络的行人检测与跟踪算法进行了深入研究,主要研究内容如下:在行人检测方面,针对目前行人检测过程中漏检率高和检测速率慢的问题,在YOLOv3算法
随着网络通信技术的日益成熟、网络规模的不断扩大,网络安全具有越来越重要的意义。网络流量数据的异常检测和分类成了维护网络安全的一种重要手段,近年来受到越来越多的关注和研究。但目前网络流量数据异常检测和分类的研究中存在着数据量大、数据分布不平衡、传统的异常检测和分类方法准确度较低等问题。自编码器是深度学习领域中重要的神经网络,由于其出色的特征提取能力而被广泛研究用于数据的异常检测和分类领域,本文主要针
迭代学习控制广泛应用于具有重复运动特性的被控对象的轨迹跟踪问题,其利用先前批次的输入以及误差信息,不断修正当前批次的输入信号,经过足够多的批次后能够实现准确跟踪。实际中被控系统一般都是非线性系统,因此,将迭代学习控制理论应用于非线性系统的跟踪控制问题具有重要研究价值。在传统的迭代学习控制研究中,学习律的增益大多是固定不可变常数,增益固定系统收敛速度一般也固定,初始参数的设定决定了系统的运行状况。变
目标跟踪是计算机视觉的重要分支之一,正随着信息科技的发展在人机交互、智能机器人、自动驾驶、国防安全、视频监控和智慧城市等领域中得到越来越多的重视和应用。尽管视觉跟踪技术在过去数十年中得到了长足的发展,但由于目标遮挡、尺度变化、外观形变以及相似物体干扰等跟踪环境因素的复杂多变,能够在多应用场景下满足对跟踪的精度、实时性和鲁棒性等需求仍是一项艰巨但有着光明前景的工作。本文基于深度学习算法模型,针对长时
在智能护理机器人领域,如何帮助机器人快速且准确地识别护理对象的动作行为已成为该领域的热点研究问题。准确识别动作行为是护理机器人实现护理智能化的先决条件,且可增强护理机器人的动态感知能力,故行为识别技术是护理机器人实现智能化的重要组成部分。基于深度学习的行为识别技术具有建模过程简便且训练模型容易的优点已逐渐成为行为识别技术的发展趋势,但基于深度学习的行为识别技术在识别准确率、泛化能力及收敛速度等方面
随着人类生产生活方式的不断更新变化,人们开始更加注重自身的健康问题以及生存环境的安全问题,特别是对各种有可能危害健康和破坏大气环境的有毒有害气体的加以关注。气体传感器作为一种能够监测各种气体浓度和成分的装置已经被广泛应用于众多场景,也吸引了更多人的目光。因金属氧化物半导体式气体传感器自身拥有的一系列优势,例如性能相对较好、器件结构简单以及性价比高等,而成为了许多研究人员争相报道的对象。很多时候人们
近年来,随着科技的不断进步发展,移动机器人相关技术已逐步在人类实际生活与生产过程中发挥重要作用,相关行业领域对于移动机器人的性能需求也愈发迫切。自主位姿估计与运动控制作为移动机器人在未知环境中完成工作任务的技术基础,近些年来引起了国内外学者的广泛关注。针对移动机器人在复杂环境下的实际功能需求,本文利用单目视觉、IMU与轮式里程计实时传感信息,进行移动机器人多传感信息融合位姿估计与速度控制研究。首先
经济社会的发展和生产力的提高促使机器人的应用越来越广泛,随着传感器技术的进步,机器人系统拥有了更加强大的探测和感知能力,大大推动了机器人应用技术的发展。但当前大部分的移动机器人在进行自主导航的过程中,其数据源严重依赖于单一传感器,且存在总线协议不统一、实时性差、应用较为复杂等问题。因此本课题基于ROS平台和EtherCAT通讯技术,将轮式里程计、激光雷达和深度相机等传感器进行融合,搭建了一个能够完
Takagi-Sugeno-Kang(TSK)模糊系统的特点是能使用线性模型的方法求解非线性模型。TSK模糊系统的这个特点使得其在众多的领域都受到了广泛的关注。但是,与其它有监督学习一样,TSK模糊系统需要充足的信息。然而,在真实世界的应用中,训练数据经常是有限的,而模型也不能充分的挖掘数据中的信息,因此很容易导致过拟合问题。现有的TSK模糊系统方法,更多的把目光放在了模型结构的研究上,忽视了实际