【摘 要】
:
作为RNA甲基化最丰富修饰物之一,N6-甲基腺苷(N6-methyladenosine,m6A)的甲基化作用实际上涉及到许多生物过程,包括大脑发育畸形、人体肥胖、蛋白质翻译、RNA剪接、RNA降解和RNA稳定性。目前研究表明,采用高通量测序或者湿实验的方式可以检测m6A峰值的情况。然而该方式不能够准确定位m6A甲基化位点。而随着人工智能时代的来临,人们开始探寻使用机器学习的方式识别m6A甲基化位点
论文部分内容阅读
作为RNA甲基化最丰富修饰物之一,N6-甲基腺苷(N6-methyladenosine,m6A)的甲基化作用实际上涉及到许多生物过程,包括大脑发育畸形、人体肥胖、蛋白质翻译、RNA剪接、RNA降解和RNA稳定性。目前研究表明,采用高通量测序或者湿实验的方式可以检测m6A峰值的情况。然而该方式不能够准确定位m6A甲基化位点。而随着人工智能时代的来临,人们开始探寻使用机器学习的方式识别m6A甲基化位点。本文提出和构建两种对于不同方向的基于RNA序列的m6A甲基化位点识别的预测器。分别是基于集成学习的m6A甲基化位点识别研究和基于多物种数据集的m6A甲基化位点识别研究。在基于集成学习的m6A甲基化位点识别研究中,本文使用名为M6APred-EL的预测器。本文采用和修改了三种方向差异性较大的特征表征方式,分别为理化信息、化学结构信息和位置特异性信息。三种特征提取方式分别为全局位置特异性的多核苷酸频率估计、化学结构属性和局部位置特异性的特征提取,基于理化属性的二核苷酸信息表提取。值得一提的是基于全局位置特异性的多核苷酸频率估计在本研究中针对多核苷酸值选取做了对比实验,且在文章中证实了当多核苷酸值为1时效果较为理想,因此采用全局位置特异性的多核苷酸频率估计作为三个基分类器的特征提取方式之一。最终得到的M6APred-EL预测器,所采用的方式为三种基分类器(分别对应三种特征提取方式)的多数投票法后的集成模型。结果显示,相较于最新的研究成果,在准确率和马修斯相关系数评估指标上,M6APred-EL提出的方法超过了1.18%和0.03的指标值。在基于多物种数据集的RNA序列的m6A甲基化位点识别研究中,本文提出和构建了一个基于RNA序列的预测器,名为M6AMRFS。采用二核苷酸二进制编码和二核苷酸累计位置频率统计的方式进行特征提取,之后采用F分数(Fscore)的方式进行特征选择,再将数据输入极限梯度提升(Extreme Gradient Boosting,XGBoost)算法中训练得到最终的分类器模型。通过多种对比实验,包括分类器对比实验、特征选择与非特征选择对比实验、最新特征提取算法对比实验和最新预测器对比实验,可发现M6AMRFS预测器能够在多数据集上获得良好的评估结果,优于或等价于至今为止最新的研究成果。
其他文献
汽车模具复杂曲面的抛光与打磨工作,一直以来都是由技术工人手工完成。模具表面加工的质量好坏完全取决于工人的技术水平,这就会导致生产率低下、加工质量不稳定等问题,难以满足当今工业发展对模具低成本、短周期、高质量等生产工艺的要求。因此,模具抛光的工作迫切需要自动化设备来替代人工。随着工业机器人技术的发展,机器人在自动化抛光复杂曲面的应用研究越来越得到重视。传统的机器人示教再现的方法有很大的局限性,单纯的
教学实践中,我们常发现教师的教学起点有时过高,有时过低,导致学生对学习不是一脸茫然,就是觉得索然无趣。以教材为教学起点,是找准学生学习最近发展区的正确、便捷的途径。为什么要以教材为起点?怎样来操作?笔者有如下观察与思考。一、依据教材确定教学目标,落实教材编写意图每一课内容都是教材系统中的一个结、一个点,它蕴含着特定的语文要素,担负着教材编者赋予的编写意图。编者在充分考虑课文所在位置、作用,课
随着“中国制造2025”的提出,“高档数控机床和机器人”成为制造强国战略的重点领域之一。由于协作机器人相比传统工业机器人具备非结构环境下的适应能力,因此成为机器人研究的热点。本文以实验室自主研发的6轴“不锐”协作机器人为对象,重点对机器人在非结构化环境中执行任务时轨迹在线规划方法进行研究,使机器人能够在速度峰值最优或加速度峰值最优的条件下改变当前运动状态。该研究成果能够有效提高协作机器人对非结构化
灰度图像彩色化是图像处理领域的重要研究方向,在医学诊断、工业检测和军事侦查等方面具有重要的应用价值。传统的灰度图像彩色化方法需要人为干预,难以高效、批量、自动地实现彩色化。随着深度学习尤其是卷积神经网络的蓬勃发展,基于卷积神经网络的灰度图像彩色化方法成为彩色化研究的热点。为了解决传统灰度图像彩色化方法存在的缺陷,本文提出基于卷积神经网络的灰度图像彩色化方法,以实现灰度图像自动彩色化。此外,为了提升
喷涂机器人作为一个机器人行业的分支,在众多高污染高危险环境中代替了人力,随着人工成本的增加,喷涂机器人在今后时代中的地位会越来越重要。目前由于制造业的发展,各种各样的工件需要被加工,原有的喷涂模型已经不能够满足现有的要求,因此,将新的数学方法应用于机器人的喷涂领域,有着强大的经济效益和社会效益。在服装喷涂领域这一细分市场,由于服装喷涂的工艺复杂,导致喷涂机器人在这一领域应用受限,目前为止大量的服装
目前,我国浮式油气生产储卸装置的研发与应用尚处于初级阶段,在核心模块的设计、布局、建造和安装技术上与国外还存在一定差距。同时,工业水平以及科学技术的提高,浮式油气生产储卸装置上的设备也不断进行升级,且随着对环境保护意识的提高,大多数对海洋进行开发的国家要求加强对海洋环境的保护以及其他功能的增加,使得浮式油气生产储卸装置上的设备越来越多,于是各国的浮式油气生产储卸装置厂商都在将其模块化。模块增多,权
喷涂机器人在灵活性、喷涂质量、喷涂效率以及涂料利用率方面都具有很大的优势,在汽车涂装领域占据重要的地位。针对汽车面涂在漆膜厚度、漆膜均匀性方面的严格要求,单纯的考虑静态力下的结构优化设计不能很好的满足喷涂工艺的要求。为了进一步的提高轨迹精度与喷涂质量,有必要将喷涂过程中动态力对末端变形的影响考虑在内,对喷涂机器人本体结构进行动态力作用下的结构拓扑优化设计。本文以自主研发的7R 6-DOF喷涂机器人
在核设施、石油天然气、电力等领域中,管道应用比较广泛,同时管道安全对生产的正常运营起着非常重要的作用。随着管道的布置以及应用的环境的复杂程度不断的提高,对管道机器人的结构和完成的功能也提出了更高的要求。本论文针对实际运用过程中复杂核电管道系统,该管道系统中有锐角弯、直角弯、钝角弯和T型弯,其中管道环境的空间布置,不仅有水平管路还有很多垂直管路。其中最难的部分是设计管道机器人的结构能够通过直角过渡的
近年来,分布式光纤传感技术的深入研究不断取得了进步,基于Michelson分布式振动光纤传感技术的光纤周界安防系统日趋完善,在诸多周界安防领域具有较为广泛的发展空间。但是目前该类安防系统在对入侵事件种类识别、识别准确率以及事件信号特征向量提取效率方面尚无法完全满足实际需求。针对上述模式识别方面的根本问题,本文基于分布式振动传感技术,简要介绍光纤周界安防系统现状,在分析对比不同安防系统优劣特性的基础
扭矩是工业生产和机械传动中重要的载荷形式,在船舶、航天、工农业等领域都有重要应用。本文主要介绍了基于磁弹式传感器传感机理及研究动态,使用磁致伸缩性能良好的坡莫合金薄带作为磁敏材料与非磁性轴结合,实现非铁磁性轴的扭矩测量。提出基于平面柔性线圈涡流耦合的扭矩测量方案,该测量方案不同于传统互感线圈(励磁—感应)电压表征扭矩的方法,而是采用平面线圈的电感量表征扭矩,通过线圈与涡流的耦合传感磁导率的变化,为