【摘 要】
:
DNA修饰蕴含丰富的生物信息,可以调控基因表达并参与许多细胞活动。细胞内存在许多种不同的DNA修饰,DNA N4-甲基胞嘧啶(4m C)和DNA N6-甲基腺嘌呤(6m A)是两种最常见的DNA修饰位点。4m C在基因组稳定、重组和进化中扮演重要角色,6m A在生物基因组中具有重要的调控功能。随着研究的深入,传统的实验方法和机器学习方法不能满足DNA修饰位点预测的需要,寻找更加高效的预测方法成为D
论文部分内容阅读
DNA修饰蕴含丰富的生物信息,可以调控基因表达并参与许多细胞活动。细胞内存在许多种不同的DNA修饰,DNA N4-甲基胞嘧啶(4m C)和DNA N6-甲基腺嘌呤(6m A)是两种最常见的DNA修饰位点。4m C在基因组稳定、重组和进化中扮演重要角色,6m A在生物基因组中具有重要的调控功能。随着研究的深入,传统的实验方法和机器学习方法不能满足DNA修饰位点预测的需要,寻找更加高效的预测方法成为DNA修饰位点预测的研究热点。深度学习方法的应用为提高修饰位点的预测效率提供有利帮助。本文主要研究深度学习方法在DNA修饰位点预测工作中的应用,研究内容如下:1.提出一种基于门控循环单元和深度神经网络的预测DNA N4-甲基胞嘧啶位点的方法称之为i4m CGD。首先利用三核苷酸组成、核苷酸的电子-离子相互作用伪电位和位置特异性三核苷酸倾向,对DNA序列进行编码。其次融合3种向量,利用互信息方法优化融合后的特征集合。最后将最优特征子集输入到门控循环单元和深度神经网络组成的深度学习框架GRU_D中。利用10折交叉验证方法对模型进行评估。6个数据集上i4m CGD的预测准确率分别达到92.4%、91.9%、88.6%、93.7%、95.3%和97.3%。与其它先进方法相比,i4m CGD具有更优异的预测性能。2.提出一种基于双向门控循环单元和卷积神经网络的预测DNA修饰位点的方法称之为4m Ci6m A-BGC。首先基于序列信息和物理化学性质,采用二进制、K-mer核苷酸频率、伪K-元组核苷酸组成、基于二核苷酸的自协方差和mono Di KGap理论描述来提取DNA序列信息。其次,融合5种特征向量,得到高维特征空间。再次,利用弹性网进行特征选择,得到优化后的特征子集。最后,将最优特征子集输入到由双向门控循环单元和卷积神经网络组成的深度学习框架中。10折交叉验证的结果表明,基准数据集上的预测精度明显优于现有的预测方法,预测准确率分别达到97.1%、95.9%、96.1%、98.7%、97.7%和99.6%。同时,使用独立的数据集水稻和拟南芥进一步验证4m Ci6m A-BGC的预测能力。对比显示,与现有的预测方法相比,4m Ci6m A-BGC的预测性能最佳,预测准确率分别达到98.2%和89.0%。结果表明4m Ci6m A-BGC是一种有效的识别DNA修饰位点的方法。
其他文献
随着现代工程控制技术的迅速发展,人们对被控系统性能提出更高的要求,越来越多实际系统开始考虑随机因素的影响,随机非线性系统的控制理论研究受到广泛关注。与一般非线性系统相比,随机因素的存在使得随机系统的控制器设计和稳定性分析更加困难,还没有普遍适用的控制方法来解决这些问题。因此,随机系统的自适应控制问题是一个值得研究的课题。本文利用自适应控制,Backstepping技术,Lyapunov稳定性理论,
随着改革开放,中国开始融入世界秩序中,国际化程度越来越高,中国家庭的收入不断提高,越来越多的国人走出国门,接受到国外文化的影响和冲突。国外的教育模式和方式也进入中国家庭的视野,随着外籍工作人员及其子女普遍来华生活,子女能够得到与国际接轨的教育需求催生了国际学校的诞生。教学空间承载了学生主要的生活学习场所,是教学活动发生的试验场,当代国际学校面临国际化与本土化的双重挑战,必须通过深入研究中外国际学校
城乡空间统筹发展是现代化的必由之路、为城市和乡村协同发展创造条件。城市发展对乡村有较高的依赖性,两者相互影响,构成一个不可分割的整体。积极落实乡村振兴政策,更好地解决“三农”问题,充分利用农村地区已有的资源,为农村地区产业化发展创造条件,增加农民收入,获取更多的经济收益,为农村区域现代化发展创造良好的条件。城乡空间统筹发展是保障农民公平发展,公平就业的基础,也是推进小康社会全面建设的驱动因素,通过
迭代学习控制属于智能控制方法其中的一种,由于其显著的优点和良好的控制性能,已经成为智能控制领域的热门研究方向之一,愈发受到众多研究人员的高度重视,并得到了广泛应用。本文基于迭代学习控制理论,研究了一类带有混合参数的非线性系统的迭代学习控制问题。除此之外,针对多智能体系统的广泛应用,又定向研究了一类带有混合参数的多智能体系统的一致性问题。以下是论文的主要工作:(1)针对一类带有混合参数且具有输入饱和
我国社会经济发展推动了小学教育领域在教学理念、模式和方式部分的变革,小学校园规划从传统建筑功能的附属转化为引导学生健康学习成长的乐土。但是,寒地城市小学的现状由于受到寒地气候和理念落后的影响,小学校园的实际形式较为单一,水平差别大,空间的呆板和传统限制了学生校园活动多样动态的空间需求,从而造成学生行为方式受到影响。因此,近年来寒地城市小学校园空间的设计走入研究者关注的重点,从儿童的生心理特征出发,
钢结构具备众多优点,如施工方便、自重轻、绿色环保等,但是,它也有缺点,那就是耐火性差。发生火灾时,钢构件会发生局部破坏,进而造成巨大损失。而当火灾发生在高层钢结构建筑中,损失会更加严重,所以对高层钢结构耐火方案的研究就显得尤为重要。钢结构的耐火方案有很多,但是很少从经济方面去进行比较。钢结构的耐火方案的费用占钢结构造价的比重很大,由于高层钢结构建筑的巨大体量,其防火费用更大。所以在相同的耐火极限时
RNA-蛋白质相互作用(RNA-protein interactions,RPI)在细胞运动、染色体复制、转录与翻译和信号传导等基本细胞生理过程中发挥着重要作用,其机能失调是导致神经性疾病、癌症、免疫紊乱等疾病的原因。预测RPI可以为细胞生物学功能探索、疾病干预和药物设计提供指南,对生命科学、医学和信息科学的发展具有重要意义。传统生物实验方法耗时耗力且稳定性差,不能满足大规模预测任务的需求。因此,
近几十年来,道路交通出行量持续增加,交通拥堵也日益严重,对社会的各个方面产生了一系列的负面影响,如出行时间持续增加、交通污染急剧增加,安全性持续降低。道路交通流理论旨在通过交通建模与仿真研究交通流时空演化规律,并以科学的方法减少交通延误,提升交通系统运行效率和交通安全,为治理交通拥堵提供科学有效的理论支持。作为交通流理论的微观核心模型,跟驰模型能够直观地描述实际交通现象,揭示交通流阻塞形成的内在演
2μm波段激光处于人眼安全波段,在工业加工、临床医学、国防军事、环境监测等领域具有广泛的应用前景。与连续激光相比,脉冲激光具有高峰值功率和窄脉宽等优势,而调Q和锁模技术是获得高性能脉冲激光的主要技术路径。其中,被动调Q技术和被动锁模技术具有工艺成本低、操作简单等特点,而可饱和调制元件是被动调Q和被动锁模中的核心器件之一。近年来,由于二维材料具有易于制备和宽带吸收等优势,利用其制备可饱和吸收体成为固
我国城市目前正处于一个前所未有的飞速发展建设阶段,但在这个过程中许多曾经被忽视的生态方面的弊端也逐渐显现,尤其是城市内涝问题的出现越来越频繁,出现的城市也逐渐增多。国家建设已经向精细化发展,今后我国城镇发展的原则和要求,就是尊重自然,保护生态。绿色生态城镇已经成为今后城市规划建设的重要原则,在政府和社会固有的建设思想发生重大转变的背景下,海绵城市也作为顺应城镇的规划建设发展需求的重要理念应用于实践