【摘 要】
:
N6-甲基腺嘌呤(m6A)是指在氮-6位的腺苷核苷酸的甲基化修饰,它在一系列生物过程中起重要作用,如剪接,mRNA传输,mRNA合成和翻译过程等。随着m6A位点高分辨率数据集的建立,很多
论文部分内容阅读
N6-甲基腺嘌呤(m6A)是指在氮-6位的腺苷核苷酸的甲基化修饰,它在一系列生物过程中起重要作用,如剪接,mRNA传输,mRNA合成和翻译过程等。随着m6A位点高分辨率数据集的建立,很多研究方法已经可以成功预测序列中的m6A位点。然而传统实验方法识别m6A位点耗时且成本很高,并且用于鉴定N6-甲基腺嘌呤位点的许多常规计算方法受数据规模的限制。利用通过高通量测序方法,多种物种的百万级m6A位点数据库得以建立,给了我们一个构建利用大规模数据驱动为优势的深度学习方法预测模型的机会。本文主要研究内容包括:(1)介绍了两个我们在识别m6a位点方面的前期研究工作,提出了基于多间隔核苷酸对位置特异性和支持向量机的机器学习预测模型和基于深度信念网络提取高层次序列特征表示并与传统特征结合识别m6a位点的预测模型。(2)引入四种RNA序列编码模式。本文分别提出四种序列表示的方法,包括one-hot编码和基于邻近位点状态编码的特征,Embedding词嵌入编码的特征和利用NLP词嵌入模型对基因序列进行迁移学习,将RNA序列分割成伪单词以学习向量空间的特征表示。(3)通过4种具有不同超参数和网络结构的一维CNN网络对四种不同的编码方案的基因序列位点数据进行分类。(4)使用第一层CNN卷积核扫描基因高频motif与现有的motif的对比分析,揭示深度学习在基因序列表示方面的可解释性和可视化。(5)开发在线N6-甲基腺嘌呤位点预测平台,支持多种编码和深度学习网络的预测模式,提供整理重编译的数据集,以便后续研究者使用。
其他文献
<正> 糖尿病是一种终身、全身、慢性代谢性疾病,饮食营养疗法是治疗糖尿病最基本的措施。因此,对糖尿病人的饮食给予正确指导,达到既要保证营养供给,又有得于控制血糖、尿糖
目的:研究丁苯酞连续多次灌胃给药对大鼠CYP3A酶活性的影响。方法:40只Wistar大鼠随机分为四组。对照组灌胃给予橄榄油;实验组分为低、中、高3个剂量组,分别灌胃给予丁苯酞40
产品质量是企业赖以生存和发展的保障,企业需要建立健全完善产品质量档案,采用现代化信息技术升级传统产品质量档案业务,不断提升产品质量档案管理水平和服务效率。本文针对
社会的进步离不开城市的发展,城市的发展离不开生态绿地的建设,构建合理科学的绿化结构和网络是解决这些问题的关键。
拟态弧菌是一种食源性致病菌,可污染鱼虾蟹贝类等水产品。拟态弧菌可产生黏附素、肠毒素和溶血素等毒力因子,导致机体发病。生物膜是由细菌和自身分泌的多糖、蛋白质、DNA等胞外基质组成的结构。拟态弧菌具有较强的生物膜形成能力,生物膜的存在增加了拟态弧菌污染的风险。表没食子儿茶素没食子酸酯(EGCG)是茶多酚中最有效的活性成分,对革兰氏阳性菌和革兰氏阴性菌均有显著的抑菌效果。近年来,EGCG广泛应用于牙齿保
近年来,京津冀协同发展已被提升到国家经济发展战略的高度,这无疑给环京地区的房地产业带来了新的发展契机。随着京津冀协同发展战略的不断推进,其资源的流动和配置更加顺畅
学习观念的研究对于改善外语学习状况、提高外语教学质量具有重要意义。自二十世纪七十年代以来,研究者对学习者语言学习观念的研究有着较丰富的研究成果,但多数研究以大学生为研究对象,围绕学习者语言学习观念与学习策略、学习动机、学习成绩间的关系展开,而缺乏对语言学习观念形成的影响因素的研究。另外,从2018年英语新课程标准颁发以来,还未有研究者结合新课标探讨高中生的英语学习观念。因此,本研究采用定量研究与定
目的探讨盆底超声中盆腔新参数(即宫颈下缘至阴道外口距离)的测量可行性。评估中盆腔新参数在诊断子宫脱垂中的应用价值。研究对象和方法前瞻性地对我院2018年11月~2019年5月
建设社会主义新农村,是一项综合配套的系统工程,需要各级政府财政的推动和支持。但目前有关县级财政与社会主义新农村建设的关系的讨论和文章较少,也未见专著与论述。通过结
提出了BrO3--MnSO4-H2SO4-丙二酸化学振荡反应体系,在考察各组分浓度对空白体系稳定性和振荡特征参数影响的基础上,获得了黄芪、陈皮、葛根等7种中草药的电化学指纹图谱.结果