【摘 要】
:
DNA结合蛋白是一种由结构蛋白组成的复合型蛋白质,这类蛋白质在特定的核苷酸序列识别、DNA复制和重组、基因转录调控和其他DNA相关活性方面发挥着重要作用。而N6-甲基腺苷作为已知最丰富的RNA甲基化修饰之一,它与结构动力学、RNA定位和降解、选择性剪接、细胞分化、m RNA稳定性和翻译等生物过程息息相关。据研究表明,它还与多种疾病密切相关,例如:前列腺癌、急性髓系白血病、甲状腺肿瘤等。故对DNA结
论文部分内容阅读
DNA结合蛋白是一种由结构蛋白组成的复合型蛋白质,这类蛋白质在特定的核苷酸序列识别、DNA复制和重组、基因转录调控和其他DNA相关活性方面发挥着重要作用。而N6-甲基腺苷作为已知最丰富的RNA甲基化修饰之一,它与结构动力学、RNA定位和降解、选择性剪接、细胞分化、m RNA稳定性和翻译等生物过程息息相关。据研究表明,它还与多种疾病密切相关,例如:前列腺癌、急性髓系白血病、甲状腺肿瘤等。故对DNA结合蛋白和N6-甲基腺苷的研究具有重大而深远的意义。DNA结合蛋白位点与N6-甲基腺苷位点的分类预测是当前研究的重点课题,预测模型方法的研究更是重中之重。这些预测方法不仅能够帮助生物信息学领域的研究人员了解领域内容,而且还给予医疗科技方面极大的便利。本文从多源特征提取、机器学习算法及模型三个方面着重介绍,对所提出的新型预测方法进行讨论和研究,主要成果概括如下:(1)提出了一种新型DNA结合蛋白位点的预测方法:UMAP-DBP。首先,基于理化距离变换、PSSM的自互协方差和广义级数相关伪二核苷酸组成实现一级蛋白序列的特征提取。其次,使用均匀流形逼近和投影及特征重要性评分算法进行特征选择,两者存在递进关系。最后,采用带有折刀测试的自适应提升分类器来预测DNA结合蛋白位点。基准数据集BP1075和BP594的折刀测试获得了82.97%和82.14%的总体准确率,科恩卡帕值分别为0.66和0.64。实验结果表明,基于均匀流形逼近和投影与自适应提升预测DNA结合蛋白位点的方法可行且有效。同时这也是均匀流形逼近和投影首次应用于识别DNA结合蛋白位点的研究。(2)开发了一种新的基于梯度提升决策树和Stacking学习的N6-甲基腺苷位点预测方法:M6A-GSMS。为了实现精准预测,该方法从相关性、结构、理化性质和伪核糖核酸组成四个方面探索RNA序列信息。利用梯度提升决策树算法进行特征选择后,结合7种基础分类器构建Stacking学习模型。预测结果表明,与其他最先进的方法相比,M6A-GSMS对N6-甲基腺苷位点具有良好的识别性能。在拟南芥、黑腹果蝇、肌肉、酿酒酵母和人类数据集上的预测精度分别达到88.4%、60.8%、80.5%、92.4%和61.8%。该方法为N6-甲基腺苷位点的研究提供了一种有效的预测思路。
其他文献
具有高价值的敏感数据如何安全存储和灵活共享成为近年来的研究热点。然而,电子化数据共享系统在方便人们的同时,也面临着一些亟需解决的安全问题。例如,敏感数据在共享过程中存在的访问控制、数据机密安全、有效监管及隐私泄漏等问题。此外,当前集中式的云存储共享有着自身局限性。针对上述问题,本文提出了两个新的数据共享方案,主要工作内容如下:1.提出了一种基于属性加密和代理重加密技术的区块链数据共享方案。首先,将
在电催化还原CO2生成CO的金属材料中,Zn价格低廉地壳含量丰富,并易于吸附COOH*中间态,有利于CO*吸附质的脱附,因此作为贵金属的替代品具有很大优势。但体相Zn在催化还原CO2的过程中存在速度缓慢与对CO选择性较低的问题,对Zn进行形貌处理可以有效提升电催化还原CO2性能。本论文首先采用水热法制备了ZnO晶体,然后通过电化学还原法制备了Zn电极,并研究了Zn电极的不同形貌对电催化还原CO2性
白光LED因其具有耗能低、高发光效率、绿色环保等优点被认为是在白炽灯与荧光灯之后的新一代照明光源。利用紫外/近紫外芯片激发红、绿、蓝三基色荧光粉混合实现白光是白光LED的研究热点。但是,目前商用的Y2O2S:Eu3+红色荧光粉存在对近紫外光的吸收能力较弱、热稳定性较差和发光效率低等缺点,这严重制约了白光LED的发光性能。因此,本文以白钨矿结构的钨酸盐为基质,以Eu3+离子作为激活剂,成功制备了一系
作为电子鼻系统核心的气体传感器阵列排布在测试腔室中。由于传感器的响应受传感器表面的气味浓度和气流的流场形态影响,参照鼻腔结构对气流流场的影响,可推知电子鼻腔室的结构对气体传感有重要的影响。因此,优异的腔室结构设计能够改善传感器阵列的响应与恢复,进一步提升电子鼻系统的性能。本文的研究目标是基于计算流体力学模拟设计一新颖且优异的电子鼻腔室,以求增大传感器阵列的响应强度、缩短响应时间和恢复时间。此外,通
高镍三元正极材料LiNi0.6Co0.2Mn0.2O2(NCM622)具有放电比容量高、能量密度大、成本低廉等优点,是一种极具发展潜力的动力型锂离子电池(LIBs)正极材料。然而,倍率性能和高截止电压下循环稳定性差以及低温环境下容量衰减严重等问题限制了其在LIBs中的进一步应用。本文对NCM622正极材料进行掺杂改性研究,系统研究了其高倍率性能和低温性能。结合TEM、SEM、XRD精修、原位XRD
过渡金属硫族化合物中原子级厚度的二硒化钨(WSe2),因具有良好的载流子迁移率及1.60 e V(单层)的禁带宽度,所以在光电子器件及微电子器件等应用方面有效地弥补石墨烯零带隙的缺点。此外二硒化钨的表面无悬挂键,原子层厚度的材料制作成的晶体管有望减少短沟道效应,在后摩尔的时代发展前景十分广阔,因此二硒化钨成为目前科学家们的研究热点之一。研究已经表明,应变可以调控材料的能带结构和激子跃迁,从而在传感
光电信号转换在我们日常生活中具有举足轻重的地位。视频成像、光通讯、生物成像、安全、夜视、气体传感和运动监测等设备都需要高性能、大面积的光电信号转换技术。基于原子层厚度的二维过渡族金属硫化物的新型光电探测器兼具高速、宽谱、柔性等优点,备受研究人员关注。而二维半导体光电探测器的响应度和响应波长尚不能满足硅基光子学等应用的要求,严重制约了二维半导体器件的集成和应用。硅通常在约1.5%的应变下就会发生断裂
聚类作为一种重要的数据挖掘方法,能够发现未知数据的潜在模式,进一步指导实践.传统聚类算法受参数或数据类型影响,往往表现不佳.集成聚类通过学习多个模型来解决一个问题,从而获得一个准确度和鲁棒性都更强的结果,在一定程度上缓解了单个聚类算法的困境,拓宽了聚类算法的应用场景.目前已经形成了很多集成聚类算法,但是仍存在三个问题:一是侧重于集成策略的设计,忽视了生成阶段基聚类质量对最终聚类结果有着直接的影响;