【摘 要】
:
在后基因组时代,蛋白质组学是一个非常重要的研究内容。蛋白质作为一种基础物质是直接参与了人类的生命活动,通常需要通过进行翻译后修饰(Post-translational modifications,
论文部分内容阅读
在后基因组时代,蛋白质组学是一个非常重要的研究内容。蛋白质作为一种基础物质是直接参与了人类的生命活动,通常需要通过进行翻译后修饰(Post-translational modifications,PTMs)才能转化为具备功能的成熟蛋白,然而实验测定位点方法是有局限性的,运用机器学习算法建立快速识别模型已成为研究的热点。本文针对赖氨酸位点修饰问题,构建了糖化和SUMOylation两种相应预测方法,具体说明如下:1、基于特征选择的糖化位点预测方法。赖氨酸糖化涉及多种疾病,包括了衰老相关的疾病以及糖尿病的发生。通过开发预测工具PredGly,从而帮助实验人员预先筛选出待检测糖化位点,以此提升实验检测效率。PredGly提取了三种类型的特征表达方式,包括了序列信息、理化属性以及进化信息,此外,利用XGboost进行特征选择,去除融合特征中的无关和冗余信息。对于全新的独立测试集,PredGly的性能也优于其它糖化预测工具。2、基于卷积神经网络的SUMOylation位点预测方法。SUMOylation不仅在调节多种细胞过程中发挥重要作用,而且与许多严重的人类疾病密切相关。构建了赖氨酸SUMOylation预测工具DeepSUMO,利用卷积神经网络(Convolutional neural network,CNN)从原始蛋白序列中捕捉信息,并且结合增强的氨基酸组成信息,建立了一个基于两种序列信息表达的多输入深度学习模型。为了比较不同传统机器学习算法在SUMOylation位点预测上的表现能力,基于交叉验证考察了4种机器学习算法的综合能力。
其他文献
网络信息空间是信息化时代地理空间和地理学拓展的新领域。在信息技术的支持下,城市之间的联系不再局限于特定实体空间,呈现出网络化的特征。互联网的出现与发展对传统地理空
伴随着城市发展,城市显得更加拥挤,城市中土地使用也越来越频繁,各种屋面、路面等硬化面积增多,产生更多的地表径流,引起城市内涝。另一方面,地表径流中也包含着许多对人类产
近些年来,随着经济飞速发展,大到轻工业、制造业,小到城市轨道交通建设、桥梁等基础建设无一能离开有色金属行业。如今,国家计划加速城镇化,大力发展交通运输建设,更加需要有
车载网络VANET是由车辆间、车辆和路边设施之间形成的一种自组织网络,使车辆可以在没有网络基础设施支持的情况下进行通信,是智能交通系统ITS的重要组成部分。由于车辆是由人
从给定输入数据中提取特征是机器学习成功应用的关键[8]。特征学习寻求从输入数据到(通常是实数值的)特征向量的最优转换,该特征向量可以作为学习问题的输入。常见的特征学习
随着“中国制造2025”“德国工业4.0”“互联网+”等高科技战略计划的提出,我国制造业正通过改善企业的信息化水平,不断向高速度、高质量、集约性等方向发展。高效的生产调度
随着西部地区经济的高速发展,工程项目规模的不断扩大,桩基础在西部黄土地区的应用也日趋广泛。对于分析桩基的承载性能来说,采用试验的方法得到的数据较为准确可靠。其中,室
智能制造离不开工业机器人技术发展,工件分拣是工业机器人的一个重要应用。将3D技术加入其中,不仅提高系统的灵活性,还可以解放部分劳动力。如何提高系统自动识别和估计工件
浦口,因江而生,缘江而兴。作为国家级南京江北新区的重要板块、"江北新主城"的重点建设区域,南京市浦口区肩负创新发展的新使命,聚力探索出集成电路、高端交通装备等地标性产
钢筋混凝土(RC)空心截面墩柱在高桥墩中得到广泛应用,其抗震性能已有较多研究,但尚未见到其抗爆性能研究的公开报道。鉴于桥梁结构遭受恐怖袭击的潜在风险和RC空心截面桥墩抗