基于深度学习的跨物种蛋白质相互作用预测及番茄蛋白质互作组分析

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:hua1kai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质-蛋白质相互作用(Protein-protein interaction,PPI)是其行使各种生理生化功能的基础,蛋白质互作研究对了解细胞功能的分子机制有着重要意义。目前,已有许多实验方法用于蛋白质互作检测,但实验手段通常费时费力,且实验解析仍停留在少数几种模式生物上。因此,发展一种新的蛋白质互作预测方法,从已有数据中学习蛋白质互作特征,再应用于园艺作物实现跨物种蛋白质互作预测,这无疑将加速园艺作物重要农艺性状的分子机制研究。本研究发展了一种基于深度学习的跨物种蛋白质互作预测方法Deep Cro PPI(Deep Learning based Cross-Species Prediction of Protein-Protein Interaction),该方法能够识别序列自身特征以及蛋白质互作特征,从而实现仅依赖氨基酸序列信息的蛋白质互作预测。实验结果表明,Deep Cro PPI在6个模式生物数据集上的预测准确率介于82.9%-93.1%。在单物种两两交叉的跨物种预测准确率平均为60.7%。此外,混合多物种数据作为训练集较单物种数据准确率平均提高了2.62%。调整训练集中的样本比例,当正负样本比例为1:10时,模型真阳性率为8.9%,假阳性率为0.15%。一系列测试评估结果表明,Deep Cro PPI能够实现跨物种蛋白质互作预测,且预测的假阳性率控制在预期水平。借助Deep Cro PPI对番茄基因组约6.4亿对蛋白质组合进行互作预测,在基因组尺度构建番茄蛋白质互作网络Sly PPINet(Solanum lycopersicum Protein-Protein Interaction Networks)。Sly PPINet共包含104,398对蛋白质互作关系,涉及8,238个蛋白质,覆盖番茄整个蛋白质组的23.03%。与string数据库的番茄互作预测数据比较,7,603对蛋白质互作能同时被两种方法预测(p<6.76e-254)。对Sly PPINet中的乙烯信号通路潜在互作调控蛋白质进行深入分析,挖掘了1,468个可能与乙烯信号通路存在互作调控的候选蛋白质,并重点对互作蛋白编码基因Solyc06g008580、Solyc01g095900、Solyc12g057110以及Solyc11g044560的功能及表达谱进行了深入分析,这些候选基因可能通过互作调控乙烯信号通路进而影响番茄果实发育成熟。结果表明,Deep Cro PPI及其构建的Sly PPINet能为番茄等园艺作物重要农艺性状的分子机制研究及关键基因挖掘提供重要数据资源。
其他文献
卷积神经网络(Convolutional Neural Network,CNN)由于具有表征学习的特点,被广泛应用于各个领域。近年来,随着卷积神经网络数量与规模的不断增加,基于现场可编程门阵列(Field Programmable Gate Array,FPGA)的卷积神经网络加速器快速设计方法已成为重要的研究方向。但是现有的设计主要针对吞吐率进行优化,整体延时通常较长,不能很好地满足实时应用的需
精确测量飞行器流场速度分布对分析飞行器的空气动力学性能及实现飞行器主动流动控制有着重要的意义。目前,随着小型飞行器的快速发展,迫切需要有可分辨0.01m/s空气流速变化,量程达到100m/s的宽量程、高分辨率,且体积小、功耗低、易集成的微传感器来满足其空气动力学测试需求。目前,市场上还没有性能可以满足上述要求且对流场干扰小的传感器可供使用。近年来,基于仿生学和MEMS(Micro-Electro-
深度学习中复杂的网络结构需要大规模的计算资源支持。在面积和功耗资源有限的移动端和嵌入式系统中,神经网络的层数和尺寸受到严格约束。随机计算作为一种新兴计算方式,有着硬件开销低、运算速度快、容错率高等优点。与传统二进制计算不同的是,随机计算是用随机比特流进行逻辑运算,其中比特流中数字1出现概率表征目标值。这种编码方式使得如乘法和加法等重要的算术运算,可以用简单的逻辑运算实现。因此,近年来随机计算在深度
由于工艺特征尺寸持续缩小,模拟集成电路设计对多级运放的兴趣不断增高。多级运放可以获得更高增益,但其补偿设计也同时变得困难。本文主要研究利用设计方程以及粒子群优化算法(PSO)来实现多级运放的自动化尺寸定制的方法。与已有研究不同的是,本文尝试将手工推导的设计方程引入到基于仿真的启发式搜索程序中,可以有效地降低搜索空间维数和提高PSO算法的探索结果质量。另外,在多级运放的自动化尺寸定制的研究过程中,本
随着人工智能技术的发展,生物特征识别作为实现新型人机交互的重要载体,已经被运用到很多产业中。其中,人脸识别技术因其非接触性、非侵入性、设备简单和不易破解等优势,逐渐成为了现今较为重要的身份鉴定方式之一。卷积神经网络是目前在人脸识别上应用较为广泛的网络,通常采用余弦域损失函数来扩大特征间边际,训练耗时会因此增大。为此,本文将对余弦域下的网络训练速度和实际识别效果展开研究:首先,针对余弦域下网络训练耗
大规模多输入多输出(Massive Multiple-input Multiple-output,Massive MIMO)作为第五代移动通信的核心技术之一,可以显著提升移动通信系统的传输速率和可靠性,但基站和用户端天线规模的提升使得通信系统的设计变得非常困难。深度学习因良好的鲁棒性和并行性成功地在众多领域得到了广泛应用,为其在移动通信领域的发展提供了坚实的理论基础。设计高可靠性、低复杂度的大规模
鲜味是由L-谷氨酸钠(L-monosodium glutamate,MSG)等鲜味成分引起的一种味觉品质,是评价食品风味的重要指标之一,同时也是氮源营养物质在机体内进行信号传递的重要途径,因而如何有效评价鲜味味觉具有重要意义。现有的味觉评价法包括传统的人工感官评价、HPLC等仪器分析技术和以电子舌为代表的智能感官系统均存在不同程度的局限性。随着味觉生理机制的深入研究,研究人员已采用味觉受体、含有味
实时的厚度检测对于易磨损的器件工作状况的监控具有十分重要的意义。尽管现有的厚度检测设备如激光厚度传感器、超声波厚度传感器、电容式厚度传感器等可以用于常规的厚度测量,但是由于其具有庞大的体积、刚性的探头以及昂贵的价格限定了其在复杂工况下的应用以及大范围的推广。印刷电子作为一个新兴的领域在近些年快速发展,由于其具有成本低、易于制造、体积小、与柔性基板高度兼容等优点,在学术界和工业界受到广泛关注。纳米银
随着工业机器人在汽车制造、机械加工、焊接、上下料、磨削抛光、搬运码垛、装配、喷涂等领域的应用和发展,传统的工业机器人在线示教已经很难满足现代工业生产加工的需求。为了满足现代工业准确高效的生产需求,研究人员越来越重视机器人离线编程技术。离线编程能够有效提升实际生产环境中的编程效率和工作效率,是一种面向任务的编程方法。本文针对MARK III型LNG船用不锈钢多面体工件对机器人的螺柱焊和弧焊的离线编程
细胞检测一直是生物学探索的重要步骤,在传统的生物学中,对于细胞的检测的手段有流式法,免疫荧光细胞化学染色法,Elisa盒子检测,传统的检测方法具有周期长、费用高、过程复杂等问题。基于细胞的生物传感器在水的毒性和质量检测、微生物药敏分析、癌症研究、临床和卫生保健、食品科技与食物安全、药物及药理研究等方面也具有重要应用。同时,电容传感器一直存在着电场分布不均匀,精度方面难以保证。传感器表面吸附细胞通常