基于深度学习开发预测富含亮氨酸重复结构域的方法

来源 :华中农业大学 | 被引量 : 0次 | 上传用户:yl9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
富含亮氨酸重复(Leucine-rich repeat,LRR)是由一个疏水性亮氨酸残基保守片段和一个高度变异片段组成的短序列,其存在于免疫相关的受体中,例如:LRR-RLKs,RLPs和NLRs。现有预测工具主要基于隐马尔可夫模型、位置特异性矩阵和传统机器学习算法,本研究中我们引入深度学习算法开发了预测LRR结构域的新工具。在本课题研究过程中,我们首先基于重构的LRR单元高度保守片段模式构建了LRR单元的正负样本数据集。随后,我们结合LRR结构域序列特征和卷积神经网络模型开发了DeepLRR,以及对应的网站服务。此外,我们重注释了番茄、拟南芥和水稻参考基因组中的LRR-RLK和LRR-RLP基因,对三种植物的LRR-RLK基因进行了染色体定位、基因簇分析、串联重复分析和系统发育分析。最后,利用拟南芥中已发表的LRR-RLK基因表达量数据进行了WGCNA分析,鉴定了一些潜在的受体和共受体基因。具体研究结果如下:1.在Swiss-Prot数据库中收集了1849条LRR蛋白质序列和174800条不含LRR结构域的蛋白质序列,经过数据预处理和重构LRR单元高度保守片段模式,我们构建了LRR单元的正负样本数据集。2.我们在同一训练集下分别构建了CNN、SVM、RF和NB模型,用以比较深度学习算法和传统机器学习算法预测LRR单元的能力。为了在蛋白质序列层面上完整预测LRR结构域,我们结合卷积神经网络模型和LRR结构域序列特征开发了DeepLRR,并且在同一数据集上取得比其他六种预测工具更高的F1-score值。3.为了提高DeepLRR在科学研究过程中的实用性,我们开发了DeepLRR的网站服务,并且搭载了LRR-RLK、LRR-RLP和NBS-LRR及其非典型结构域的鉴定流程4.我们基于DeepLRR重注释了番茄、拟南芥和水稻参考基因组中的LRR-RLK和LRR-RLP基因,染色体定位、基因簇分析、串联重复分析和系统发育分析被用于三种植物中重注释的LRR-RLK基因。5.基于上述工作,我们搜集了拟南芥LRR-RLK基因在48组样本中的表达量数据,结合已知受体和共受体的LRR单元数量特征和拟南芥LRR-RLK基因的WGCNA结果筛选出一些可能的潜在受体和共受体基因。
其他文献
磺内酰胺和吲唑并吡唑啉酮是许多药物和有机功能分子的核心结构单元,对相应化合物的生物活性和理化性能起着不可替代的作用。另一方面,螺环化合物因其较高的刚性和独特的空间结构,在药物发现过程中得到广泛应用。因此,如何从易得的原料出发简便高效地合成螺磺内酰胺和螺吲唑并吡唑啉酮类化合物是合成化学和药物化学的重要研究内容。近年来,过渡金属催化的惰性C-H键官能团化因具有原料简单和原子经济性高等优势已逐步成为有机
学位
君迁子是我国广为应用的柿砧木,其嫁接不同甜柿品种存在嫁接选择性亲和现象。探索柿中存在的嫁接选择性亲和机制对选育嫁接亲和性良好的砧木有重要理论意义,有利于我国甜柿产业发展。本研究利用离体嫁接技术,构建嫁接亲和组合(“次郎/君迁子”)及与嫁接不亲和组合(“富有/君迁子”),对嫁接后不同时期的不同嫁接部位进行转录组测序,通过转录组的比较分析,发掘影响嫁接亲和的相关基因。此外,对六种嫁接亲和组合与嫁接不亲
学位
分子基晶态材料因其在药物、发光、有机电子学等领域的物理化学性质而备受关注。然而,形成光电功能体在分子尺度有序排列的有效方法仍然十分有限,这在很大程度上限制了它们在光功能和光电子领域的应用。金属-有机框架(Metal-organic frameworks,MOFs)是一类由金属离子/簇节点和功能有机配体通过配位键构建而成的周期性晶态材料。由于其成分多样、合成方便、易表面功能化、生物相容性可调等独特特
学位
柑橘细菌性和病毒类病害对柑橘产业造成了巨大的冲击,本课题通过分析柑橘细菌性和病毒类病害分子检测技术,对‘伏令夏橙’愈伤组织和柑橘植株进行了主要病害分子检测;同时对从柑橘基因组中鉴定的11个WOX转录因子家族系统发育树、基因结构、保守基序、基因共线性和表达等进行了分析;制备了柑橘Cs H4-1、Cs H4-2、Cs WUS、Cs SAM、HLB、CTV、CYVCV探针,并进行柑橘茎尖原位杂交试验,以
学位
柑橘是世界第一大水果,我国柑橘的产量与面积均居世界之首。我国柑橘品种以中熟为主,熟期集中,通过芽变选种培育更多不同熟期的新品种,有助于改善我果柑橘产业结构,满足人们对柑橘鲜果的消费需求。本研究以课题组发现的南丰蜜橘特早熟芽变优系(MT)及普通南丰蜜橘(WT)为材料,从植株的植物学性状、农艺性状、果实常规品质和糖酸含量等方面进行研究,以综合评价MT的品质优劣与推广价值。同时基于重测序技术开发出检测M
学位
化石能源过度消费带来的资源短缺以及碳排放引起人类对清洁可再生能源的关注和旺盛需求。由于具有高能量密度和零污染,氢气被认为是理想的燃料,电解水是可持续产氢的方法之一,其过程包括析氢和析氧两个半反应。高活性催化剂在这两个半反应中发挥关键作用,但是,传统的贵金属基催化剂成本高昂、资源稀缺且稳定性不佳,不利于工业规模电解水产氢。开发高效和低成本催化剂是解决问题的突破口。过渡金属-碳基体复合材料接触界面两侧
学位
为了满足当今世界对绿色化学和可持续发展的需求,寻找高效、廉价、低毒的绿色金属应用于化学合成方面的不对称催化领域也就成了化学从业者关注的问题。铁作为绿色金属自然就成了大家关注和研究的对象。本文先是研究了手性Fe-BPsalan络合物催化N-甲基咪唑衍生的α,β-不饱和羰基化合物和2,3-二氢呋喃之间的不对称[4+2]环加成反应。通过对条件的筛选和优化,使用5 mol%的手性Fe-BPsalan络合物
学位
柑橘以其丰富的营养和经济价值,在世界各地广为栽培,并受到广大人民的欢迎。柑橘从播种到首次开花需要经历较长的童年阶段,一般6-8年,这严重阻碍了柑橘的育种进程。FD属于bZIP转录因子家族,可以与“成花素”(FT)形成复合物,该复合物可以通过促进下游开花相关基因的表达从而促进植物开花。在植物中,b HLH类转录因子参与多种生理过程,例如生理代谢、生长发育以及逆境响应等。课题组前期利用CiFD启动子进
学位
非那雄胺,化学名称为N-叔丁基-3-氧代-4-氮杂-5α-雄甾-1-烯-17β-酰胺,是一种4-氮杂甾体化合物,作为一种特异性的II型5α-还原酶抑制剂,对良性前列腺增生具有良好的治疗作用,同时它也是第一个获得批准进入临床并投入市场的5α-还原酶抑制剂。非那雄胺的作用机制主要是可以阻断睾酮转化为活性更高的二氢睾酮(DHT),可以导致体内DHT含量降低,睾酮水平增加或正常,能够改善前列腺增生症状,并
学位
钠离子电池与锂离子电池具有相似的工作原理,制作工艺流程及生产设备可以相互兼容,再加上丰富廉价的钠资源,被认为是下一代最具潜力的化学电源。在钠离子电池体系所有的负极材料中,硬碳负极其能量密度较高、价格低廉,受到研究者的广泛关注。然而,由于硬碳首次库伦效率较低、循环稳定性较差、倍率性能不佳等问题使得其发展受限。而上述缺点可以通过新型电解液的开发得到有效缓解和改善,因此,电解液的适配和优化是钠离子电池的
学位