肺癌功能翻译后修饰的生物信息学分析

来源 :华中科技大学 | 被引量 : 0次 | 上传用户：leiyang000

【摘要】

：

【作者】

：

周嘉琦

【机构】

：

华中科技大学

【出处】

：

华中科技大学

【发表日期】

：

2020年01期

【关键词】

：

功能蛋白质翻译后修饰多组学分析机器学习生物信息学肺癌多工具整合

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

蛋白质翻译后修饰（Post-translational modification,PTM）是生物体内重要的调控手段,也是许多细胞信号事件的核心。翻译后修饰可以通过在蛋白质上添加不同的小分子基团而使蛋白质的理化性质、结构或活性发生改变,从而影响蛋白质的功能。翻译后修饰的类型众多,目前已知已达数百种,其中泛素化和磷酸化修饰存在范围较广、参与重要细胞学调控过程较多,其异常状态常常与多种人类疾病尤其癌症密切相关。近年来,随着高通量测序技术和质谱技术的飞速发展,许多与癌症相关的多组学数据包括蛋白质翻译后修饰数据呈井喷式增长,而如何高效整合、有效分析和利用这些数据,对癌症发生机制进行探讨,并且从中挖掘潜在的癌症重要调控因子,成为了相关领域亟待解决的问题。基于上述背景,本文以临床最为常见的恶性肿瘤肺癌为切入点,对肺癌相关功能翻译后修饰进行了系统的生物信息学研究。因目前尚无较为综合的泛素化/类泛素化相关数据库,我们首先构建了泛素/类泛素偶联调控因子数据库i UUCD 2.0。通过文献检索、隐马尔可夫模型预测与同源鉴定,我们整合了148种真核生物当中的136,512个泛素/类泛素偶联的调控因子,涉及74个家族的6类调控因子,包括1,230个泛素激活酶、5,636个泛素缀合酶、93,343个泛素连接酶、9,548个去泛素酶、30,173个泛素结合结构域蛋白质以及11,099个类泛素结构域蛋白质。更进一步地,数据库提供这些调控因子来自近70个公共数据库的详细注释信息,8种常见的模式生物得到了注释,包括人类、小鼠、大鼠、秀丽隐杆线虫线虫、黑腹果蝇、拟南芥、酿酒酵母和裂殖酵母,注释内容涵盖11个方面,包括癌症突变、单核苷酸多态性、m RNA表达、DNA和RNA元件、蛋白质相互作用、三维结构、疾病相关信息、药物和靶标信息、蛋白质翻译后修饰、DNA甲基化以及蛋白质表达或蛋白质组信息。i UUCD 2.0是迄今为止涵盖物种最多、调控因子种类最为齐全、家族分类信息最为系统以及注释信息最为全面的泛素/类泛素调控因子综合注释数据库,是极具价值的蛋白质翻译后修饰数据资源。由上所述,我们获得了多种翻译后修饰调控因子的详细注释,其中多个层面的信息都与癌症发生密切相关,例如癌症突变、m RNA表达、蛋白质翻译后修饰、DNA甲基化以及蛋白质组信息等等。为了能够将这些多层次的信息在癌症靶标发现研究方面得以运用,我们以肺癌为切入点,以目前为止最为全面的癌症组学公共资源TCGA（The cancer genome atlas）为数据来源,围绕翻译后修饰调控因子之一的蛋白质激酶,建立了多组学数据整合预测肺癌驱动激酶的算法流程。在本工作中,我们收集了TCGA数据库当中肺癌病人和正常肺部组织的多组学数据,包括体细胞突变数据、拷贝数变异数据、转录组数据、DNA甲基化27K数据,以及DNA甲基化450K数据,对这5个层面的数据进行了肺癌与正常样本之间的差异化分析,并以差异化分析结果为基础,以机器学习方法为手段,构建了肺癌驱动激酶预测模型。最后,我们成功运用该模型预测到36个潜在的肺癌驱动激酶,并在肺癌小鼠模型当中进行了功能验证。在该工作中,计算预测与实验手段相结合的方法,不仅大大提高了筛选癌症分子靶标的速度,节省了筛选成本,并且为类似的疾病相关研究提供了参考模板。在构建了上述从基因组、转录组和表观组层面发现肺癌驱动基因的算法流程之后,我们更进一步希望通过蛋白质组和修饰组层面的数据发现在癌症中具有重要功能的翻译后修饰事件。因此,我们依旧以肺癌为研究目标,以目前数据储量较大、研究手段较为成熟的磷酸化蛋白质组学作为研究材料,开发了肺癌磷酸化组大数据的跨引擎整合与分析流程。具体地,我们收集了232个肺癌样本和102个正常肺部组织样本,开发了囊括9种搜库工具的整合鉴定流程,最终得到肺癌磷酸化位点共155,711个,鉴定通量较单一工具鉴定方法提高最低约5%,最高约265%,在单个样本中的鉴定通量平均提高约87%。利用该流程,我们筛选出肺癌和正常样本之间的显著差异磷酸化位点共183个,来自于169个磷酸化蛋白质。更进一步地,30个得分最高的肺癌差异磷酸化蛋白质被挑选出来,并在肺癌A549细胞系当中进行功能验证,最后,我们成功筛选出18个对肿瘤生长具有显著影响的功能磷酸化蛋白质。在此过程中,我们通过解决跨样本和跨工具整合鉴定的技术问题,大大提高了磷酸化蛋白质组学的鉴定通量和鉴定准确性,建立了癌症磷酸化组大数据跨引擎整合鉴定的计算流程,最后利用该流程成功筛选出潜在的肺癌功能磷酸化事件。综上所述,本文围绕功能蛋白质翻译后修饰与肺癌的关系展开了一系列工作。首先,我们构建了具有多层面注释信息的泛素/类泛素偶联调控因子综合数据库,接下来,根据对翻译后修饰调控因子多个层面注释信息与癌症关系的思考,我们利用基因组、转录组和表观组层面的癌症数据构建了肺癌驱动激酶的预测方法,最后,为了在修饰组学层面上对癌症功能翻译后修饰事件进行发现,我们又建立了跨引擎整合鉴定肺癌磷酸化蛋白质组学的分析流程。基于上述翻译后修饰数据资源和分析流程的开发,我们提供了一整套利用癌症多组学数据进行功能翻译后修饰事件挖掘的新策略,为肺癌功能翻译后修饰位点鉴定、分子机制及调控途径研究提供了新方法和新思路。

其他文献

MSI2介导Notch1信号通路维持CD44v6+肝癌干细胞“干性”的机制研究

背景与目的:肝细胞肝癌是世界上第六大肿瘤,在肿瘤致死性疾病中居第三位。肝癌干细胞与肝癌的复发转移及治疗抵抗密切相关。Musashi2（MSI2）是正常干细胞和肿瘤干细胞中“干性”促进和维持的关键基因。Notch1信号通路是调控肿瘤干细胞的核心信号通路之一。MSI2及Notch1通路在肝癌干细胞的“干性”促进和维持中均扮演重要角色。然而,MSI2及Notch1通路在CD44v6+肝癌干细胞“干性”维

学位

肝细胞肝癌肝癌干细胞CD44v6Musashi2Notch1信号通路

TC4合金SLM成形过程温度场数值模拟及缺陷、组织与力学性能的研究

航空航天零件轻量化、高强高精度复杂结构以及制造和维护成本方面的要求,限制了以铸锻焊为代表的传统成形方法的应用。选区激光熔化（SLM）工艺成形零件复杂、精度高,被认为是TC4合金航空航天复杂精密零件极具潜力的成形方法之一。然而,SLM是一种逐层叠加、快速冷却、热历史复杂的成形方法,与传统工艺制造的零件在缺陷、组织与力学性能方面存在着明显的差异。现有实验手段和数值模拟技术无法完全解释TC4合金SLM过

学位

选区激光熔化TC4合金数值模拟孔缺陷组织SEM原位观测

针状聚多巴胺载银二氧化钛纳米杆涂层的长期抗菌性和生物相容性研究

背景作为医用金属材料,钛及其合金由于其优良的生物相容性,机械性能和化学稳定性在骨科、牙科及整形外科等方面具有广泛的临床应用。但作为生物惰性材料,生物活性较差的钛本身并不具有抗菌性能。通常由于细菌粘附和生物膜形成导致的钛内植入物相关感染是导致手术失败以及二次手术的主要原因之一。因此早期阻止细菌感染是十分重要的。银（Ag）作为一种古老的抗菌元素,具有广谱的抗菌性能和抗生物膜形成的能力,被普遍应用于假体

学位

银纳米颗粒二氧化钛纳米杆物理刺破抗菌性生物相容性

机器人铣削加工的末端动态特性分析与位姿优化研究

随着制造领域的发展,机器人铣削加工广泛应用于航空航天、能源和船舶等领域,船用螺旋桨机器人铣削替代目前的人工打磨和数控机床加工,成为一种新型加工方式。提高机器人末端刚性和获取机器人末端动力学特性是目前大型复杂零件机器人铣削加工领域亟待解决的共性问题。机器人的刚性较弱,动力学特性随末端位置而改变,影响了机器人加工质量,基于刚度性能指数优化机器人加工刚性以及准确预测机器人刀尖点频响是主要的研究手段,但目

学位

机器人铣削法向刚度频响预测位姿优化最大材料去除率冗余角优化振动抑制

胰腺癌中预后相关非编码RNA的筛选与LINC01060的功能及作用机制研究

背景与目的:胰腺癌是消化道系统的高度恶性肿瘤,其治疗效果不佳,且缺乏有效的诊断与预后评估标志物。在本篇论文中,我们评估了长链非编码RNA和微小RNA在胰腺癌中作为预后标志物的潜在价值以及LINC01060在胰腺癌中的功能与机制。方法:在前两章,我们利用TCGA数据库中胰腺癌表达谱数据鉴定了胰腺癌中差异表达的mRNA、lncRNA和miRNA,并通过竞争性内源RNA（ceRNA）与基因共表达理论筛选

学位

胰腺癌非编码RNA生物标志物侵袭转移增殖长链非编码RNA微小RNA预后LINC01060黏着斑

MGP和尿液外泌体在肾结石形成中的作用及其机制研究

第一部分探究高钙对大鼠肾小管上皮细胞中MGP表达的影响目的:研究高钙对大鼠肾小管上皮细胞（NRK-52E）中基质Gla蛋白（Matrix Gla protein,MGP）表达的影响,并探究高钙微环境下MGP在细胞钙化和钙盐沉积中发挥的作用。方法:使用高钙培养基培养NRK-52E细胞,通过流式细胞技术和CCK-8检测细胞的凋亡与增殖。使用Western blot和免疫荧光技术检测高钙对NRK52E细

学位

MGP高钙肾小管上皮细胞钙盐沉积ucMGPGGCXVitK华法令BMP2氢氯噻嗪高钙尿肾结石肾结石复发Logistic回归分析尿液外

人类指甲前体细胞（干细胞）的探索及活性研究

第一部分人类指甲前体细胞（干细胞）的确定和定位研究研究目的:指尖缺陷甚至断指是上肢常见的损伤,给患者带来很大的痛苦,这些患者经过治疗,相当数量的人群仍然会导致手指或指甲的畸形,这可能伴随着残疾和美容相关的一系列问题。目前对于指尖缺损存在的治疗方案,都有其局限性,重建的指尖大多不能形成其独特的原始特征,还伴随着对正常组织的破坏。我们希望能够通过组织自体再生的方式诱导患者指尖再生。成体干细胞的调控是器

学位

指甲前体细胞干细胞年龄相关性功能生长速度

体外培育牛黄治疗果糖诱导非酒精性脂肪性肝病的作用及其机制研究

第一部分:果糖诱导非酒精性脂肪性肝病小鼠动物模型的构建和评价目的:建立高果糖饮食诱导的非酒精性脂肪性肝病（NAFLD）小鼠模型,并评价其特征。方法:C57BL/6小鼠给予含30%（w/v）果糖的蒸馏水饲养8周,对照组给予蒸馏水饲养。分别于第2、4、6和8周测量小鼠的体重及肝脏重量,并计算肝脏指数。采用试剂盒测定血清中各类脂质含量,同时测定小鼠空腹血糖（FPG）、空腹血清胰岛素（FINS）含量并计算

学位

体外培育牛黄果糖非酒精性脂肪性肝病脂肪变性胆汁酸代谢轮廓

精冲模具用粉末冶金高速钢S390/S790的热处理规律研究

精冲是汽车制造等领域的关键工艺之一,其模具寿命低下是困扰我国精冲领域的最迫切问题。近年来,各界为提高精冲模具寿命,在精冲模具的加工制造优化、结构设计优化、涂层优化等方面进行了大量研究。随着精冲零件朝着高强度、增厚、与复杂形状方向发展,高端精冲模具对于所用高速钢的抗压强度、韧性与耐磨性提出了更高的要求。对于精冲模具用高速钢材料,精冲企业并没有最大限度地利用高性能的粉末冶金高速钢材料,尤其是目前高端精

学位

粉末冶金高速钢热处理碳化物力学性能显微组织热力学

m6A诱导的LncRNA-SNHG14通过调控CADM1启动子甲基化促进骨肉瘤进展的研究

第一部分骨肉瘤lncRNA表达谱分析和LncRNA-SNHG14在骨肉瘤中的表达及临床意义目的:利用lncRNA微阵列芯片技术,分析骨肉瘤lncRNA的表达谱,筛选出关键lncRNA并在骨肉瘤组织和细胞中进行验证,分析关键lncRNA的临床意义。方法:收集46对骨肉瘤组织和对应癌旁组织,随机选择其中6对进行lncRNA微阵列芯片检测,按照差异倍数>2.0且p值<0.05筛选出差异表达的lncRN

学位

骨肉瘤LncRNA表达谱lncRNA-SNHG14化疗敏感性转移预后增殖侵袭CADM1启动子甲基化STAT3信号通路m6A修饰RNA稳定

肺癌功能翻译后修饰的生物信息学分析

其他学术论文