甲基化相关区块的癌症分子靶标研究

来源 :华中农业大学 | 被引量 : 0次 | 上传用户:zhshgu1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DNA的胞嘧啶-磷酸-鸟嘌呤(CpG)位点的甲基化与基因表达调控、细胞通路激活、个体发育、疾病进展有密切的关系。如何对大量的CpG甲基化位点进行分析、建立可信DNA甲基化与细胞调控关系等问题仍堪待解决。临近的DNA甲基化CpG位点通常具有一定的相关性,并可以藉此形成一个大的DNA甲基化相关性区块(methylation correlated block,MCB)。MCB可用于泛癌数据的分类建模,但目前缺乏MCB的综合研究和分析软件。因此,本研究旨在以MCB为研究对象,对其整体分布、建模、预测能力等进行综合分析并建立相应分析流程、软件和数据库。首先,使用相关性分析算法对癌症甲基化高通量数据集中临近的CpG位点进行了分析。对获得的MCB进行了CpG数量、序列长度、染色体位置、DNA甲基化变化程度之间的关联分析,显示MCB的长度、所含CpG数量具有一定的染色体偏好性。此外,基因组中的甲基化水平的分布呈现多个波峰和波谷,在这些位置甲基化水平的变化程度最为剧烈。通过对MCB与基因的关联分析,获得了MCB在基因的上游、内部和下游的分布,并对MCB对基因表达的调控模式进行了分类分析。这些模式可以分成4大类:正调控、负调控、邻近双向调控、远端双向调控。结果显示,基因调控模式以负调控为主,正调控为辅,分别占据68.35%和19.24%。在负调控中,主要的负调控模式是单一区域的负调控。邻近双向调控和远端双向调控的模式类型较多,但占比较少,仅占总体结果的7.76%和4.65%。同时,空间临近的DNA区域在甲基化酶催化的过程中,可能会趋于共甲基化。MCB区域是甲基化高相关性区域,通过MCB与三维基因组的关联分析发现MCB主要分布在DNA的拓扑结构区域中,在染色质环区域,MCB之间的相关性明显高于一般区域。说明MCB与基因组空间结构具有密切的关系。其次,针对MCB的组间差异分析和生存分析,本文分别提出了吸引子模型框架和权重集成模型。吸引子框架整合了MCB内CpG位点和MCB与整体分布之间的变化信息,并据此作为鉴定MCB组间差异的依据。在吸引子框架下,我们使用了不同的子模型,并依据不同的子模型搭配模式分别鉴定了不同的差异MCB,根据建立的差异MCB列表,分别建立癌症的分类模型。结果表明,使用贝叶斯方法作为初级模型、Kolmogorov-Smirnov检验作为单一MCB与整体分布的检验方法,可以获得最佳模型结果。分类能力较好的模型的受试者操作特征曲线的曲线下面积(AUC)的平均值在0.90左右。针对MCB的预后生存分析,本文提出了权重集成模型,该模型综合了Cox模型、弹性网络回归、支持向量回归、迭代回归模型四种不同的生存回归分析的基础模型,并在此基础上引入二级模型(权重集成模型)。该集成模型对生存预测具有一定的提升能力。基于泛癌数据库和MCB,我们对多种癌症类型进行了分别建模和预测,并获得了具有一定预后预测能力(测试集AUC值为0.70左右)的模型。最后,通过分析泛癌预后相关MCB与基因,结合集成网络细胞标记数据库的基因表达反转分析,鉴定了少量与癌症预后相关的具有潜在基因调控活性的化合物,这些化合物可能具有抑制癌基因表达或者促进抑癌基因基因表达的潜力。总之,本文以MCB为研究对象,基于泛癌数据库对MCB进行了系统的分析,获得了MCB的基因组特征、发现了一系列新的MCB对基因表达的调控模式,探索了MCB与三维基因组的关系,预测了一系列具有基因反转能力的化合物。针对预后相关MCB,提出了权重集成模型,进行了预后分析建模。针对MCB的组间差异,提出了吸引子框架,并分析了该框架的统计效能。进一步基于分析结果,开发了可以快速分析MCB组间差异和生存期的R语言软件包En MCB,以及可以快速查询MCB相关结果信息的数据库应用。
其他文献
快速的人口增长和不断变化的消费偏好使水稻成为科特迪瓦粮食安全的战略作物。除了提供食物外,水稻生产活动还为在水稻价值链中的农村家庭创造了可靠的就业机会和收入,从而改善他们的生活。然而,在科特迪瓦,水稻供应并没有跟上需求的步伐。水稻产量低于国内的消费需求。2007-2008年全球粮食危机造成的经济影响和社会动荡表明了在国家经济和家庭食物篮中的重要性。这场粮食危机给我们敲响了警钟,要求制定紧急政策以确保
学位
近年来,淡水生态系统遭受着生物多样性下降和生态系统功能衰减的威胁。研究表明农药是对淡水生态系统破坏最为严重的污染物之一,其对淡水生物群落的危害在国际环境科学领域受到极大关注。淡水生态系统中,区域内高风险农药的筛选和识别仍然缺乏有效的方法,自然条件下农药污染对水生生物种群水平危害的相关研究鲜有报道。本课题组先前的研究发现,2020年夏季梁子湖中的农药污染可能是导致浮游动物群落丰度下降的原因。因此,本
学位
茉莉酸(JA,jasmonate acid)促进块茎起始和膨大进而影响影响块茎形成;此外,茉莉酸在热胁迫和干旱胁迫下的调控作用在不同作物中均有报道。然而,JA在马铃薯块茎发育和株型调控中的信号动态和潜在功能、以及在高温和干旱胁迫下的反应仍不清楚。本研究通过过表达茉莉酸信号转导核心负调控因子St JAZ1-like基因,阐明了马铃薯块茎发育过程中JA信号的时空动态、生理和分子调控网络,以及JA信号参
学位
目前的研究显示硬骨鱼类的干扰素(interferon,IFN)包括Ⅰ型、Ⅱ型和Ⅳ型IFN,其中Ⅰ型IFN可分为三组(group),并进一步分为七个亚组(subgroup),IFNa、IFNd、IFNe和IFNh为第一组,IFNb和IFNc为第二组,IFNf为第三组,而鱼类的Ⅱ型IFN则有两个成员,IFN-γ和IFN-γrel。本研究在乌鳢中鉴定了 4个Ⅰ型IFN基因,分别为IFNc、IFNd1、I
学位
硬骨鱼类作为终身生活在水体中较为原始的脊椎动物,在数以亿年计的时间里逐渐演化出一套完整有效的免疫系统来防御不同水生病原的入侵。B细胞作为硬骨鱼类获得性免疫中的主要效应细胞,其分泌的抗体可以靶向病原分子来促进机体对病原菌的清除。然而,现有研究主要将硬骨鱼类B细胞作为抗体分泌细胞(antibody-secreting cell,ASC)这一整体类型,很少深入研究硬骨鱼类B细胞不同亚群的表型和功能,而对
学位
基于光催化的高级氧化技术可以直接利用太阳光的能量,诱导产生种类众多、数量庞大的活性氧物种(ROS)参与有机污染物降解,被认为是环境污染控制和食品安全保障方面极具潜力的技术手段之一。实现ROS的光化学诱导增强和精准调控对促进有机污染物的高效降解意义重大。虽然众多研究者在ROS光催化调控和相关机理研究方面做出了大量的工作,但目前ROS光催化产生效率依然有待提高。此外,光催化诱导ROS的产生往往是多途径
学位
近年来研究发现,母本染色质和父本染色质在某些基因组位置上表现出差异,然而这种结构上的等位效应与等位基因表达之间的关系尚不明确。将体细胞核移入去核卵母细胞,体细胞经过重编程(Reprogramming)恢复到全能性状态,并且最终发育为新个体的技术称为体细胞核移植技术(Somatic Cell Nuclear Transfer,SCNT)。然而在体细胞核移植重编程中染色质高阶结构及其等位效应所发挥的作
学位
真核生物染色质的转录与复制需要特定的顺式调控元件与反式作用因子的组合调控。同时,反式作用因子只能结合在染色质折叠程度低的、无核小体区域,这部分区域被称为染色质开放区域(open chromatin region,简称OCR)或者染色质可及性区域(chromatin accessible region)。作为一个富含调控元件的重要结构特征,OCR对于理解基因组的转录调控机制具有重要的研究意义。近些年
学位
豆科植物(legumes)能够与根瘤菌(rhizobia)特异性识别形成根瘤(nodule),在这一过程中,植物为根瘤菌提供所需的营养物质,而根瘤菌则发挥其固氮功能将大气中的氮气(N2)转换成氨(NH3),供给植物生长利用,二者互利共生。共生固氮(symbiotic nitrogen fixation)被视为是目前最环保且高效的固氮方式之一,全球生物固氮总量的60%以上来源于共生固氮。因此,通过研
学位
植物分生组织是一组具有自我更新能力的功能干细胞,并且能够以特定的模式产生侧生器官。分生组织的特性(identity)和确定性(determinacy)对植株的形态建成和花器官发育至关重要。本课题组鉴定到一个玉米MADS-box家族基因ZmMADS8,通过转基因家系创制及其遗传分析和表型鉴定,旨在解析ZmMADS8在玉米花序形态建成、小花发育、籽粒蛋白和淀粉合成中的生物功能与调控途径,为该基因的育种
学位