基于小波变换表观基因组分析方法的研究

被引量 : 0次 | 上传用户:uilyz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
表观遗传学作为一门新兴的遗传学分支学科近年来越来越受到科学界的关注。表观遗传学是与传统的遗传学相对应的。传统的遗传学研究基因序列发生改变时基因表达水平发生的变化,如基因突变、基因丢失等。而表观遗传学则主要研究基因序列不发生改变的情况下基因表达水平发生的变化,如DNA甲基化、RNA干扰、组织蛋白修饰等。DNA元件百科全书计划(ENCODE)是由美国国立人类基因组研究所(NHGRI)发起的,并由世界上多个国家参与的重大国际合作项目。ENCODE计划目前获得的大量数据以连续的形式存在于多种基因组区间内,但它们之间的相互作用关系在很大程度上仍是未知的,因此迫切需要定量评价不同类型ENCODE数据间相互作用关系的计算方法。目前主要缺少分析表观基因组数据的有效方法,缺少整合基因组与表观基因组的合理策略,并缺少研究与疾病关联作用的分析手段。我们希望能够提出一种全新的方法,可以在不同尺度的情况下对表观遗传数据进行处理,从一种全新的角度对不同类型的ENCODE数据间的相互作用关系进行研究,小波变换可以对表观遗传组信号进行多尺度分解和去噪,观察不同尺度下的数据特征。应用小波变换方式处理不同尺度及分辨率的数据,即通过大“窗口”(大尺度)信号观测总体功能,而通过小“窗口”(小尺度)信号发现细小特征。形象的说,小波变换分析的结果既可以帮助我们看见森林又能见到树木。小波变换作为一种经典的数学工具,能够对信号进行降噪处理。在对信号进行多尺度分析时,能够保持信号原有的性质,并且展现信号在不同尺度下的特征,适合在变尺度条件下观察表观基因组的调控机理和染色质的功能域结构。本文基于小波变换提出了一种全新的表观基因组分析方法,可以在不同的尺度下处理表观遗传信号,对表观遗传信息的相关性进行检验,并重新识别染色质功能域。通过该分析方法可以对表观基因组进行多尺度分析,并从组蛋白修饰的角度研究染色质结构与功能,解读表观图谱。研究结果表明,该方法适用于分析不同实验数据类型间相互作用关系以及识别人类基因组功能域及功能元件。本研究具体针对多尺度连续高密度的表观基因组数据集,应用小波相关性分析方法(WCO)研究了表观遗传基因组数据集间的相关性,并进行了可视化、定量化及确定化的统计学分析。具体研究工作是:(1)对小波相关性进行正式的统讦学测试,验证应用WCO方法分析组蛋白修饰的数据是否恰当。(2)描述(各细胞系间)组蛋白修饰和(各组蛋白修饰的)细胞系间的小波相关模式,并评价与组蛋白修饰如何密切相关。(3)探索激活和抑制状态下修饰作用的小波相关,并识别ENCODE试点区间的二价染色质功能域。我们选用的原始数据是44个ENCODE试点区,包括从500kbp至2Mbp大小不等的14个区域和30个500kbp的区域。主要从四个方面进行小波相关分析。(1)对单一ENCODE试点区ENm004内GM06990细胞系中9个组蛋白修饰的小波相关进行了检测。我们首先在16kbp尺度下对各个组蛋白修饰对的小波相关性进行分析。然后在8kbp、32kbp和64kbp尺度下对H3K4me2和H3K4me3的小波相关分析进行研究。接着又在8kbp、32kbp和64kbp尺度下对各个组蛋白修饰对的平滑相关分布进行分析。(2)将初步观察扩展至其他ENCODE试点区,对其他43个ENCODE试点区也进行了相同的检测。我们首先在16kbp尺度下对GM06990细胞系中44个ENCODE试点区的H3K4me2和H3K4me3的小波相干分布进行分析。接着研究在8kbp、32kbp和64kbp尺度下44个ENCODE试点区H3K4me2和H3K4me3的小波相关分布。然在多尺度下分析GM06990细胞系中全部组蛋白修饰对的平均小波相关性。并对特定区域的F统计量的平滑分布,基因密度的F统计量的平滑分布和保守序列的F统计量的平滑分布进行了统计分析。在16kbp的尺度下,我们从小波相关曲线、多尺度平滑相关分布和信号相关分布三方面对HeLa-S3细胞系ENm004试点区中H3K4me2和H3K4me3的小波相关分析结果进行研究。并在同一尺度下对HeLa-S3细胞系中44个ENCODE试点区内组蛋白乙酰化与H3K4甲基化的小波相关分布进行数理统计。(3)对GM06990和HeLa-S3细胞系中组蛋白乙酰化和H3K4甲基化进行了分析。在尺度为16kbp下,我们从小波相关曲线、多尺度平滑相关分布、尺度为16kbp时信号相关分布三方面对在细胞系GM06990和HeLa-S3中H3K4me3的小波相关分析结果进行研究。并在16kbp尺度下,对GM06990和HeLa-S3中44个ENCODE试点区的组蛋白乙酰化与H3K4甲基化的小波相关分布进行了研究(4)通过检测5%的显著性水平下某些ENCODE试点区,识别了H3K4me3和H3K27me3信号的共同位点,并研究了H3K4me3和H3K27me3的bivalent区域小波相关性。我们对GM06990激活态和抑制态修饰重叠区的bivalent区域进行了分析,检测了所有ENCODE试点区bivalent区域。经仔细检查发现,间隔区内的43个二价染色体域远离上游和下游基因,这说明我们所分析的这些二价染色体域很可能大量存在于人类基因组中。通过上述分析发现,组蛋白之间在不同的试点区及细胞系间的相关性具有一定的相似性,有的组蛋白修饰对在不同的细胞系下表现出了高度小波相关性的程度,我们在分析各ENCODE试验区组蛋白修饰的小波相关时发现,同区域的两个标记富集表现一致时,可出现高度的小波相关,这些都多尺度ENCODE试点区的基因组分布模式密切相关.识别出的小波相关模式可检验那些用于解释组蛋白修饰功能的各种模型,如组蛋白编码、信号网络和电荷中和模型。这一发现可能有助于确证多种表观遗传学假说。另外,通过小波相关来分析激活和抑制状态下的修饰作用显示,上述数据分析方法适用于重新识别二价染色质功能域,广泛适用于探索不同实验数据类型间相互作用关系以及识别人类基因组功能域及功能元件。
其他文献
自然灾害风险研究是当前国际科学前沿问题之一.通过分析国内外自然灾害风险研究成果,结合全球变化与快速城市化发展趋势,构建了自然灾害与风险的理论关系及其演化模型.在此基
生产者责任延伸制度的政策体系是保障生产者履行其强制性延伸义务的必要条件,也是保障我国生产者责任延伸制度高效运行的重要前提。为解决我国日益严峻的废弃物污染问题,按照生
理解TRIPS协定第三十九条第三款中未披露试验数据的反不正当竞争保护,需要正确分析该条款与第三十九条第一款中援引的《巴黎公约》第十条之二的关系。第三十九条第三款既有其
目的建立同时测定九制大黄丸中芦荟大黄素、大黄酸、大黄素、大黄酚、大黄素甲醚含量的高效液相色谱(HPLC)法。方法色谱柱为C18柱(250 mm×4.6 mm,5μm),流动相为甲醇-0.1%磷
在全球经济一体化的今天,特别是我国加入WTO之后,中国作为世界工厂的职能越来越突显,尤其是在电子产品生产领域,中国凭借其丰富的廉价劳动力、广阔的地域与巨大的市场已经成
作为高级的生产要素,技术标准已经成为企业开展市场竞争的有效工具、国家实施产业竞争的必要条件,对我国的国际竞争力会产生直接的影响。随着国际分工的深化和科技创新步伐的
<正> 我国古代劳动人民对大豆的加工利用富有成效,豆鼓是重要的一种大豆制品。本文对我国古代豆鼓的生产技术和加工工艺进行了初步的探究。 一、豆鼓的起源 豆鼓的起源较早,
随着汉语国际教育在海外的不断深入和拓展,各国的汉语教育都在如火如荼地开展中。由于各国的语言政策和教育政策不尽相同,汉语国际教育在教学各方面呈现了国别化的特点。正是
美国的农业主要由家庭农场来经营,经历了150多年的发展历程,目前美国共有农场219.6万多个,其中,家庭农场214.3万个;非家庭农场(主要是合伙农场、公司农场)5.34万个。美国家庭
中小企业的发展极大推动了我国经济进步,但其融资境况与其贡献却很不相称,虽然近年来我国政府在财政政策上给予了中小企业倾斜,但是难以满足中小企业因急速发展而带来的巨大