基于高通量测序数据的基因表达水平预测方法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:lhawk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
组蛋白修饰是生物体中普遍存在的一种现象,能够以不同的调控方式影响基因表达,且随着高通量测序技术的高速发展,大量的测序数据使得探究组蛋白修饰信号与基因表达水平之间的内在联系成为可能。组蛋白修饰通过改变DNA的空间结构或提供特异性的结合表面影响基因表达,研究组蛋白修饰对于加深对遗传物质表达方式的理解至关重要。本文以人体GM12878细胞系的十种组蛋白修饰数据以及基因表达数据为对象,基于统计学方法进行分析研究,主要包括以下四方面工作:(1)根据基因位点信息,定位并提取出组蛋白修饰数据中基因特定位点的特征信息,构建设计矩阵。以100bp为一个特征提取长度,结合基因在染色体上的位点信息,提取每个基因转录起始位点前4kbp和转录终止位点后4kbp的组蛋白修饰特征值。将组蛋白修饰特征数据与基因表达数据合并,为后续的进一步分析和处理做好铺垫。(2)基于相关系数、层次聚类方法,分析不同组蛋白修饰之间以及组蛋白修饰和基因表达水平之间的联系,以寻找组蛋白修饰潜在关联。首先对组蛋白修饰特征进行相关性分析,以发现不同组蛋白修饰之间存在的强相关性;接着分析了组蛋白修饰特征与基因表达水平之间的相关性,寻找强相关性变量,为后续建模分析做铺垫。最后通过层次聚类,寻找特征相近的组蛋白修饰信号,进一步明确这十种组蛋白修饰的组合模式。(3)基于支持向量机构建基因表达水平高低的分类模型。结合先前的相关性分析,构建了单一特征的组蛋白修饰预测基因表达水平高低的模型,并对模型性能进行评估;为进一步优化模型的分类效果,构建了一个更加全面的分类模型。(4)基于广义线性模型和主从模型,构建高精度的基因表达值预测模型。本次研究结合了响应变量数据中零膨胀的特点,提出了一种基于广义线性模型的主从模型,对基因表达值进行回归分析,与现有的多种回归算法进行对比,验证所提方法的有效性。本文基于GM12878细胞系的组蛋白修饰特征数据和基因表达数据,深入分析了两组数据之间的潜在联系,侧重于预测基因表达水平的模型构建。探究了十种组蛋白修饰中与基因表达强相关的特征,并构建了有力的分类器对基因表达水平的高低进行分类。并且充分考虑响应变量的特点,提出了具有高精度的基因表达水平值的回归模型,对研究者们进一步明确组蛋白修饰在调控基因表达过程中发挥的作用具有较大帮助。
其他文献
生长素抑制蛋白基因(Auxin repressed protein gene,ARP)受到生长素(IAA)信号抑制表达,在植物的生长、发育、抗病、抗逆以及种子休眠等过程中发挥重要的作用。但有关水稻生长素抑制基因OsARP1的研究,目前还没见报道。本文采用基因过表达和CRISPR/Cas9基因敲除转基因技术,创建水稻OsARP1基因过表达及其启动子和外显子敲除转基因植株,研究这些转基因植株在种子萌发
《普通高中生物学课程标准(2017年版)》强调了对学生进行学科核心素养的培养,挖掘了核心素养的构成元素,明确了教学目标要定位于学科核心素养的新要求。为了落实核心素养教育的要求,需要从课程教学设计出发,要求课程教学的设计不能单单是某一个孤立的章节,而是注重知识的整体性和逻辑性,围绕某一个具体的主题,实现知识之间的重组,构成一个课程单元;再者,从学习方式出发,教学目标的转变也意味着学习方式要发生转变,
离散型数据包括标称型与计数型数据,是数据科学与人工智能领域中重要的数据类型。离散型数据作为输入构建回归模型,面临着将离散输入值映射到连续输出值上的问题。本研究基于
目的:1.探讨青年胃癌和中老年胃癌患者临床及病理特点的差异,以及能谱CT多参数值与差异性因素的关系。2.基于多因素分析结果,分别建立诊断青年胃癌及中老年胃癌患者的风险预
西瓜(Citrullus lanatus)起源于热带地区,是葫芦科的一种重要园艺作物。西瓜在冬季和早春设施栽培时常遭遇低温伤害,不仅造成西瓜减产,也影响西瓜的风味品质。低温胁迫影响植物细胞氧化还原(redox)状态的平衡,其中硫氧还蛋白(Thioredoxins,TRXs)是细胞redox系统的重要组分。TRXs广泛参与植物对外界环境胁迫的应答,但是关于TRXs在低温胁迫下响应机制的相关报道还比较
本报告从释意理论意义单位角度,就笔者在“新时代背景下的翻译教育—教学、科研和实践创新”国际学术研讨会中两场同传表现进行分析。释意理论认为翻译即释意,是译者通过语言
目的:探讨18F-FDG PET/CT多参数在诊断非小细胞肺癌(NSCLC)纵隔淋巴结良恶性中的价值。方法:回顾性分析2013年7月至2019年12月间因肺内占位或纵隔淋巴结肿大于河北省人民医院核
剪切板阻尼器具有构造简单、初始刚度大、滞回曲线饱满、耗能稳定等优点,是理想的耗能减震元件。为了充分利用低屈服点钢材的延展性,改进传统剪切板阻尼器的减震行为,本文提
“犯罪资产分享”是国际追赃过程中一种非常重要的国际合作机制,它能极大地调动请求国提供刑事司法协助的积极性,进而促进资产境外追缴工作的顺利开展。近年来,随着境外追赃
自二十世纪现代艺术运动兴起以来,艺术家们在追求革新反对传统甚至挑战权威的影响下发起了达达主义、欧普艺术、波普艺术等诸多艺术流派,在广泛运用大众传播媒介和其他因素作