基于SSMD的异常基因表达识别及与SNP的关联研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:cwdsy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着第二代高通量测序技术发展及其测序成本的下降,使得从基因组、转录组及表观遗传组更细致全貌地分析人类疾病成为可能,这也大大推动了个性化精准医疗的发展进程。目前,全基因组关联研究(Genome Wide Association Study,GWAS)以单核苷酸多态性(Single Nucleotide Ploymorphsim, SNP)为生物标记,广泛应用于寻找与复杂疾病相关的遗传变异并取得了许多重要的进展。然而,GWAS分析结果并不能充分地解释复杂遗传性疾病,即存在遗传度不足问题(Missing Heritability Problem)。基因表达作为中间媒介表现型,已经成为连接SNP与疾病研究的重要桥梁,有助于更深入的解析个体之间表现型差异及提高其遗传解释度。  异常基因表达可能是复杂疾病发展过程中的致病基因,所以本文主要研究异常基因表达的识别及与SNP的关联。首先,本文提出了基于SSMD(Sum SquaredMahalanobis Distance)异常基因表达识别分析方法,可以有效识别人群中的异常基因表达及人群之间的差异基因表达。然后,基于异常基因表达分析结果,分别分析常见SNP及个人SNP与异常基因表达的关联,结果表明常见SNP不是影响异常基因表达主要原因,而个人SNP可能是导致基因异常表达。最后,为了验证罕见SNP对异常基因表达的作用及影响,本文结合无关联样本与家族样本,提出了个性化基因表达量估计流程,并分析及验证了家族特有SNP与异常基因表达的关联。本文主要研究内容及结果如下:  1.基于SSMD的异常基因表达识别及分析  基于马氏距离(Mahalanobis Distance,MD)提出了一种异常基因表达的分析方法。具体基于注释基因集,定义了统计量马氏距离平方和(Sum SquareMahalanobis Distance,SSMD),并通过置换检验来判别给定基因集是否容易异常表达。同理,本文还定义了diffSSMD用于检验基因集在不同种群样本之间是否差异表达。然后,通过将统计分析框架应用于自Geuvadis RNA-sequencing Project的462位无关联样本,识别出39个容易异常表达基因集、16个不易异常表达基因集以及235个欧洲人与非洲人之间差异表达的基因集。最后,通过统计功效分析验证了方法的有效性,并通过引入第三方研究数据进行了验证分析,证明了本文分析结果的可复现性及生物学意义。  2.单核苷酸多态性(SNP)与异常基因表达关联分析  基于基因异常表达分析结果,分别从遗传度、双胞胎研究及单细胞水平三个角度解析了遗传与非遗传因素对异常基因表达的影响。然后,基于卡方图判别出了异常表达基因集下显著异常个体;接着,提出了基因型加权的个人eQTL作用大小的衡量指标,用于比较显著异常个体与非显著异常个体之间常见SNP对异常表达基因集的作用,结果表明常见SNP不是基因异常表达的主要原因。最后,基于现有DNA功能调控区注释,本文发现个人SNP更显著富集在异常表达基因的功能调控区(增强子与启动子区域),可能是导致异常基因表达重要原因。  3.家族特有SNP与异常基因表达关联及验证分析  基于无关联样本及家族样本的基因组信息分别了重建了个人基因组,并基于个人基因组重新进行序列比对及基因表达量估计,提高了基因表达估计的准确性。然后,分别基于单个基因、成对基因及基因集判别出显著异常基因表达个体,并筛选出了家族成员异常个体富集的基因或基因集。接着,定义了家族特有SNPs,并对其进行分类注释,有助于解释SNPs如何影响基因异常表达。最后,通过家族成员异常个体分布与家族特有SNPs基因型分布的匹配分析,进一步验证了罕见SNPs对异常基因表达的作用及影响。  基于本文提出的分析方法及流程,一方面有助于更全面的识别异常基因表达,另一方面有助于研究者发现罕见或个人SNP对异常基因表达的影响,从而促进从基因表达及遗传变异水平来更全面地解析不同个体之间的显著差异,有助于精确寻找致病基因及遗传变异,推动个性化基因诊断及分析的模式。
其他文献
近几年,随着我国高校招生规模的不断扩大,毕业生的数量急剧增长。据统计,1995年高校毕业生为80万,突破以往一直徘徊的60万;1999年毕业生人数首次突破100万;2001年为115万;2004年毕业生人数达到280万;而2005年毕业生人数上升至338万。这一系列的数字表明,我国高等教育由“精英化教育”向“大众化教育”的转变。就业形势越来越严峻,就业压力也越来越大。大规模的毕业生涌向社会,也意味
自20世纪90年代初到现在,随着计算机网络的飞速发展,在享受计算机网络无穷便利的同时,网络安全问题也日益突出。黑客攻击和网络病毒事件层出不穷,对网络安全的威胁越来越大。
现代远程教育是现有教育体系中最能适应这一时代要求的。中国的现代远程教育刚刚起步,我们的学生和教师对此还比较陌生,还习惯于上课的铃声,教室的桌椅、板凳和黑板,因此教师与学生如何尽快适应远程教育这一新型教育模式,是现代远程教育得以迅速健康发展的前提。    现代远程教学模式的特征    (一)教学媒体的优化组合和综合运用   现代教学媒体的现代化和多元化及其优化组合和综合运用,即文字、卫星电视、音像教
近几年来,随着我国高等教育的快速发展,高校教师队伍不断扩大,青年教师的比例也在迅速攀升。但是,由于种种原因,高校青年教师面临着来自社会各方的巨大压力,给青年教师的自身成长和学校工作带来了负面影响。这一问题能否引起高度重视并得到妥善解决,将直接影响到高校办学质量和高等教育事业未来发展。    高校青年教师心理压力的来源及其影响    (一)社会因素  当今世界,人类社会已开始步入一个科技高新化、信息
当代大学生的成长背景    出生于上个世纪80年代的当代大学生总体上是一群伴随着改革开放的步伐、伴随着国家现代化进程,伴随着电视、电脑、网络成长起来的“新新人类”[1]。他们在成长的背景、教育的环境、学习的经历等方面均有着鲜明的时代性,体现出独有的特征。    1.成长的背景  我国的改革开放促进了经济的腾飞和东西文化的交融,先进的科技产品最先惠及当代大学生这一批人,他们相对于父辈们更加“见多识广
工业以太网在工业控制领域迅速发展,为了降低工业以太网成本、提高效益,本文采用引脚少、体积小且高效的以太网控制器ENC28J60设计工业以太网节点。在工业以太网系统正常工作
21 世纪是知识经济时代,知识经济时代的竞争是人才的竞争,人才的竞争关键是创新精神和创新能力的竞争。创新是指“主体(人)为了一定的目的,遵循事物发展的规律,对事物的整体或其中的某些部分进行变革,从而使其得以更新与发展的活动”。大学肩负着国家知识创新和技术创新的重任,大学教育应以“创新”为首要理念,注重学生创新精神、创新能力、创新人格的培养,以造就大批高层次、高素质的创新人才[1]。  高校应在市场