群体连锁不平衡结构分析新算法开发及应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:sunzheng_1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
连锁不平衡(Linkagedisequilibrium,LD),即基因座之间的非随机关联,是描述动态变化过程中群体特征的主要指标之一,可反映群体历史、地理分化、繁殖方式、自然选择的历史等各方面信息。在随机交配群体中,LD受染色体长度和重组率等因素影响。当群体经历选择、分化或群体内部包含众多稀有变异时,会出现复杂的LD结构。在高通量测序时代,如何衡量群体内大尺度的LD结构一直被长期忽视,主要原因是高通量数据本身所带来的计算挑战。以样本量接近一千(n≈103)、分子标记数接近百万(m≈106)的重测序群体为例,基因组LD的计算复杂度为O(nm2),在常规计算资源下几乎无法实现,针对海量组学数据,现有LD算法亟待发展。鉴于此,本研究针对不同样本尺度的高通量测序数据发展了两种估算染色体水平LD的高效算法和配套分析软件,为海量数量群体多层面LD解析奠定了基础。算法Ⅰ直接构建个体间亲缘关系的遗传关联矩阵(Genetic relatedness matrix,GRM),通过解析方式将亲缘关系转化为分子标记间的LD,计算复杂度为O(n2m)—集中在GRM构建部分,适用于小群体高密度分子标记数据。算法Ⅱ针对样本量接近几十万的数据集,通过随机迹统计量避免了耗时的GRM构建,由迭代算法获取分子标记间LD,总体计算复杂度为O(nmB),其中B为迭代次数。重构了根井正利与李文雄的广义LD解析结构,模拟验证了两种算法有效性及群体结构与稀有多态位点等因素对群体LD结构的影响。在实例数据分析中,将算法Ⅰ和Ⅱ应用于25类参考群体(最大样本量不超过104)和英国生物样本库(UK Biobank,样本量约5 × 105)。模拟和实例分析揭示了群体结构、选择与稀有多态位点对群体LD结构影响;相比国际常用软件PLINK,两套算法在LD计算效率上提升了 3个(103)甚至更高数量级;针对异源六倍体小麦以及烟草群体分别揭示了各亚基因组间LD差异以及参考基因组差异对LD影响。新算法突破了现有方法无法分析大群体海量标记间平均LD的计算瓶颈,为研究基因组水平、染色体水平以及特定功能区段的LD结构奠定了基础。
其他文献
对来自云南、浙江和内蒙古的30属禾本科植物的1821株内生真菌,根据ITS r DNA系统发育分析和ITS预测真菌的阈值,将这些菌株鉴定为3门10纲34目216属,其中子囊菌门Ascomycota 5纲26目192属,担子菌门Basidiomycota 3纲6目21属,毛霉门Mucoromycota 2纲2目3属。粪壳菌纲Sordariomycetes和座囊菌纲Dothideomycetes为主要
学位
生物防治是保护农田生态环境、保证粮食供给安全和促进现代农业发展的重要植保手段。寄生蜂作为一种重要的天然生物防治资源,在自然环境中具有种类多、数量大、且寄生特性丰富多样等特点。寄生蜂产卵孵化后,幼虫通过取食寄主血淋巴等获取营养,以完成生长发育。目前,对于寄生蜂幼虫取食寄主行为直接相关的唾液及唾液腺的研究仍较为缺乏。麦蛾柔茧蜂(Habrobracon hebetor Say)属膜翅目茧蜂科,是一种外寄
学位
植物内生真菌是自然生态系统中植物根系微生物群落的重要组成部分,在促进植物营养吸收、生长发育、增强植物先天免疫和抵抗环境胁迫等方面发挥着重要作用。挖掘有益内生真菌资源,探索其在促进生长和免疫诱抗方面的功能,具有重要的科学意义。本研究通过微生物组学分析比较了疣粒野生稻、药用野生稻和普通野生稻之间的内生真菌生物多样性差异。并对野生稻根部内生真菌进行分离、纯化和鉴定,明确内生真菌分类地位及生物学功能,重点
学位
花境是以多年生观花植物为主营造的、近人尺度的植物造景形式,充分体现了丰富的植物色彩和多样性,近年来越来越多地应用于城市绿地。然而,国内花境设计与营建尚存在质量参差不齐的问题,针对花境色彩特征的景观评价研究较少,且多以定性分析和主观评价为主。本文以沪杭地区花境为例,通过问卷和面部表情识别技术获取公众的主观偏好和客观情感感知反馈,对花境色彩特征进行量化分析,并结合经典花境案例的配置手法,总结花境色彩设
学位
大丽轮枝菌引起的棉花黄萎病是棉花上危害最严重的病害之一,该病害在我国棉花产区广泛发生,其主要致病菌株为大丽轮枝菌落叶型株系。已有研究表明,大丽轮枝菌产生的N-乙酰乙醇胺类(NAEs)化合物NAE 12:0是引起棉花落叶的直接原因。本实验室前期研究发现,新种棉帚霉菌作为一个机会病原菌,与大丽轮枝菌共接种可增加病害严重度,并促进落叶,但致病机制尚不清楚。因此,本文通过分析棉帚霉菌代谢物,明确棉帚霉菌是
学位
春兰(Cymbidium goeringii)作为传统国兰五大类之一,栽培历史悠久,资源丰富,兼具审美、文化和经济价值,是中国传统十大名花之一。种子萌发困难、繁殖系数低、杂交育种周期长等问题一直制约着春兰的发展,近年来,野外挖掘采集也使春兰种质资源遭到破坏。‘虎蕊’为春兰珍品,屡次在兰展中获奖,目前未见对其进行组培研究的报道。针对以上问题,本研究以春兰‘虎蕊’自交后代根状茎为试验材料,运用植物组织
学位
高通量测序技术(High-Throughput Sequencing,HTS)已广泛应用于抗病基因研究、抗逆基因筛选以及作物新病毒种类鉴定等方面。基于第二代测序技术,结合RT-PCR、Rapid amplification of c DNA end(RACE)、测序分析等分子生物学实验与分析方法,通过对对百香果、鸢尾、二月兰、苦荬菜和细茎斑种草等5种植物上病毒进行了鉴定分析,检测到12种病毒。采用
学位
有关农药对虾类及其相关类群(如腹足类、水生维管植物、浮游植物和细菌等)种群动态方面影响的文献报道较少。本研究以掌肢新米虾Neocaridina palmata、泉膀胱螺Physa fontinalis、金鱼藻Ceratophyllum demersum、低额溞Simocephalus vetulus和中华薄壳介Dolerocypris sinensis等物种构建室内生态系统,研究单次施用吡螨胺对上
学位
柑桔原产于中国,栽培历史悠久。柑桔果实色泽是消费者最看重的品质之一,而类胡萝卜素是柑桔果皮颜色的主要贡献者。本文以浙江主栽品种‘椪柑’和果皮积累β-柠乌素的‘满头红’等13个柑桔品种为研究材料,探究叶黄素酯化基因和类胡萝卜素合成关键基因PSY1、CCD4b1在类胡萝卜素积累中的作用,主要结果如下:1.分析果实成熟期间和采后‘椪柑’的果皮、叶和花中叶黄素酯,发现处于转色期‘椪柑’果皮叶黄素酯化程度从
学位
假山以土、石为材料,尤以石为胜,是中国文人山水园的重要组成要素,是自然审美观念和山水意象再现的重要手段,体现了天人合一的意境。中国传统园林有“无园不石”之说。假山营建历史悠久,形成了独特的艺术特色与叠石技术,至清代叠石技艺更发展到了顶峰。杭州文澜阁假山修建于清乾隆年间,峰石顾盼生姿,空间旷奥有致,巧夺天工,属叠石精品,是杭州叠石工法研究的典型案例。因叠石假山使用自然石材,其形态各异,传统的测绘方法
学位