基于全基因组测序的杏核心SNP标记开发

被引量 : 0次 | 上传用户:gksword
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在杏全基因组测序和重测序的基础上,进行杏核心SNP标记的开发,为构建基于SNP标记技术的指纹图谱进行杏品种特异性和真实性鉴别具有重要意义,并为进一步开展重要性状的全基因组关联分析与基因挖掘奠定良好基础。以中国150个主栽杏品种为材料进行DNA文库构建,构建好的文库通过Illumina HiSeqTM PE150进行测序。对原始测序数据中包含的接头信息、低质量碱基、未测出的碱基进行过滤,最终得到有效数据。同时,Clean data与NCBI的核苷酸数据库进行比对,评估是否有其他来源的DNA污染。原始测序数据经过基本质控后,通过与参考基因组比对,进行变异检测及筛选;对BWA比对结果进行过滤,将比对到杏基因组上唯一位置的reads挑选出来进行后续分析;采用SAMTOOLS对过滤后的数据进行群体SNP的检测,利用ANNOVAR软件对SNP检测结果进行注释,进而进行核心SNP标记开发。对150个杏品种DNA样品进行建库,结果表明,平均每个个体的Raw data为4.02 G,总测序量为603.24 G,测序质量高(Q20≥90%,Q30≥85%),样本GC分布正常,建库测序成功。Reads与参考基因组比对结果表明,参考基因组大小为216 778 587 bp,分析的杏样本比对率在82%~93%之间,对参考基因组(排除N区)的平均覆盖深度在9~19之间,4X覆盖度(至少有4个碱基的覆盖)在72%以上。未过滤前,共检测到SNP 9 915 800个。以样品深度不低于6X、覆盖所有群体94%以上个体、位点基因频率MAF不低于0.2、多态性信息含量PIC值大于0.3、SNP位点位于基因上下游及基因内等条件对SNP分子标记进行筛选,符合上述条件的作为核心SNP,最终获得49 382个位点,其中位于基因内含子的22865个(46.30%),外显子的13834个(28.01%),基因上、下游的52个(25.58%),剪切位点的631个(0.11%)。SNP标记在染色体上均匀分布。
其他文献
我国专利无效诉讼中长期存在“循环诉讼”问题,导致涉案专利的权利状态长期处于不稳定状况。这种状况与我国当前大力推进知识产权战略大背景格格不入。有鉴于此,研究我国专利
<正>1.经济减速与宏观政策调控2.中国经济新常态的基本特征与理论依据3.能源、文通、环保等介格形成机制改革研究4.结构优化与经务发展质量5.长江经济带与中国经济区域协调发
地下连续墙施工技术直接影响着深基坑的使用性能及其施工质量。然而,由于现代深基坑建设数量不断增加,施工规模不断扩大,深基坑的施工工艺、施工技术以及施工结构都发生了很
沈绍功教授提出"序贯三步法"辨治内伤杂病即第一步开胃进食,主要有芳香开胃、健脾开胃、养阴开胃三法;第二步单元组合辨证法,虚证有气血阴阳四个基本虚证和五脏定位症,共九个
票制票价作为一项城市公共政策,是城市居民出行方式结构调节、城市轨道交通客流组织以及票务收入测算等工作的重要影响因素,更是城市轨道交通生存和发展的关键所在。文章梳理
市管县模式下,很容易发生县域经济体之间争夺经济发展资源的“排挤效应”,使得中国县域经济差异不断扩大。利用泰尔指数嵌套分解的结果显示,省直管县改革只能弱化但并不能消
分析了1975年2月4目辽宁海城地震后的熊岳、1976年4月6日内蒙和林格尔地震后的凉城、以及1976年7月28日唐山大震后的宝坻等震群活动的时空分布特点.由位错模式计算了大地震在
抗生素的广泛应用,临床上出现了大量的耐药菌株,给疾病的治疗带来了很多的困难。所以,临床上常见的耐药菌株现状如何,又是如何治疗,需要我们进一步研究、探讨。
2011年10月13日至14日,交通运输部在上海组织召开上海港外高桥港区六期工程竣工验收会。会议由交通运输部水运局局长宋德星主持。交通运输部副部长徐祖远、上海市副市长沈骏
目的探讨互联网+背景下混合式教学在实践教学中应用。方法选取本院2017年在乳腺外科规培的学生28例作为对照组,2018年在乳腺外科规培的学生28例作为观察组。观察组采用互联网