论文部分内容阅读
棉花是世界上重要的经济作物之一。经过长期的分类和进化研究,棉属包括5个四倍体棉种(AD1-AD5,2n=4×)和47个二倍体棉种(A-G组,加上K组,2n=2×),但四倍体棉的起源与进化仍存在争议。除了四个栽培棉(陆地棉、海岛棉、亚洲棉和草棉),占多数的野生棉为重要的种质资源,但缺少分子数据。目前,很多重要作物的叶绿体基因组全序列已经得到测定。本研究利用PCR法测定十个二倍体棉(A-G组)的叶绿体基因组全序列,并进行生物信息学分析,确定棉属DNA条形码,进行系统发育分析,揭示棉属的起源与进化。主要研究结果如下:1.测定和注释了覆盖七个染色体组的十个棉种叶绿体基因组全序列。生物信息学分析结果表明:棉属叶绿体基因组较为保守,大小为156,035bp-160,317bp;具有四个典型区域,LSC(55.33%)、SSC(12.65%)和两个IR(各16.01%);基因间区变异最大,是棉属叶绿体基因组长度差异的主要决定因子;含有113个不同基因,包括79个蛋白编码基因、30个tRNA和4个rRNA;新注释四个基因infA、ycf68、ORF42和ORF56;基因顺序与烟草叶绿体基因顺序一致,不存在重新排列;富含AT,平均为62.76%,密码子偏好A和T,尤其是密码子第三位,高达69.31%。这些数据的分析,完善了棉属叶绿体基因组信息,为棉属系统发育研究和叶绿体基因工程研究奠定了基础,加深了对野生棉的认识。2.四个区域边界的比对结果显示,确定rps19与trnH-GUG基因为叶绿体基因组进化的“足迹”,据此将叶绿体基因组分为N型和A型结构,其中阿非利加棉、亚洲棉、陆地棉和海岛棉同为N型。全序列比对结果显示,变异热点区域多为基因间区。筛选高变异序列并提议序列组合trnT-trnL+trnH-psbA为棉属DNA条形码,trnS-trnG序列为棉属候选DNA条形码,为棉种的分类和鉴别提供了新的技术手段。3.基于叶绿体基因组50个共同蛋白编码基因进行64个物种进行系统发育分析,确定棉属的进化位置,与同属于锦葵目的可可为姊妹关系。基于叶绿体基因组10个高变异序列对20个棉种进行系统发育分析,聚类结果与传统分类结果大体一致。分析结果显示:棉属的一支为澳洲棉种,另一支为美洲棉种,亚非棉种分散于两支中;各个染色体组棉种聚在一起,但比克氏棉(G1)处于C组中,支持“双系祖先”观点;A组与AD组亲缘关系近,确定四倍体棉的母本供体种为A组,父本供体种为D组;进一步分析研究确定亚洲棉的祖先种或近似种为四倍体棉的母本供体种,瑟伯氏棉的祖先种或近似种可能为四倍体棉的父本供体种;提议将阿非利加棉提升为种级分类阶元的棉种。基于叶绿体基因组序列的系统发育分析促进了物种起源与进化研究,为其他棉种的系统发育分析打下技术基础。