论文部分内容阅读
人类移居高海拔地区一直是人类进化遗传学研究的热点。位于中亚地区的帕米尔高原(Pamirs),是喜马拉雅山脉、兴都库什山脉、天山山脉、喀喇昆仑山脉和昆仑山脉汇集形成的山结,平均海拔约2500-4000米,是著名的高原之一。帕米尔高原恶劣的生存环境(例如:低氧,低温,强紫外线)使得人类定居该地区面临着重大的挑战。由于采样困难等因素制约,该地区人群起源和迁移历史的研究基本处于空白。近20年来,线粒体DNA(mitochondrialDNA;mtDNA)成为研究中亚地区人群历史的重要分子标记。相关工作大大的促进了人们对该地区人群遗传多样性分布格局和群体历史的了解。但是绝大多数工作局限于mtDNA的某个片段(控制区或部分编码区),这些片段中有限的序列遗传信息并不能提供高分辨率的mtDNA谱系(Lineage)。一些研究中仅选取部分样本进行mtDNA基因组全序列测定。样本选择偏差使得相关数据并不适合开展群体历史的分析。为此,本研究运用基于Ion Torrent PGM平台的二代测序方法对帕米尔高原及其周围地区的8个群体共计382份样本进行了 mtDNA全序列测定,并开展了一系列群体遗传学分析。并揭示帕米尔高原人群族源迁移历史。mtDNA的遗传多样度分析表明中亚人群的遗传多样性指数与南亚人群(巴基斯坦旁遮普人群)和西亚人群(伊朗的卡什加人群和波斯人群)很相似。依据PhyloTree(Version 17),我们对所有的382份样本进行单倍型类群(haplogroup)划分。所有样本均能划分到典型的欧亚东部和欧亚西部单倍型类群下。没有发现位于M,N,R单倍型超类群(macrohaplogroup)基部的支系。这个结果表明中亚人群中没有检出现代人早期迁移遗留下的遗传信号;这提示中亚地区可能不是现代人早期迁移的主要路线。基于单倍型类群分布频率的主成分分析结果提示欧亚东部人群对讲突厥语的柯尔克孜族群体遗传贡献较大而讲印欧语的塔吉克族群体与欧亚西部人群遗传关系较近。然后,我们对群体mtDNA支系溯祖时间(coalescent time)进行了统计分析发现溯祖时间的分布存在一定的模式,所有的单倍型类群时间小于40kya,比人类第一次到达东亚的时间晚,由此推测中亚人群主要是由欧亚东部和欧亚西部人群混合而成的。96.07%的mtDNA支系的溯祖时间小于19kya(thousand years ago),也就是说人类移居帕米尔主要发生在末次盛冰期(LGM)之后。而在1-10kya10kya-19kya时间段内单倍型类群包含样本量的所占的比例分别是73.56%,22.51%。所以人类大量移居帕米尔集中发生在全新世(~10kya)以后。最后,我们对帕米尔人群进行了选择压力检测,发现除帕米尔人群基因COX2 N/S值(同义突变与非同义突变的之比)较低外三个人群之间无论是单个基因还是整个的mtDNA序列基因N/S值都不存在明显的差异性。表明帕米尔高原人群mtDNA世系没有经历达尔文正选择或是选择压力放松的作用。