论文部分内容阅读
目的:2型糖尿病(Type 2 diabetes,T2D)是一种代谢性疾病,主要临床表现是胰岛素抵抗和高血糖。前期研究发现,T2D的发生发展与肠道菌群关系密切。本研究在前期16S高通量测序基础上通过宏基因组技术进一步探讨T2D患者肠道菌群结构与功能变化。方法:通过倾向性评分匹配法(Propensity Score Matching,PSM)从总计入组的133例样本中筛选出19例样本,其中未患糖尿病(nondiabetic,ND)样本11例,T2D样本8例进行宏基因组测序。对测序得到的高质量序列进行物种分析,得到物种丰度注释信息。之后通过kraken和calypso进行物种丰度分布和进化关系的可视化;在物种α多样性、β多样性分析、肠型分析基础上,通过R语言的DESeq2包和LEfSe分析对物种差异进行分析,筛选出候选生物标志菌群,再通过R语言的bnlearn包、igraph包和Cytosc ape软件构建贝叶斯网络进行相关性分析,从而筛选出T2D的生物标志菌群。同时通过IDBA-UD软件将高质量数据进行拼接组装,使用CD-HIT软件构建非冗余基因集,SOAPalign序列比对软件将得到的高质量序列与所构建的非冗余基因集进行比对,获得基因丰度信息后,使用BLASTP软件将基因丰度信息与NR和SwissProt数据库比对,获得蛋白丰度注释信息;与COG数据库进行比对,获得蛋白簇丰度信息;与KEGG数据库进行比对,获得代谢通路信息。最后使用Blast2GO将NR数据库注释结果转化为GO注释结果,得到基因功能信息;利用STAMP软件进行组间差异分析,比较两组蛋白丰度、基因功能和代谢通路的差异。结果:样本的初始数据共获得329,796,471条Clean Reads,每个样本平均有 17,357,709 条 Clean Reads,最少 Reads 数为 14,397,776,最大 Read s数为20,839,579。ND组共有1,568个物种,T2D组共有1,532个物种。两组样本共有物种为1,456个,ND组特有物种为112个,T2D组特有物种为76个。从总体上看,在门水平上拟杆菌门(Bacteroidetes)和厚壁菌门(Firmi cutes)是丰度较高的优势菌群,在属水平上拟杆菌属(Bacteroides)、真杆菌属(Eubacterium)和埃希氏菌属(Escherichia)是优势物种,在种水平上Bacteroides vulgatus、Bacteroidesxylanisolvens 和 Bacteroidesfragilis 是优势物种。T2D组和ND组的α多样性不具有显著差异,而两组的β多样性分析具有显著差异。肠型分析结果显示两组样本均富集于ETB和ETF两种肠型中。属水平上组间差异物种共有15个,其中,在T2D组显著上调的有6 个,分别为 Veillonella、Escherichia、Salmonella、Cronobacter、Roseburia和Shigella;在T2D组显著下调的有5个,分别为Megamonas、Eggerthella、Riemerella、Prevotella和Haemophilus。在种水平标志菌群有20种。其中,T2D 组标志菌群为Veillonellaparvula、CandidatusProtochlamydiaamoebo phila、ShewanellaspMR4、Acidiphiliummultivorum、Sulfurospirillumdel eyianum、Helicobacter-bizzozeronii、CandidatusHamiltonelladefensa、Lept ospiraborgpetersenii、MycobacteriumspJLS、Haloquadratumwalsbyi、My coplasmaparvum、Pseudomonassavastanoi。ND标志菌群为NitrosomonasspAL212、Blattabacteriumpunctulatus、Riemerellaanatipestifer、Eggerthel lalenta、Burkholderiamallei、Prevotellaruminicola、Megamonashyperme gale、Eubacteriumrectale。通过贝叶斯网络相关性分析,我们最终确定与T 2D关系最密切的标志菌群有6种。在T2D组丰度上调的为Sulfurospirillumdeleyianum、Leptospiraborgpetersenii、MycobacteriumspJLS;丰度下调的为 NitrosomonasspAL212、Megamonashypermegale、Eubacteriumrecta le。Clean Reads拼接组装共产生了 1,327,642条Contigs,总长度为3,004,864,358 bp。根据90%的相似性和90%的覆盖度,去除冗余基因,最终得到基因总数为1,441,752,总长度为1,103,955,951bp的非冗余基因集。ND组共有1,243,823个基因,T2D组共有1,229,591个基因。两组样本共有基因为1,035,521个,ND组特有基因为208,302个,T2D组特有基因为194,070个。从总体上看,样本中相对丰度较高的几种蛋白为TonB依赖性受体SusC(T onB-dependent receptor SusC)、β-半乳糖苷酶(Beta-galactosidase)、酪氨酸重组酶(Tyrosine recombinase XerC)、组氨酸激酶TodS传感器(Sen sor histidine kinase TodS)。丰度较高的COG功能为复制,重组和修复([L]Replication,recombination and repair)、碳水化合物转运和代谢([G]Car bohydrate transport and metabolism)。主要的 GO 功能为 ATP 结合(ATP b inding)、DNA 结合(DNA binding)、细胞质的合成(cytoplasm)。主要的一级代谢通路为新陈代谢(Metabolism)和遗传信息处理(Genetic Infor mation Processing)通路。主要的次级代谢通路为氨基酸的生物合成(Bios ynthesis of amino acids)、碳代谢(Carbon metabolism)和 ABC 膜转运(A BC transporters)通路。组间差异蛋白共有10种,其中脂肪酸合成酶β亚基(Fatty acid synthase subunit beta)、转录调节蛋白 SrrA(Transcriptional regulatory protein SrrA)、未知蛋白 MJ0165(Uncharacterized protein MJO 165)、木酮糖激酶(Xylulose kinase)、30S 核糖体蛋白 S8(30S ribosom al protein S8)、类原噬菌体 FluMu 蛋白 C(Mu-like prophage FluMu prot ein C)、次黄嘌呤-鸟嘌呤磷酸核糖转移酶(Hypoxanthine-guanine phospho ribosyltransferase)、SPBc2 噬菌体衍生的未鉴定蛋白 YomE(SPBc2 propha ge-derived uncharacterized protein YomE)、糖基转移酶 AglJ(Glycosyltran sferase AglJ)等蛋白丰度在T2D组中显著升高,Ω酰胺酶NIT2-B(Omeg a-amidase NIT2-B)的丰度显著下降。差异功能基因共有10种,其中脂蛋白生物合成过程(lipoprotein biosynthetic process)、二肽酶活性(dipeptid ase activity)、二肽基肽酶活性(dipeptidyl-peptidase activity)、磷脂酰甘油前体蛋白二酰甘油转移酶活性(phosphatidylglycerol-prolipoprotein diacyl glyceryl transferase activity)、L,L-二氨基苯甲酸转氨酶活性(L,L-diamino pimelate aminotransferase activity)、天冬氨酸氨甲酰转移酶复合物(aspart ate carbamoyltransferase complex)、蛋白质脂酰化(protein lipoylation)、(R)-2-甲基苹果酸脱水酶活性((R)-2-methylmalate dehydratase activity)、ATP依赖性解旋酶活性(ATP-dependent helicase activity)等基因功能在T2 D组中显著下调,磷酸葡萄糖变位酶活性(phosphoglucomutase activity)显著上调。差异代谢通路共有1种,为核糖体代谢通路,在T2D组中显著上调。结论:T2D患者和ND人群的肠道菌群在物种多样性、物种组成、蛋白丰度、基因功能和代谢通路方面都存在差异,T2D患者肠道菌群显示出一定程度的生态失调的特点。本研究证实了 T2D发生发展与肠道菌群变化之间的相关性,明确了 T2D的肠道菌群差异,为T2D的发病机制研究和以肠道菌群为靶标的T2D治疗研究提供了一定的启示和依据。