论文部分内容阅读
高通量单细胞RNA测序是从单细胞水平检测基因表达用于研究细胞异质性的技术,包括自动化单细胞测序和高通量数据分析。前者首先基于“油包水”乳液技术和微流控技术实现了高通量的单细胞分离和带有细胞条形码的单细胞测序文库制备的自动化;然后基于第二代测序技术采用模块化设计的机械固件和高度自动化的操作流程,实现高通量测序。后者是指面对由于自动化技术的应用提高了实验数据的信息密度和容量而产生的海量数据,需要依靠实验背景知识和计算机信息处理技术才能寻找到细胞群内部复杂多样的转录组景观差异。本论文借助高通量单细胞RNA测序技术,基于人源间充质干细胞(mesenchymal stem cell,MSC)模型研究低剂量双酚A(Bisphenol A,BPA)长期暴露对人体健康的危害。使用低剂量双酚A长期暴露人源脂肪间充质干细胞建立细胞毒性模型,通过10x Genomics高通量的单细胞RNA测序技术获得细胞毒性模型的转录组数据。在上游数据质控过程中,本论文搭建了Cell Ranger-Loupe Browser-多种生信分析工具的10x单细胞数据分析工作流,并利用工作流完成测序数据的比对、定量和质控。首先,双酚A组和对照组测序原始数据Q30碱基的占比分别为85.3%和86.4%,达到二代测序平台illumina的75%质控标准。其次,确信映射到转录本(Mapped Confidently to Transcriptome)是评估映射质量的一个关键指标,双酚A组和对照组的转录本确信映射率分别为71.4%和74.0%,均远高于最低标准需求的30%。最后,对细胞特征进行质控分析,各项细胞特征通过相关性分析并且98%以上的细胞中线粒体基因比例在10%以下。综上说明上游分析得到的基因表达矩阵达到通过质控标准,可用于下游数据分析。在下游数据分析过程中,本论文通过多种生物信息学分析工具对聚类结果进行联合分析,并根据各细胞亚群的生物信息完成对细胞亚群的整合、注释和功能分析。首先对数据进行降维和聚类处理,得到16个Clusters。然后通过GO分析表征细胞群功能和拟时间分析重构间充质干细胞发育过程,根据生物功能相似性将16个Clusters整合成8个新Clusters,并重新计算新Clusters分群的差异基因。通过GO分析对新Clusters进行全面的功能表征,根据GO分析结果完成Clusters在发育分化中的注释。接着统计各Cluster的GO分析结果中与免疫相关的GO术语,发现Cluster 1和Cluster 8是免疫反应互斥的两个细胞亚群。对Cluster 1和Cluster 8免疫相关GO术语进行详细分析,发现Cluster 1是与免疫反应活化相关尤其与炎症发生相关的细胞亚群,Cluster 8处于免疫调节的静息状态。完成发育分化和免疫调节能力分析后,统计两样品组中各Cluster的比例,通过比较两样品组中功能性细胞亚群比例变化,揭示了低剂量双酚长期暴露损害了间充质干细胞的干性、促进了成脂分化并改变了其免疫调节能力。综上所述,本论文基于自动化控制技术以及大规模数据运算分析,建立针对双酚A暴露下间充质干细胞的单细胞RNA测序数据的数据分析的工作流,挖掘双酚A长期低剂量暴露对间充质干细胞影响的生物信息。本论文的分析思路对于自动化技术在生命科学和环境健康领域的结合具有参考意义,本论文的数据结论可以作为双酚A环境暴露风险评估数据给相关政策的制定和污染治理提供理论支持和实践指导方针。