单细胞测序数据的贝叶斯分析

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:tank12134
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
单细胞RNA测序是新一代的测序技术,可以揭示看似同质的细胞群体中在基因表达水平上新的细胞间异质性。然而,这些实验容易产生无法解释的高水平技术噪声,给识别细胞群中真正异质表达的基因带来了新的挑战。本文主要以贝叶斯建模为背景,围绕BASi CS(Bayesian Analysis of Single-Cell Sequencing Data)框架展开讨论。具体而言,本文的工作大致可分为以下两个部分:第一部分基于BASi CS框架,量化无法解释的技术噪声和细胞间的异质性。其中以细胞特定的归一化常数作为模型参数的一部分进行估计,技术变异性根据人工导入的spike-in基因进行量化,并且将计数的总变异性分解为技术和生物成分。除此之外,BASi CS还提供了一个直观的检测标准,用于检测研究细胞群体中的高(或低)可变基因。最终,将该方法应用到小鼠胚胎干细胞的基因测序数据上,从而说明了方法的有效性和适用性。研究结果表明,在所有基因中,无法解释的技术噪声解释了一个典型细胞中大约28%表达计数的总变异性,这些数据有力地证明了生物细胞间的异质性。第二部分则基于BASi CS模型,校正差异性测试的均值依赖性。具体而言,在BASi CS框架下,建立了泊松结构模型(非回归模型)、泊松-负二项结构模型(回归模型)。首先,得出了细胞间转录变异性的残差,且该残差没有被平均表达所混淆。其次,为了评估回归BASi CS模型是否有效改善了后验推断,使用了CA1吡喃神经元的大型数据集,通过随机地对50-500个细胞进行子采样来人工生成较小的数据集。可以观察到,回归和非回归BASi CS模型均导致在不同样本量和表达水平下基本稳定的平均表达估计值;而当样本量较小时,非回归BASi CS模型低估了低表达基因的特异性过度分散参数(Over-dispersion parameter)。为了确保方法的广泛适用性,扩展了BASi CS模型以处理没有spike-in基因的数据集。本文的方法为细胞间表达变异的动力学提供了生物学见解,突出了激活后免疫细胞中生物合成机制的同步性。通过上述建立的非回归BASi CS模型和回归BASi CS模型及应用展开讨论。本文所建立的模型为了解基因表达中异质性的作用提供了强大的工具,同时为单细胞测序实验中更复杂的下游分析提供了基础。
其他文献
背景:急性肝衰竭(acute liver failure,ALF)是一死亡率极高的急危重症,其发病机制仍未完全清楚。我们近年的研究证实,urotensin II(UII)/UII receptor(UT)系统在ALF发生发展过程中起关键作用,该信号系统的激活介导了ALF肝组织免疫炎症损伤反应。p120-连环蛋白(p120-catenin,p120ctn)是血管内皮细胞及上皮细胞起固有免疫反应的重要
背景急性重症胰腺炎(SAP)的死亡率居高不下,早期液体复苏是急性重症胰腺炎诊治的关键措施之一。但由于液体向第三间隙转移积聚会加重病理损伤,因此液体管理成为贯穿整个SAP诊
眉县地处关天经济区核心地带,从2010年成功创建国家级生态示范区以来,以“生态立县、旅游兴县、工业强县、农业富县”四大战略为导向,下辖8镇中7镇均被确定为省级生态镇,常兴
近年来随着科学技术的发展,对纳米胶束和自愈合水凝胶功能材料的需求越来越大。在作为药物的载体方面自愈合水凝胶和纳米胶束具有许多独特的优势,均在新型载药系统领域显示了
目的卒中后抑郁(Post-stroke Depression,PSD)是指脑卒中后诱发的抑郁症状,是脑卒中后最常见的情感障碍疾病之一。PSD对脑卒中患者神经功能康复、生活质量和生存率有重要影响,明显加重患者本人、家庭及社会的经济负担,因而目前受到越来越多的关注[1]。但PSD发病机制并不十分清楚,课题组前期研究发现,海马结构的损伤与PSD的发生密切相关,“海马神经重塑障碍”是其关键步骤,因JAK/
[背景]湿疹是一种常见的皮肤病,其特点为皮损形态多样,伴有强烈瘙痒,易反复发作,容易演变成慢性发病。湿疹的复发性、顽固性、瘙痒性及病程的缠绵严重影响患者的生活质量,给患者带来极大困扰。西医认为湿疹为皮肤炎的一种,采取的多为激素和免疫疗法。激素和免疫制剂内外治法虽然在短期内有一定的疗效,但多伴有较大的副作用且不容易根治湿疹。因此还需找到更好的、有效的、安全的疗法。中医对湿疹的认识由来已久,治疗手段更
目的:通过数据挖掘的方法,深入研究曲艳津主任在临床中治疗高血压眩晕的用药规律,分析其辨治思路,学习其治疗经验,剖析其学术思想,为以后临床医治高血压眩晕奠定理论基础及提供新的诊疗思路。方法:收集曲艳津主任2018年1月-2019年6月期间在天津市中医药研究院附属医院脑病科门诊收治符合高血压病中、西医诊断的患者所使用的共计206首有效中药处方。在数据标准化后,使用WPS表格录入数据形成数据库,进行初步
不管是天然纤维还是化工纤维材料中都具有多孔结构,且纤维材料中大量存在着一种普遍且特殊的分形分叉结构。如动物的毛皮和植物的运输系统都是属于纤维材料分形分叉结构。在
从脑部序列图像中将脑组织与颅骨、眼球、皮肤、脂肪等组织分离出来的过程称为脑组织提取,是脑部MRI图像分析的重要处理步骤,在fMRI图像配准、脑组织分割、脑容量测量等方面有重要应用。快速准确的提取脑组织在临床和研究中有重要应用。本文在CUDA并行计算平台提出了一种并行脑组织提取方法,该方法该方法结合了并行BET算法和并行水平集方法,是一种混合算法。本文主要贡献有:1、为进一步提高并行水平集计算速度,
在复杂体系制药过程中,通常需要监测和控制多种关键工艺参数或关键质量属性,以确保生产过程正常运行,保证产品质量。研究如何将过程分析技术(Process Analytical Technology,