基于单细胞测序数据的拷贝数变异检测方法研究与实现

来源 :宁夏大学 | 被引量 : 0次 | 上传用户:hades173053
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
拷贝数变异是肿瘤基因组最显著的特征之一,准确识别拷贝数变异对于揭示癌症发生和发展的生物学机理具有重要研究意义。随着单细胞分离、全基因组扩增等技术的不断发展,单细胞DNA测序已成为肿瘤基因组变异分析的重要手段,其可以从单细胞层面揭示基因组变异在不同癌细胞中的遗传差异性。目前单细胞DNA测序技术可对成千上万个细胞的基因组进行测序,可用于分析单个细胞的基因组变异图谱。由于全基因组扩增导致的扩增不均匀性,单细胞DNA测序数据中存在读深分布不均衡、数据噪声大等问题。本文综合考虑单细胞DNA测序数据本身存在的高噪声和偏差,设计了面向单细胞读深数据的去噪和拷贝数检测算法,并在仿真数据集和真实数据集上评估性能,最后实现了基于Web端的单细胞拷贝数检测系统。针对单细胞DNA测序扩增不均匀导致的位置特异性噪声问题,本文提出了一种基于变分自编码器的去噪算法,在进行拷贝数估计之前对原始数据进行校正。基于去噪后的读深数据使用拷贝数估计模型进行拷贝数估计,由此得到一个符合单细胞拷贝数检测基本流程的拷贝数检测模型。本文首先使用单细胞测序数据仿真工具生成符合实验要求的单细胞测序数据,并将建模的位置特异性噪声去噪模型应用于仿真数据,调参以取得最优模型,再将去噪后的数据放入拷贝数估计模型获取最后的检测结果,同时与仿真测序数据真实拷贝数结果和现有的拷贝数检测方法进行比较。最终,实验结果表明该算法提高了拷贝数检测精度。同时,将该算法应用于真实的乳腺癌单细胞测序数据集,结果验证了算法的有效性。此外,本文中构建了一个Web系统,提供了一套可视化单细胞拷贝数检测的工具,为用户使用该算法模型提供了便利。
其他文献
互联网在生活中的普及,除了带来生活上的便捷以外也带来了各种各样的网络入侵,这些网络入侵虽然隐秘,但想要发现他们也并非无迹可寻。在网络入侵发生的同时,主机系统日志正在记录着他们的所作所为,所以通过分析主机系统日志来预防网络入侵也是现今学界研究入侵检测重要的方向之一。因为传统的机器学习检测技术无法适应现今纷繁复杂的网络攻击手段,利用深度学习可以更好的从主机系统日志中提取网络攻击的特征。本文结合公开数据
学位
中国自古以来就有“中兴”的思想,主要指在中国古代一个王朝从衰落重新走向兴盛的历史现象。关于“中兴”最早的记载始于汉代,汉代之前的“中兴”往往表现为复兴,比如殷之复兴。汉宣帝当政时期,励精图治,使得一度国力衰退的西汉王朝又重新兴盛起来,史称“汉宣中兴”。此时“中兴”仅仅是一种社会现象,其大意是转衰为盛,中途振兴。更具典型性的中兴是“光武中兴”。西汉末年,王莽篡汉,一系列改革祸国殃民,人们开始思念汉朝
学位
角色外行为一直是人力资源管理实践和组织行为学研究的热点问题之一。随着“中国制造2025”方案的提出以及工业化与信息化深度融合的趋势,社会对高素质技术技能型人才的需求不断增加,职业教育越来越受到党和政府的重视,提升职业院校毕业生的培养质量势在必行,这同时对高职学院的教职工队伍素质和人才资源管理提出了重大挑战。教职工的角色外行为对学校组织发展目标的实现有着不可忽视的影响。本研究把G高职学院的教职工作为
学位
地名属于一种独特的语言符号,承载着人类的历史文化,反映着时代变迁。本文以银川市629个行政地名为语料,从语言和文化的角度对其进行分析研究。在语言层面,银川市行政地名基本符合现代汉语的发展趋势。在文化层面,银川市行政地名深受当地历史文化的影响。本文主要由绪论、正文和结语这三部分构成,具体内容如下:绪论部分主要介绍了银川市基本的历史地理概况、与本课题相关的地名研究现状以及本文的语料来源、研究方法和研究
学位
作为日本独具特色的“妖怪型”推理作家和“新本格”派先锋人物,京极夏彦以其丰富的民俗妖怪知识和细腻的笔触,勾勒出了一个与现实世界相交织的“妖怪”世界,丰富了推理小说的内涵,表达了自己对“妖怪”、怪谈等民俗文化的发展和现代人生存、精神等问题的关注。论文以京极夏彦的推理小说中的“妖怪”叙事为研究对象,综合运用了分类研究、比较研究、文本细读等多种研究方法,并结合叙事学、妖怪学以及心理学等多种理论,从其小说
学位
日益增长的数据量给数据中心带来了严峻的压力,面对大规模的数据处理需求,数据中心不仅需要提升数据带宽,更需要保证数据处理的时效性,而传统的数据中心结构由于其局限性,越来越不能满足高吞吐,低延迟的处理要求。通用的大数据处理平台以CPU为处理中心,存在IO墙、存储墙等典型问题,并且进行大规模数据运算时吞吐量不高,难以达到低延迟的应用处理要求。以Flink为代表的典型大数据流处理系统具有大数据通用算法的算
学位
“适应”问题贯穿于人生发展全过程,适应水平成为衡量个体社会化程度的重要指标。大学阶段是学生从校园走向社会的关键时期,而学校适应状况是他们实现个体发展的综合体现。如今,职业教育正处于快速发展阶段。无论是院校数量还是人才质量,高职院校均呈现出良好的发展态势,其体量与规模和普通本科院校间的差距也在逐渐缩小。当前,脱贫攻坚战胜利号角的吹响标志着我国全体贫困人口实现了脱贫,也意味着脱贫家庭的学生已经摆脱了“
学位
智利作家罗贝托·波拉尼奥的作品在西班牙、智利、美国等国家多次荣登各地畅销书榜首,其人更被称为拉美文学“后爆炸时代”的代表。波拉尼奥的遗作《2666》一经问世便斩获多项国际奖项,作品以全景式的手法,通过五个部分的书写,全面展现了人类的情爱、残暴、凶杀、战争等,并将叙事、抒情等类型完美糅合。同时,作者又加入大量的梦幻性、联想化、直觉感应等超现实手法来进行情节、心理活动的创作,使得小说蕴含了丰富的象征意
学位
近年来多媒体学习的研究主要聚焦于学习的认知过程及情绪对学习的影响。在多媒体学习中,视觉情绪设计是指在教学过程中使用不同的视觉设计元素影响学习者情绪、提高内部动机并增进学习效果的教学设计手段,是学习者获取信息的重要方式。然而,以往研究较多关注视觉情绪设计的情绪效价特性和整体信息传递,忽视了具体视觉元素在整个学习过程中对学习者注意力的引导和眼动层面的视觉认知加工影响。此外,学习材料的呈现步调是学习者与
学位
目的基于“模块化闯关”模式,结合文献法和德尔菲专家咨询法,构建适合于心血管内科新护士规范化培训的新教学模式;将“模块化闯关”模式实施于心血管内科新护士规范化培训中,探讨其提升护士的专业能力和综合素质的效果以及教学满意度情况。探究一种有效的护理教学模式,为心血管内科新护士规范化培训提供新思路、新方法,为落实高效的护士规范化培训提供依据。方法1.构建心血管内科新护士规范化培训“模块化闯关”模式(1)成
学位