基于低秩张量的单细胞RNA-seq数据补全算法

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:winter2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新兴的单细胞RNA测序(scRNA-seq)技术使得研究人员能够以单细胞级别的分辨率研究细胞的基因表达,这让研究细胞的异质性信息成为可能,具有重要的研究价值。但由于捕获效率,批次效应等技术缺陷,scRNA-seq中的Dropout现象导致所获取的基因表达矩阵存在缺失值和噪声,阻碍后续的细胞下游分析。本文在考虑单细胞数据的异质性和低秩性的基础之上,对单细胞数据集的补全进行研究,主要工作如下:(1)参考经典的矩阵分解的方法,并综合考虑单细胞的低秩性和异质性,构建三阶低秩张量,相比传统的矩阵分解方法,一方面张量包含了更多的同类细胞信息,另一方面,张量的构建避免依赖聚类算法的结果,更大概率的将同类型的单细胞数据整合在同组中,在高缺失率的情况下仍能够保持较好的结果。(2)本文设计了一种针对单细胞的补全方法scLRTC。对构建的三阶低秩张量进行建模,通过分析比较各种张量补全的优劣,并综合考虑单细胞数据的特性,采用张量秩最小化模型,通过张量迹范数跟踪张量的秩,并使用ADMM算法进行求解,最后将张量按照特定规则转化整合为矩阵。从而完成对单细胞基因表达矩阵的补全。(3)为了说明scLRTC的对单细胞数据的补全效果,本文在9个单细胞数据集上,从5个方面设计实验验证。实验结果表明,scLRTC与其他7种方法相比,误差最小,且对高缺失率的数据仍能保持较好的效果。能够大幅提高聚类算法的效果;改善单细胞数据的降维可视化结果;恢复数据集中细胞-细胞和基因-基因的相关性,得到最接近真实数据集的差异表达基因。此外,对于有时间序列信息的单细胞数据集,scLRTC还可以提高细胞发育轨迹的推断算法的准确性。最后,本文对单细胞数据补全的研究工作进行了总结,并对今后的工作进行展望。
其他文献
随着“垃圾围城”现象的突显,许多城市都在探索城市生活垃圾无害化处理方式,杭州天子岭垃圾填埋场率先从德国引进MBT(机械生物处理)技术,城市生活垃圾通过MBT工艺的处理,可以从源头上达到减量化、资源化的目标。目前,国外对MBT垃圾的强度特性研究不够深入,国内对此的研究更是匮乏。垃圾的强度特性对填埋场的设计及运行都非常重要,可有效防控垃圾填埋场事故的发生。本文采集杭州天子岭垃圾填埋场中试项目的MBT垃
学位
超高分子量聚乙烯(UHMWPE)纤维具有低密度、高强度、高模量、耐腐蚀、耐冲击等一系列优良特性,是新一代高性能纤维,具有广阔的应用前景。但UHMWPE纤维表面光滑并呈现化学惰性,与基体材料界面粘结性能差,从而限制了其在复合材料领域中的应用。为解决UHMWPE纤维增强复合材料界面性能差的问题,本文将多酚化合物沉积、氨基硅烷改性、等离子体处理、聚合物接枝、纳米二氧化硅粒子改性等方法结合,对UHMWPE
学位
形状记忆聚合物(Shape memory polymers,SMP)作为智能刺激响应材料的典型代表,它能感知外界环境刺激(温度、电、光、磁场和溶剂等)自发产生形状、应变、尺寸或刚度等物理属性的变化,在航天设备、医疗器材和驱动传感器等领域展现出广阔的应用前景。近年来,SMP通过可控的形状变化实现信息存储、防伪和加密传输等功能,使SMP基信息载体逐渐走进人们的视野,打开了SMP新的应用领域,也丰富了信
学位
学位
聚偏氟乙烯(PVDF)具有良好的耐化学腐蚀性、耐高温性、耐氧化性等性能。然而PVDF具有较强的疏水性,导致水处理领域用PVDF膜亲水性能差、易被污染,从而缩短膜的使用寿命。纳米TiO2虽具有超亲水性、光催化性能优异,但需经紫外光激发后才具有一定的抗菌性能,且难以回收。本文首先通过对纳米TiO2粒子进行金属离子掺杂改性研究,增强纳米TiO2的光催化活性,提高可见光下抗菌性能。其次采用共混改性制备抗菌
学位
近年来,立体车库的应用有效缓解了城市车位少和交通拥堵等“停车难”问题。与其他类型立体车库相比,平面移动式立体车库具有车位多、空间利用率大和自动化程度高等特点,但普遍存在存取机构复杂、存车效率低和顾客排队时间长等问题,导致顾客存车体验差。为解决以上不足,本文以平面移动式立体车库为对象,分别以立体车库搬运及存取结构、存车效率和顾客排队时间为优化目标,开展以下方面研究:首先,设计一种子母车搬运及存取结构
学位
光滑函数的小波系数往往具有“稀疏性”,即使是一个复杂的信号,也可以通过紧小波框架展开,并通过少量的小波基“逼近”。因此,通过小波基、小波框架分析函数、信号、图像的方法被广泛应用于基础数学、应用数学、信息科学等不同领域。受近期Sobolev空间理论和小波图像去噪等问题研究的启发,本文对高维Sobolev空间刻画和小波与非局部均值去噪这两方面的问题继续进行研究。针对第一个问题,我们使用由C∞紧支集的非
学位
肖像摄影起源于西方,而后传入中国,作为一种摄影类型和视觉媒介,从理论到实践皆呈现多元的面貌。因其背后隐含的人物心理、审美紧密依托社会与历史环境,如今已成为视觉研究中的重点。有别于肖像摄影的整体范围,本文以现代肖像摄影为切入口,爬梳现代肖像摄影的服装问题,发现存在服装同质化严重、成片人物性格特征模糊、肖像服装面料资源受限等问题。围绕这一系列问题,文章结合LIX肖像摄影实践,探讨服装设计语言如何更好地
学位
时尚(Mode)一词的普遍使用最早可以追溯到十六至十七世纪的欧洲。意大利半岛作为欧洲思想解放的起源地,孕育了最初的“时尚”概念。伴随文艺复兴运动,时尚得以传播与发展。十七世纪,法国时尚的影响力自宫廷扩散至社会各阶层,并不断发展壮大,逐渐占据欧洲时尚的主导地位。早期的意大利时尚便以依附、模仿法国时尚为主,发展高级定制时装产业。直至二战后,以马歇尔计划的实施作为重要催化剂,战后的意大利经济得以复苏,工
学位
青铜器从原始社会末出现,直至商朝发展达到顶峰。从青铜器具的造型和纹饰中能反映出那个时代的文化生活。从1989年新干大洋洲商墓发现发掘至今已过去32年,各界学者和青铜爱好者对其的研究依然在继续。当前大洋洲青铜博物馆虽开馆多年,但文化建设衍生型产业仍处在初步阶段,故面对文化衍生产品品类亟需进一步丰富和充实的问题,以及对馆藏文物衍生型产品再设计的新需求,展开了江西大洋洲商代青铜博物院文创产品设计探究和实
学位