基于多网络集成嵌入的单细胞RNA-seq数据降维方法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:linlinlin123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
单细胞RNA测序(single-cell RNA sequencing,scRNA-seq)数据以高通量、高分辨率反映单个细胞内的基因表达信息,为细胞异质性的研究提供了有效途径。但目前测序技术的不完善,使高维的单细胞RNA-seq数据中存在随机噪声和数据缺失,为后续的计算分析带来了困难。降维作为处理高维数据的常用方法,是缩减维度、去除噪声的有效手段。然而,由于单细胞RNA-seq数据常具有复杂结构和数据缺失,以往的降维方法并不能适应其数据特点。本文提出了一个基于多网络集成嵌入的单细胞RNA-seq数据降维方法scLINE。scLINE依据数据在原空间和低维空间的概率分布,构建相似度模型并对其进行优化,使降维后的数据最大程度地拟合原数据结构分布。同时,该模型引入并参考相关的基因网络,补充基因间结构和功能关联信息,克服单细胞RNA-seq数据中的缺失问题。本文使用8个不同的单细胞RNA-seq数据集综合评估scLINE的算法效能。结果表明,在可视化效果、聚类指标以及参数稳定性方面,scLINE 比常用的数据降维方法PCA、t-SNE和Isomap相比具有更佳的效果。除此之外,引入外部参考信息的scLINE模型在样本聚类评估中显示出一定的辨识优势。scLINE是一个结合了网络嵌入和外部信息提取的非线性降维方法。该方法以数据网络的拓扑特征为驱动,适用于结构复杂多样的单细胞RNA-seq数据。通过该方法得到的低维数据不仅反映原数据特点,同时利用综合的生物学先验知识填补信息缺失,对于下游单细胞分析如细胞分型有显著的优化作用。此外,本文已经将scLINE开发为R语言工具包并将其上传至开源平台,方便用户实现单细胞RNA-seq数据的降维处理及可视化操作。
其他文献
清华简为研究商周时期的历史提供了新的史料素材。本文围绕清华简的相关内容,以传世文献为依托,结合甲骨文、金文,重点选取了商周“籍田礼”问题、“文武受命”问题、“武王在位年数”问题进行深入研究。第一章对清华简《系年》和商周“籍田礼”问题进行研究。回顾了学界关于“籍田礼”问题的争论和清华简《系年》公布以来引发的新讨论。从文献中西周籍田礼的不同称谓出发,指出其不仅具有祭祀上帝的作用,也是周人重视民生的反映
学位
过氧化物酶体(peroxisome)是由单层膜包被的细胞器,普遍存在于真核生物的细胞中。过氧化物酶体内含有多种酶,参与多种代谢途径,主要参与脂肪酸的β氧化以及自由基的清除。细胞环境对过氧化物酶体的形态、数量以及功能有很大影响。细胞通过调控过氧化物酶体生物发生和降解之间的平衡得以实现过氧化物酶体的稳态,过氧化物酶体的分裂、增殖、传承以及蛋白转运等细胞过程被称为过氧化物酶体的生物发生;冗余或受损的过氧
学位
牛流行热(Bovine ephemeral fever,BEF)是由牛流行热病毒(Bovine ephemeral fever virus,BEFV)感染牛和水牛等引起的一种急性和热性传染病,其主要特征表现为发热,呼吸急促,四肢无力,母牛流产等症状,致使奶牛产奶量大大下降,对养牛业的经济发展产生了很大的影响。尽管疫苗免疫可预防BEF,但是该病仍然时有发生。因此,需要深入研究BEFV复制的分子机制,
学位
近年来在国家的号召鼓励下,我国在无人机领域的研究高速发展,其中对于小型无人机动力装置的需求也日益增加。电控燃油喷射系统能够明显的改善传统的化油器式发动机的性能,尤其针对小型无人机发动机而言。其可以在发动机运行的过程中实时掌握并控制发动机的各个参数。电控燃油喷射控制系统在控制过程中的关键在于电子控制单元所设计的喷油控制策略。所以,本文针对用于无人机的小型二冲程汽油活塞发动机喷油系统的研究是有现实意义
学位
新鲜撞击坑具有边缘清晰、较高且较为陡峭、具有新鲜的连续溅射物、部分具有辐射纹、形态上没有明显退化等特征,基于这些特征,采用影像数据和地形数据相结合的方式,从LU106016撞击坑数据库中目视解译出新月宙撞击坑,再以LPI公布的撞击坑名录作为补充,最后用以研究的新月宙撞击坑总数为18605个。具体研究内容如下:1)空间分布特征。使用统计学和空间分析的方法,研究了新月宙撞击坑的空间分布特征。研究表明,
学位
飞艇作为一种依靠浮升气体提供静升力的轻浮空器,有着驻空时间长、低能耗、载荷量大、效费比高、安全性高等优点,可实现对地监控、防空预警和信息通信等功能,是当前航空领域的研究热点。飞艇的热特性是其安全飞行的基础,同时飞艇的热特性与外界大气环境息息相关。论文在参考大气下对带卷帘飞艇的如下问题进行了研究:首先,基于大气参数实测数据,通过函数拟合的方式建立了参考大气模型,使用该参考大气模型可以获得较短时间间隔
学位
人民币离岸市场建设是我国当前人民币国际化的重要举措。香港作为国际金融中心,加快香港离岸人民币市场的建设无疑成为推进人民币国际化的不可或缺的环节。随着香港离岸人民币市场的逐步发展,它对在岸人民币汇率会产生重要影响。香港离岸人民币市场发展越快,它对在岸人民币汇率产生的影响就会越大。香港离岸人民币市场与在岸人民币汇率之间的关系会变得更为复杂。本文以最优货币理论、“飞地”经济理论和外汇市场微观结构理论为基
学位
推荐系统通过处理和过滤大量的用户行为数据为其用户建议可能感兴趣的内容。本文研究了近几年来快速发展的基于地理位置和社交网络的兴趣点(POI,Point-of-Interest)推荐系统及其隐私保护问题。兴趣点推荐算法通常考虑三个影响因素:用户相似性,好友影响力和地理位置。相比于系统和陌生人的推荐,用户容易更青睐朋友的偏好POI,好友影响力一般可由共同好友和共同访问的POI情况一起确定;同时过于遥远的
学位
在股票发行核准制度下,我国境内多数企业一般难以满足深沪A股上市的高要求,通过A股IPO融资道路坎坷,审批程序繁琐漫长,因此越来越多境内企业积极寻求海外上市路径。香港作为国际公认的金融中心,深受境内拟上市企业青睐。募集资金审核是香港联交所对企业上市审核的重要内容之一。在近年联交所IPO审核实务中,因募集资金使用规划不当或者不合理而缺少上市的商业理据已成为企业IPO申请被拒的重要原因之一,特别是201
学位
航空发动机是飞机的心脏,它对飞机的性能起决定性的作用。对于军用飞机而言,它更是至关重要。随着各国对先进战机性能要求的不断提高,航空发动机技术也迅速发展。随着发动机技术的提升,加力燃烧室提高了温度,增大了发动机推力,加力燃烧室的工作环境更加严峻。传统加力燃烧室在冷态状态下的总压损失大,耗油率高,制约了航空发动机的发展。为使发动机有更优越的性能,需要对加力燃烧室技术进行创新性地探索与研究。将加力燃烧室
学位