人类细胞-表型知识图谱的构建及应用

来源 :河北大学 | 被引量 : 0次 | 上传用户:regelus
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多数生命均是由同一细胞(受精卵)发育成的多种细胞构成的复杂系统。细胞中基因的表达在发育过程中受到严格且精准的调控,最终决定分化后的细胞具有特定的形态与功能表型,阐明细胞表型与其基因表达模式的关联有助于了解生命的生理与病理机制,并开展后续的药物研发。目前细胞形态与功能等表型的信息隐藏在大量的生物医学文献中,给细胞表型研究带来了挑战。构建细胞-表型知识图谱有助于整合“多而散”的领域知识以及单细胞组学数据,阐明细胞的基因表达模式及细胞表型之间的关联。针对细胞-表型知识图谱的构建与分析,本文开展了以下工作:首先,本文利用MeSH词汇表通过文献挖掘建立了细胞-表型知识图谱。本文收集了PubMed文献元数据,并从中提取了文献和MeSH实体条目的关联关系,然后基于共现频数、卡方检验等方法对提取的关联进行筛选。最后通过人工判读的方法验证了这些关联的可靠性。基于上述流程,本文共得到了227个细胞类型与259个细胞表型之间的5965个细胞-表型关联关系。细胞-表型知识图谱拓扑结构分析表明:神经细胞、T淋巴细胞等细胞类型和动作电位、细胞免疫等细胞表型均是领域最关注的问题。利用表型对细胞进行聚类,本文发现组织来源相同、功能相似的细胞倾向于聚集到一起。基于表型的细胞轨迹分析也重现了造血干细胞分化为红系细胞、髓系细胞和淋巴系细胞的过程。进而,本文整合细胞-表型知识图谱与单细胞转录组数据探索了细胞表型与基因表达模式的关联。本文收集了72类细胞的100套单细胞转录组数据,获取了细胞对应的特异高表达基因,通过分析知识图谱中细胞表型相似性以及基因表达相似性,发现表型相似度越高的细胞越有可能有相同的特异高表达基因。进一步分析发现表型相似度越高的细胞中的特异高表达蛋白之间越有可能有相同的蛋白质相互作用。最后,本文利用建立的细胞-表型知识图谱解决单细胞组学数据分析中存在的细胞类型鉴定、细胞表型预测等问题。本文发展了基于细胞-表型知识图谱的细胞类型鉴定和细胞表型预测方法,针对从GEO数据库获取的三套来源于外周血、肝脏、黑色素细胞系的单细胞数据集,准确预测了其中30个(85%)细胞亚群的类型,并成功预测了外周血组织单细胞数据中35个细胞表型,此外还发现抗原抗体反应是单核细胞潜在的表型。总之,本文开展的细胞-表型知识图谱研究为探索细胞表型与基因表达之间的关联奠定了基础,有助于解决单细胞数据分析过程中细胞类型鉴定、细胞表型预测问题。
其他文献
本研究收集了2013年和2015年在北京市某医院急诊采集的35株肺炎链球菌(Streptococcus pneumoniae)。根据全基因组测序、构建系统进化树、Average Nucleotide Identity(ANI)值、digital DNA-DNA Hybridization(d DDH)值分析判断其中三株菌(13B041,15B067和15B068)不属于肺炎链球菌(S.pneumo
学位
近年来,锂电池凭借其容量高、自放电率低、循环寿命长以及绿色环保等优点被广泛应用于便携式与可穿戴电子设备中,同时电子产品性能提升与应用领域的持续拓展对锂电池安全性能不断提出更高的要求。目前,现有锂电池充放电保护芯片精度偏低且稳定性不足是导致电池损坏、燃烧甚至爆炸等危害不可忽略的原因之一。因此,进一步发展高精度、高稳定性和低功耗的锂电池保护芯片具有非常重要的现实意义。根据可穿戴式电子设备中应用的锂电池
学位
通过增强启动子的启动强度来增强目的基因表达,进而提高代谢产物的产量是近年来代谢工程研究的热点。上游元件(UP Elements)是一段富含A和T的DNA片段,能够通过与RNA聚合酶全酶的α亚基羧基末端结构域(αCTD)接触激活RNA聚合酶核心酶来提高启动子的表达强度。本研究将上游元件中非保守序列随机突变的片段与小球藻病毒基因组来源的核心启动子结合为半合成启动子,通过构建双报告基因质粒对随机突变后的
学位
石墨相氮化碳(g-C3N4)是层状结构半导体,并且具有合适的带隙和带边位置,是一种典型光催化材料。由于纯净半导体无法克服光生电荷的复合,因此g-C3N4光催化效率难以达到实际应用的目的。引入另一种半导体构成g-C3N4基异质结可以加快电子-空穴分离速率从而显著提升光催化活性。本文通过铟掺杂γ氧化铋(γ-Bi1.95In0.05O3)和钨酸镥铋(BiLuWO6)与g-C3N4耦合,实验表征和理论计算
学位
由活性氧引起的氧化性损伤与衰老、糖尿病、肿瘤、及许多神经退行性疾病的发生相关。花色苷(anthocyanins)作为一种生物类黄酮具有广泛的药理作用,能够清除体内过多的自由基,并在抗氧化、抗炎、抗癌、视力保护以及降低患心血管疾病的风险等方面都有显著疗效。目的:探究蓝美1号蓝莓花色苷提取物(blueberry anthocyanins,BA)的体内代谢特征及生理活性,为BA的广泛应用提供数据支撑。方
学位
腹部动脉分割对于血管疾病的诊断与治疗具有重要意义。由于人体腹部血管构造因人而异且相对复杂,而传统的机器学习算法工作量大、耗时长,手动标记特征具有很强的主观性,会对病理分析和术前诊断带来极大的困难。在卷积神经网络中,U-Net带有跳跃连接的U型编解码结构,能够融合不同层级的特征,并可以自动且准确地提取目标特征信息,因此常被用于腹部动脉分割领域。但使用U-Net网络进行腹部血管分割时,存在以下问题:权
学位
脑血管疾病在人群中的发病率和死亡率都比较高,严重威胁着人们的生命和健康,准确的早期诊断可以很好控制脑血管疾病的恶化。医生给患者诊断的过程中经常需要借助医学图像,准确的血管分割结果对医生判断病情和提出疾病相应治疗方案很重要。磁共振血管造影(Magnetic resonance angiography,MRA)是目前临床医疗上进行血管成像及血管疾病检查的首选成像方式,但由于其特殊的传输方式导致图像受到
学位
胀果甘草为多年生草本植物,产于中国内蒙古、甘肃、新疆等地,是一种耐盐性的传统中药材,是有希望改良盐碱荒地的植物之一。根和根状茎产生的多种次级代谢产物,其中甘草酸和甘草黄酮为主要药用成分,具有抗炎、抗菌、抗病毒、抗氧化和保护肝脏等功效。本实验基于盐胁迫下胀果甘草愈伤组织转录组数据,以胀果甘草愈伤组织为试验材料,利用生物信息学分析GibHLH差异基因探究其生物学功能,通过q RT-PCR筛选稳定表达的
学位
在甲壳动物个体生长和发育过程中,蜕皮是其标志特征,受神经内分泌系统的调节。甲壳动物蜕皮级联通路与其生长、变态、蜕壳和繁殖有着密不可分的联系。甲基法尼酯(Methylenefarnesoate,MF)是一种重要的内分泌激素,在甲壳动物蜕皮级联信号通路中发挥着重要作用,参与调节甲壳动物蜕皮、生长发育与繁殖等过程。本研究以中华锯齿米虾Neocaridina denticulata sinensis为研究
学位
如今,进入计算机技术高速变革时期,智能家居人机交互技术和安全通信技术飞速提升。由于网络带宽有限,传统的移动云计算在向远程移动云传输大量物联网数据方面不够高效,存在长时延和低可靠性的缺陷。与移动云计算相比,移动边缘计算(Mobile Edge Computing,MEC)可以在网络边缘侧提供计算和存储资源服务。然而,智能家居环境存在可利用资源空间有限、通信安全要求高的特点,这使得移动智能家居终端的数
学位