【摘 要】
:
生物体内存在一套复杂的基因调控机制,这种调控机制控制生物的生长发育过程,研究者将这种调控机制定义为基因调控网络(Gene regulatory networks,GRNs),基因调控网络是理解生物系统的重要工具。随着单细胞测序技术的快速发展,单细胞转录组学数据的规模越来越大,准确的从大规模转录组学数据中推断基因调控网络对于理解生物调控过程至关重要。近年来已经有研究者提出了大量算法对基因调控网络进行
论文部分内容阅读
生物体内存在一套复杂的基因调控机制,这种调控机制控制生物的生长发育过程,研究者将这种调控机制定义为基因调控网络(Gene regulatory networks,GRNs),基因调控网络是理解生物系统的重要工具。随着单细胞测序技术的快速发展,单细胞转录组学数据的规模越来越大,准确的从大规模转录组学数据中推断基因调控网络对于理解生物调控过程至关重要。近年来已经有研究者提出了大量算法对基因调控网络进行重构,已有算法通常将调控网络的重构问题分解为多个子问题,采用机器学习方法挖掘数据,这些方法通常在诸如计算复杂度、计算准确度等方面还需要进一步优化,为此本研究的主要工作如下:本文首先提出了BiRGRN,一种从带伪时间序列的基因表达数据中推断GRN的新方法。BiRGRN利用双向循环神经网络(Bidirectional Recurrent Neural Network,BiRNN)来推断基因调控网络。RNN是一种复杂的深度神经网络,能够捕捉变量之间复杂、非线性、动态的关系。为构建GRN,算法将RNN模型中神经元映射为基因,并将神经网络层与层之间的连接映射为基因之间的调控关系。基于深度网络,BiRGRN将GRNs的重构问题转化成一个回归问题,算法利用前面多个时间结点的基因表达数据预测下一个时间结点的基因表达数据。此外,算法接着引入双向结构来整合正向和逆向推断结果,并基于一组不完全的先验知识来过滤掉部分候选边。BiRGRN具有较好的可解释性和数学上的灵活性,为了验证该算法的准确性,本文将BiRGRN应用于四个模拟数据集和三个真实sc RNA-seq数据集。与目前先进的算法相比,实验结果表明BiRGRN能够更准确的从时序sc RNA-seq数据中推断出GRN。进一步,本文提出了GraConGRN,该算法是针对稳态基因表达数据提出的新的基因调控网络重构算法。GraConGRN利用图卷积神经网络(Graph Convolutional Neural Networks,GCN)以及卷积神经网络(Convolutional Neural Network,CNN)来推断基因调控网络。算法首先利用GCN提取基因表达数据的特征从而获得基因的低维嵌入表达,接着对获得的低维嵌入表达进行重构,构建基因-关系-基因三元组并使用卷积神经网络对三元组打分。GCN是专门为非欧几里得图结构数据开发的一种神经网络模型,该模型能够有效提取基因之间的相互作用关系。基于编码器-解码器结构,算法将GRNs的重构问题转化为一个分类问题,通过对三元组打分判断三元组是否是合法三元组。GraConGRN同样具有生物接近性以及结构灵活性,为了验证算法的准确性,本文将GraConGRN应用于九个模拟数据集和三个真实sc RNA-seq数据集。与已有的优秀算法相比,实验结果表明GraConGRN能够从稳态基因表达数据中准确重构GRN。
其他文献
淋巴瘤是起源于淋巴造血系统的恶性肿瘤,是血液肿瘤中发病率最高的类型。对于疑似恶性淋巴瘤的筛查手段有很多。近年来,先进超声检查技术在临床上的应用,为淋巴瘤的诊断提供了更加便利的条件。高分辨率超声能显示淋巴瘤的大小、形态和内部回声结构及其变化,提供丰富的诊断信息,临床医生可以凭借其镜下超声表现筛选出疑似细胞进而通过穿刺活检获得明确的病理诊断。但对于临床经验较为缺乏或非肿瘤科领域的医生来说,镜下筛选过程
由于阿尔兹海默病(Alzheimer’s Disease,简称AD)对中老年人的危害较大,近年来发病率逐渐提升,并且该疾病病程漫长,不可逆转且暂无有效的治疗方式,只能秉持早发现早干预的方针,对患者进行早检查以及早预后,因此其早筛尤为重要。多阶段事件判别模型(Multi-stage Event Discriminant Model,MDEBM)以生物标志物属性变化为事件,通过样本横截面数据分析得到阿
阿尔兹海默病(Alzheimer’s Disease,AD)目前是中老年人群中较为常见的高发疾病,已经严重影响患者及其家庭的正常生活。然而,目前的治疗药物只能尽可能延缓AD的病变进展,却不能从根本上医治AD患者。因此,通过利用计算机技术研究AD的疾病进展情况,帮助医生实现AD患者的早期干预,对潜在的AD病变者尤为重要。Tau蛋白是AD的主要致病物质之一,在脑部鉴定Tau蛋白含量有助于区分认知正常的
在真实世界的数据集中,数据缺失的情况非常普遍,例如:交通数据、人口统计信息数据、医疗数据等。数据的缺失导致了数据质量下降、诸多信息丧失,在机器学习的研究中,如果将这种残缺的数据作为模型的数据集,模型系统中表现出的不确定性将会更加显著,还会导致模型对数据信息的挖掘走向混沌的状态,最后得到不靠谱的输出。如果利用常用的算法来分析不完整的数据集,不仅会增加建模的难度,还会给后面的分析留下隐患。现有的大多数
<正>本书收录了2023年专利代理师资格考试大纲以及与考试密切相关的法律、行政法规、司法解释、部门规章和国际条约等的最新文本,完整地体现了我国与专利有关的最新法律、行政法规、司法解释、部门规章的修改情况,是广大考生复习、备考的权威参考工具书。
叙述了铷、铯资源在全世界及我国的分布特点。综述了近年来铷、铯矿石的处理方法与铷、铯金属主要的制备技术研究进展,针对其中的离子交换、溶剂萃取等工艺的原理、特点进行了分析与总结。简述了铷、铯金属近些年在量子计算、特种玻璃及电子元件等领域的应用现状与前景,并对其未来的发展进行了展望。
视网膜血管的表征变化与许多综合性疾病的早期诊断密切相关,对血管结构的性状分析是疾病诊疗的重要依据。基于计算机的视网膜血管自动分割技术,能够降低视网膜血管分割任务的资源消耗、节约专业医师的人力成本,是计算机视觉和医学图像分析领域研究的热点问题,基于上述背景,本文针对深度学习视网膜血管分割方法的标签获取、血管拓扑结构增强、多任务学习三个方面进行了研究:(1)提出了视网膜图像血管标签自动提取算法。近年来
服装衣长、领型等标签信息在电商平台的销售过程中起着重要作用,但是传统通过人工标注的方式费时费力,并且非常容易产生错误。为了解决该问题,本文依托课题组服装云交易平台,将计算机视觉与深度学习技术应用于服装标签识别,提出了一种改进的Inception-v4服装标签识别模型,并将其应用到服装上架过程中。服装商家只需上传服装图像,系统就能自动识别服装标签,再经过商家校对后存入数据库中,提高服装标签的准确率的
高光谱图像包含丰富的光谱和空间信息,且具有较高的光谱分辨率,图谱合一的特性使得高光谱图像在对地遥感观测等研究领域中,表现出较高的应用价值。然而,复杂的地物分布和有限的图像空间分辨率所引起的混合像元问题,往往限制着高光谱图像实际应用的准确性。为了从高光谱图像中提取更精细的信息,为后续研究和应用提供更精确的数据参考,光谱解混成为了高光谱图像处理中的一项关键技术,旨在提取构成高光谱图像每个像元的纯物质端