【摘 要】
:
随着深度测序技术的迅速发展,基因组、转录组、表观遗传组等多组学测序数据迅速积累,为发现生物体的细胞类型构成、理解细胞内基因调控机制,进而解析重大遗传疾病发生发展的生物学机制提供了丰富的数据资源。然而,全方位解读这些生物大数据,目前还面临利用生物大数据推理复杂生物知识不够精确、对生物大数据多源异质协同分析不够细致等局限。近年来,以深度学习为代表的人工智能技术在多个领域已取得突破性进展,为解决上述关键
论文部分内容阅读
随着深度测序技术的迅速发展,基因组、转录组、表观遗传组等多组学测序数据迅速积累,为发现生物体的细胞类型构成、理解细胞内基因调控机制,进而解析重大遗传疾病发生发展的生物学机制提供了丰富的数据资源。然而,全方位解读这些生物大数据,目前还面临利用生物大数据推理复杂生物知识不够精确、对生物大数据多源异质协同分析不够细致等局限。近年来,以深度学习为代表的人工智能技术在多个领域已取得突破性进展,为解决上述关键问题提供了强有力的手段。本论文以染色质开放性数据的信息解读为主线,通过融合多种组学数据的方式,研究预测染色质开放性的机器学习方法、探索单细胞染色质开放性数据分析的理论与方法。主要研究内容及创新成果包括:1.针对染色质开放性预测问题,提出了一种整合基因组序列与进化保守性的随机森林方法kmer Forest,实现了在给定细胞系下基因组的染色质开放性预测。进一步提出了整合基因组短片段词频的混合卷积神经网络模型Deopen,实现了染色质开放性信号的二值分类与连续值回归。大规模交叉验证显示上述方法的预测性能优于已有方法,且预测结果对遗传学数据的分析具有促进作用。2.针对跨细胞系染色质开放性预测问题,提出了一种融合基因组注释及转录组数据的密集连接卷积网络模型Deep CAGE。通过利用已有生物学先验知识,有效提升了模型的预测性能,并进一步建立了基于染色质开放性解析复杂表型相关非编码区遗传因素的分析方法,应用于复杂表型研究中。3.针对基于单细胞染色质开放性数据的细胞类型发现问题,提出了一种循环生成对抗网络模型sc DEC,首先从概率密度估计的角度论证了该模型的理论基础,并在细胞聚类等一系列任务中展现了模型的优异性能,还实现了单细胞染色质开放性与单细胞基因表达数据的协同分析。该模型在对细胞聚类的同时能对单细胞染色质开放性进行降维表示,从而促进了后续细胞轨迹推断、细胞调控机制解析的研究。本论文从“数据融合,信息迁移”的观点,系统性地研究了细胞群与单细胞染色质开放性数据分析中的关键问题,对生物数据解读中的概率密度估计等共性基础问题进行了创新性探索,研究成果不仅能对大规模染色质开放性数据高效分析,还能加强对细胞调控机制的深入理解,从而促进对遗传学数据的有效解读。
其他文献
圣经解释学在基督教哲学中具有重要的地位。《圣经》是基督教唯一权威的文献,基督教的历史进程和基督教思想家的神哲学思想都与如何理解和解释《圣经》这一问题密切相关。在圣经解释学方面,奥古斯丁是第一位写作专门的论著讨论如何解释《圣经》的哲学家。奥古斯丁在自己这本解释学著作《论基督教教义》中,把建立双重的爱(caritas)——爱上帝与爱邻人如同爱自己——作为圣经解释学原则提出。这个爱的原则是理解奥古斯丁圣
管辖是实现司法正义的第一道门槛。管辖制度设置合理,有助于犯罪控制、当事人合法权益的保障和公平正义的实现。国家监察体制改革引发了刑事案件管辖格局的变化,监察机关成为职务犯罪的主要调查机关,意味着监察调查与刑事侦查成为目前刑事犯罪查处的两种主要方式。当被追诉人的行为既涉嫌监察机关管辖的职务犯罪,又涉嫌侦查机关管辖的普通犯罪时,就产生了监侦互涉案件的管辖问题。这其中既涉及管辖法律规范的解读、管辖基本原则
对于移动车辆而言,多传感器信息融合是确保其在复杂多变环境下长期智能化自主运行的关键技术,其本质是将多种不同模态的传感器进行多层次、多空间的信息互补和优化组合处理,最终产生鲁棒、准确的状态估计。其中多传感器高精外参标定是其前提和必备条件,外参是两个传感器之间的刚性变化矩阵,以此为基础可以将系统中的多传感器观测转换到同一个基准坐标系下来共同使用。而外部传感器之间的标定有传感器间视野共视的要求,无需共视
着眼于高性能钢材及高性能钢结构体系广阔的应用前景,本论文创新性地提出了高强钢柱-普通钢梁-低屈服点钢防屈曲支撑结构体系,并重点对其抗震性能与设计方法展开研究。论文的主要内容如下:(1)完成了以国产LY100、LY160与LY225牌号低屈服点钢为内核的防屈曲支撑循环加载试验,分析了其破坏模式、滞回性能等,为国产低屈服点钢防屈曲支撑力学性能提供了基础试验数据,亦为本文后续体系的研究工作及相关数值模型
近年来,广东省以“减猪稳鸡、增加牛羊、突出特色、做强种业、提升品质”作为指导思想,优化畜牧产品发展结构,提高畜牧业发展科技水平,以此有效促进畜牧业的长期高质量发展。人才是发展第一资源。在当前形势下,畜牧兽医专业人才的培养要求也有进一步提高。广东省中职畜牧兽医专业需要进一步加大信息化建设,培养更多的中职专业人才,使其具备畜牧兽医专业技能知识、实践技能的同时,具备信息化技术基本能力,以应对畜牧兽医行业
“物质粒子性”大概念是化学学科重要的大概念之一。刻画与描述学生物质粒子性大概念发展路径对于诊断和促进学生的学习具有重要意义。有关大概念的学习进阶水平能够为学生核心素养的发展路径提供一定的基线校准,从而有效在大概念进阶水平的基础上来指导学生整合科学知识和科学实践能力水平的刻画。科学建模是学生科学学习活动中十分重要的科学实践活动之一。理解学生整合科学知识的科学建模能力发展路径对于理解学生核心素养的达成
目前在自然界所已知的细胞膜中,几乎都可以在其上找到具有a螺旋结构的插膜蛋白,而具有b折叠桶状结构的膜蛋白则只能在革兰氏阴性菌、线粒体和叶绿体的外膜上发现。具有b折叠桶状结构的外膜蛋白属于Omp85/TPS超蛋白家族。该家族蛋白的生物发生过程都依赖于一个共同的组装机器——BAM(b-barrel assembly machinery),其主要是以BamA为核心。前期的研究结果表明,BAM复合物能够维
糖尿病(DM)是一种由多病因引起的以慢性高血糖为主要特征的代谢紊乱疾病,目前已成为世界范围内的主要公共卫生问题。DM多诱发血管性并发症,并危及许多器官如心、脑、肾、眼、足等,其中心血管疾病的并发症比较高。近年来,与糖尿病相关的冠脉微循环障碍逐渐引起研究者的注意。心脏微血管主要由位于循环末端的心脏微血管内皮细胞(CMEC)组成,控制心肌灌注和冠状动脉储备。鉴于微血管与血流之间的直接接触,CMEC比心
突破性创新的涌现和数字时代的到来,企业和产业边界逐渐模糊。新产业、新模式和新业态涌现,行业格局不断被深度重构,驱动着竞争格局发生着演变。为应对技术的快速发展和商业环境的不确定性,企业往往采取联盟竞合方式获取关键异质资源,以保证核心产品的顺利交付并实现市场价值。然而,现实中超过50%的竞合关系未能产生预期结果。由于竞合是产生结果的手段和渠道,如此高的失败率表明竞合过程非常具有挑战性。因此,竞合过程潜
射血分数保留型心力衰竭(Heart failure with preserved ejection fraction,HFpEF)是心室舒张功能障碍,心搏量减少,而心室收缩功能正常或轻度受损,左室射血分数尚处于正常范围内的一种心力衰竭。其高发病率和高死亡率成为目前最具挑战性的临床综合征之一。然而,以慢性心衰常规治疗方式如β受体阻滞剂、RAAS系统拮抗剂、醛固酮拮抗剂均不能有效降低其住院率及死亡率。