基于分子组学数据的生物系统临界点预警方法

来源 :钟佳元 | 被引量 : 0次 | 上传用户:jners08
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生态系统、气候系统、复杂疾病的动态发展和早期胚胎发育过程等复杂系统,都会存在一个临界状态(临界点),系统一旦越过临界状态,就会从一种状态进入另外一种性质不同的状态,这两种状态几乎不可能实现逆转。如果能够预警复杂系统的临界状态,我们将能够及时采取恰当的措施,预防或阻止临界点后带来的负面后果。例如,对于复杂疾病的动态发展进程,一旦越过疾病恶化的临界点,病情就会迅速恶化,此时很难实现有效的治疗。再如,早期胚胎发育过程中的“细胞命运抉择”关键期,系统从相对平稳状态越过“细胞命运抉择”关键期后,细胞就会分化成为其他类型的细胞。因此,探测这些复杂生物系统的临界点,对预防疾病的恶化或诱导早期胚胎干细胞朝着有利生命体的方向分化等具有很重要的意义。本论文基于数据驱动模型的观点,结合计算生物数学的理论和方法,从高维的海量数据中探测疾病恶化的临界点和预测早期胚胎发育过程中的“细胞命运抉择”关键期。本文围绕这些复杂的生物系统,针对不同的数据特征与数据类型,发展了以下三种临界点探测算法。(1)针对仅具有高维小样本特性的数据,发展了一种基于单样本的隐马尔可夫模型算法。它是一种非监督学习方法,把稳态到非稳定的马尔可夫过程与疾病从相对正常状态突然进入疾病状态的过程对应起来,利用正常状态和前疾病状态之间的动态差异,探测疾病即将恶化的临界信号。该方法是一种基于小样本数据条件下的临界点探测算法,从单样本水平探测复杂疾病的临界点。(2)针对噪声较强的数据,发展了一种基于分子分布信息的单样本Kullback-Leibler散度算法。以正常样本为基准来拟合分子分布(背景分布),然后基于Kullback-Leibler散度构建的指标来量化某时刻的检测样本对背景分布的扰动程度。如果指标有显著变化,则预警疾病即将进入恶化的临界状态。该方法是一种较强噪音数据条件下的临界点探测算法,具有较强的抗噪性能,能够对噪音比较大的生物医学数据进行临界点探测。(3)针对具有稀疏性质的单细胞转录组数据,发展了一种基于单细胞转录组数据探测早期胚胎发育过程中“细胞命运抉择”关键期的图熵算法。该算法主要包括构建每个细胞的特异性网络、把稀疏的基因表达矩阵转换为熵矩阵以及基于熵矩阵预测“细胞命运抉择”关键期。该方法是一种基于单细胞转录组数据条件下的临界点探测算法。
其他文献
以互联网技术为基础架构的网络空间已深深地嵌入到人类生产生活的各个方面,极大地影响了人类的生存方式和社会发展进程。然而,事物的发展往往呈现出两面性,互联网技术大大提高社会生产力、改善人类生活质量的同时,也带来了诸如数字鸿沟、网络犯罪、网络战争、侵犯知识产权和个人隐私权等多方面问题,有些问题甚至威胁到了国家主权和国家安全。习近平总书记指出,“当今世界,围绕网络空间发展主导权、制网权的争夺日趋激烈,各大
学位
在5G和B5G通信技术快速发展的今天,用户对无线通信网提出了大容量和高可靠的要求,但传统蜂窝通信网在应急通信场景下难以有效保障用户的可靠接入。而无人机负载和续航等能力的提升为其搭载通信设备充当移动空中基站提供了可能性,因此结合无人机部署灵活快速的特点,无人机通信将成为灾区和流量热点地区提升通信保障能力的有效解决方案。尽管将无人机集群应用于应急通信具有重大现实意义,但无人机集群频繁的拓扑变换和复杂的
学位
随着科学技术的发展,移动通信数据的迅速增加以及各种新业务和场景的持续出现,5G成为了国内外专家和学者重点研究的对象。在毫米波频段,由于存在丰富的频带资源,实现较大的带宽与较低的时延,能够满足在5G通信中的大信道容量和低延迟传输等需求,因此无线通信的工作频率逐渐地被扩展到毫米波频段。但同时也存在相对较大的路径损耗,导致传输距离大大减小,因此对毫米波天线的设计有着比较严格的要求。并且为了满足抑制栅瓣的
学位
随着5G的商用以及短视频时代的到来,流量需求呈爆发式增长,频谱短缺、链路拥塞、电磁干扰等等问题日益严峻,无线通信网承受了巨大的压力。与此同时,网络中存在着大量的同质化内容被反复传输,造成了极大的资源浪费。因此,减少无线通信网络同质内容的传输并提升用户访问获取资源的速率成为了当下亟须解决的问题。移动边缘缓存(Mobile Edge Caching,MEC)技术能够显著降低无线通信系统回程拥塞程度,极
学位
我国在2000年前后步入老龄化社会,之后成为世界上老龄化速度最快的国家之一,第七次人口普查数据显示,全国有12个省和149个城市进入深度老龄化。在此背景下,我国居民部门债务规模快速扩张时期恰好是我国老龄化加速期。2020年我国居民杠杆率达62.19%,在新兴经济体中居于首位,已经成为威胁我国金融稳定的潜在风险点。从理论上看,人口老龄化与居民债务风险确实存在一定的联系,但人口老龄化和居民债务风险的实
学位
粮食安全是国家战略,其关键在于提高农民的种粮收入,调动农民的种粮积极性。我国于2016年开始试点“保险+期货”模式,试点所涉及的农产品种类不断丰富,规模不断扩大,但现货价格与期货价格之间的差额使农户仍面临基差风险,且农户规模小、分散的特点使其难以获得稳定的售粮渠道。为解决这些问题,中央一号文件于2018年首次提出探索“订单+保险+期货”试点,在传统模式基础上引入“订单农业”,即农户向保险公司购买保
学位
基本线性代数子程序(BLAS)是一系列基本线性代数运算函数的接口标准,早已被广泛应用在科学计算和工业界的各个领域中,并对现代科学领域和工业发展起到了至关重要的作用。其应用场景针对大型输入(大型矩阵、向量操作)往往有较好的性能表现;然而在问题规模较小,而问题数量较大的场景下会由于资源利用不充分导致性能表现较差。因此近年来提出了批量BLAS(Batch BLAS)的概念和初步实现,以应对这种新兴趋势带
学位
历史文献之中,感物说最早出现于《礼记》,这是最早对感物说这一思想加以记述的典籍,并在后续历史发展的过程中,这一思想学说日渐完善。其内容日渐丰富,至刘勰的《文心雕龙》之中对“感物说”的看法,标志着这一思想开始成熟,成为一种完备到达文学理论。其中详细阐述了“物、情、辞”三者之间的内在关联,促使感物说从自然事物逐渐过渡、扩展到了社会生活,再到心中之物,明确了有感才有言的思想。立足于这一特点,“感物说”意
期刊
随着移动通信系统的迅速发展,第五代移动通信系统(5G)已经大规模实现商用。为了兼顾以往的2G/3G/4G通信系统,最基本的要求是基站天线的阻抗带宽需要至少能够同时覆盖1710-2690 MHz和698-960 MHz。采用多频基站天线可以大大减少天线的数量,减少安装空间,降低运营商成本,因而,研究覆盖多个频段的多频基站天线的异频去耦等技术,有非常重要的实用价值和现实意义。但是,目前的基站天线,对于
学位
云制造作为一种新兴的面向服务的网络化制造模式,通过服务匹配、服务优化选择等,实现企业间制造资源的高效共享与协同制造,为用户提供可随时获取、按需配置且优质廉价的制造服务。本文考虑云制造背景下制造资源的异构性特征、服务需求的复杂性与多样性特征,对云制造平台中制造资源的服务化封装、制造服务优化配置等问题进行研究,主要研究内容如下:(1)针对云制造背景下制造资源多样、异构和复杂的特点,提出一种基于扩展OW
学位