论文部分内容阅读
复杂疾病通常不能归因于单个基因的突变或异常,而是由多个基因和基因之间甚至是基因和环境之间的复杂交互作用所导致的,其复杂的致病机理给这些疾病的预防,诊断和治疗带来了困扰.特别地,在复杂疾病的发生发展过程往往是急剧变化并且毫无征兆的,这样的现象可以归结为复杂系统在某个阈值点从一个稳定平衡态切换到另一个稳定平衡态的分岔或临界突变.因此分析这种非线性系统的临界突变对于揭示影响生物正常功能的多重基因或环境因素以及识别关键驱动分子至关重要.本博士论文利用常微分方程定性理论和随机微分方程的统计分析,推导了临界突变的定性特征和统计特征,提出了识别复杂疾病动态网络生物标记物的定量新指标并探讨了这些指标的变化趋势,为预测复杂疾病临界突变的早期信号和识别动态网络生物标记物提供了新方法和新思路.本论文的创新性工作如下:第一部分,基于常微分方程模型推导了三个新的定量指标.1.证明了过分岔图上点的切线的斜率,即平衡态关于参数的敏感性作为识别动态网络生物标记物的指标.通过矩阵变换将非线性系统映射到中心流形上,并严密推导出中心流形上不同变量关于参数的敏感性变化趋势.然后,将中心流形上变量的参数敏感性还原到原始变量,进而分析得到动态网络生物标记物与非生物网络标记物关于参数敏感性的变化趋势.利用三个生物模型的数值模拟验证了此结论.2.理论推导了"恢复时间"可以作为识别动态网络生物标记物的一个定性指标.首先,将非线性常微分方程在平衡点处进行泰勒展开.然后,在微小扰动的前提下,取非线性系统的线性近似系统进行研究.接着,通过矩阵变换将线性近似系统映射到中心流形上,并算出中心流形上线性系统的解.再通过矩阵变换,将其还原到原始变量,从而得到原始非线性系统的近似解.最后,根据所得到的近似解比较动态网络生物标记物与非生物网络标记物对应的恢复时间的大小.利用三个生物模型的数值模拟验证了此结论.3.提出了将"势能"作为识别动态网络生物标记物的一个定性指标.具体来讲,即将"势能"定义为右端函数的平方关于时间的无穷限积分.首先,将一维非线性常微分方程在平衡点处进行泰勒展开,并研究了当临界突变即将发生时系统变量对应的势能的变化趋势.在此基础上,结合关于"恢复时间"的结果,推测了对于多维非线性系统,动态网络生物标记物与非生物网络标记物对应的势能在临界突变即将发生时的变化趋势.利用三个生物膜你的数值模拟验证了此结论.第二部分,基于随机微分方程模型推导得到了变异系数,概率分布和皮尔逊相关系数三个统计量可以作为预测复杂系统的临界突变的新指标.通过添加高斯白噪声到常微分方程来考虑实际数据的噪声,将得到的非线性随机微分方程模型映射到中心流形上,并求解中心流形上随机微分方程的解,从而可以得到原始随机微分方程的近似解.进一步,计算上述统计指标的表达式,并据此分析动态网络生物标记物与非生物网络标记物对应的上述指标在临界突变即将发生时的不同变化趋势.具体地,1.理论推导证明了系统地变异系数(CV)当系统参数P趋近于临界阈值P*时,即系统发生临界突变时,动态网络生物标记物对应的变异系数CV显著增大,并且明显大于非生物网络标记物对应的变异系数CV.此外,非生物网络标记物对应的变异系数CV没有显著变化.2.证明了当系统接近临界突变时,动态网络生物标记物的"变换后的概率分布(TPD)"这一指标急剧增大,非生物网络标记物对应的这一指标没有明显变化,而且动态网络生物标记物对应的TPD显著大于非生物网络标记物对应的TPD.3.理论分析证明了变换后的皮尔逊相关系数TPC,当系统接近临界突变时,动态网络生物标记物之间对应的指标TPC显著增大,并且明显大于非生物网络标记物之间对应的指标TPC.此外,非生物网络标记物之间对应的指标TPC没有明显变化,并且动态网络生物标记物与非生物网络标记物之间对应的指标TPC显著减小.最后,基于与疾病相关的高通量数据,利用以上三个指标来识别流感病毒H3N2,流感病毒H1N1,肺炎损伤等复杂疾病的动态网络生物标记物,得到的结果验证了我们的理论结果的正确性.本论文中提出的早期信号预警与动态网络生物标记物的方法,也可以推广应用于预测其他复杂系统的临界突变.