论文部分内容阅读
本文的研究内容分为两部分,一部分是马尔可夫决策过程理论方面的研究即连续时间马尔可夫决策过程的多约束最优,一部分是马尔可夫决策过程在基因调控网络中的应用.全文共分七章,主要内容如下:
第一章为综述,首先介绍了系统生物学的产生背景、研究内容和研究方法,接着介绍了系统生物学的重要研究对象-基因调控网络,然后介绍了本文用到的马尔可夫决策过程模型以及优化准则,最后分析了马尔可夫决策过程方法在基因调控网络中研究的可行性及其意义.
第二章讨论了可数状态空间多约束的连续时间马尔可夫决策过程,费用和转移函数都是无界的,优化的准则是长期期望平均费用,并且一些约束强加到相关的费用上.我们不仅给出了多约束最优策略存在性条件,并且对于单链模型,转换这个多约束问题为线性规划问题,建立了多约束最优策略的线性规划算法.
在本文其余的几章中,分别对生物系统的生化反应和概率布尔网络建立马尔可夫决策过程模型,并且研究了相应的优化问题.马尔可夫决策过程在基因调控网中的应用方面的结果如下:
第三章研究生化反应中随机波动的最优控制问题.我们把生化反应的随机模型描述为连续时间马尔可夫决策过程,用连续时间马尔可夫决策过程的平均准则的策略迭代算法先得到使化学物种分子数均值最大的速率常数,然后继续用策略迭代算法在使化学物种分子数的均值最大的速率常数里找到了使化学物种分子数平均方差最小的速率常数.据我们所知,以往的文献没有考虑过这样的优化问题.
第四章介绍布尔网络和概率布尔网络相关的定义和基础知识.
第五章讨论了如何选取最优的控制输入使概率布尔网络首次到达不想要的状态的时间不超过给定的时间的问题.我们建立了概率布尔网络的离散时间马尔可夫决策过程首达目标模型,通过最大化首次到达想要状态的概率从而解决了这样的优化问题.这一章反应了真实生活中的某些疾病的概率变化情况;我们所采用的优化方法和算法与以前的文献不同.
第六章考虑在一个推广的非同步的概率布尔网络中如何选取最优的组成性布尔网络使得和网络行为相关的风险概率最小.我们建立推广的非同步的概率布尔网络的半马尔可夫决策过程模型,通过最小化首次到达和进展期相联系的不想要状态的时间不超过给定时间的风险概率从而研究了这样的优化问题.以往的文献都是以控制输入序列为策略,而我们以布尔网络为策略;本章的优化方法为半马尔可夫决策过程,而以往文献用的是马尔可夫决策过程方法,本章使用的方法是以往文献优化方法的推广,