论文部分内容阅读
通过基因调控网络可全面分析和了解基因之间的相互作用关系,从而找到引发疾病的基因,这对肿瘤等复杂疾病治疗至关重要。到目前已有许多学者针对基因调控网络模型的推断提出了基于微分方程模型的联合推断算法,但未见对各种算法性能的系统分析和讨论。本课题来源于国家自然科学基金项目“人体器官高通量DNA甲基化数据建模与疾病风险预测方法研究”。本文针对现有的一类推断基因调控网络模型的联合推断算法,就抗噪性、复杂性以及收敛性进行了系统地分析和比较。主要工作如下:(1)数据收集和处理。本文使用了一种模拟数据集,两种真实数据集,其中模拟数据通过E-CELL软件产生,真实数据集均来自于斯坦福微阵列数据库。并且对下载下来的数据进行了筛选。(2)整理联合推断算法。整理研究人员针对基因调控网络提出基于微分方程模型的联合推断算法,并将联合推断算法在Matlab平台上实现。(3)联合推断算法的影响因素以及抗噪性能分析。通过分析影响联合推断算法性能的因素,考虑噪声对推断基因调控网络的影响,最终得到遗传编程联合粒子滤波算法的抗噪声性能优于其他联合推断算法。(4)联合推断算法的复杂性以及收敛性分析。首先从数学角度对联合推断算法进行复杂性以及收敛性分析,再使用E-CELL模拟数据进行验证,最终得到考虑高斯噪声条件下遗传编程联合卡尔曼滤波算法复杂性最低,估计误差值达到最小,但遗传编程联合粒子滤波算法收敛最快;考虑非高斯噪声条件下遗传编程联合粒子滤波算法复杂性较低,收敛性性能最优。(5)基因调控网络在生物医学中的应用。将酵母菌数据集和人类宫颈癌数据集分别通过遗传编程联合粒子滤波算法得到基因调控网络,分析并推测基因之间的关系以及引发疾病的原因。