论文部分内容阅读
真核生物基因表达调控是一个复杂的过程,它包括了转录水平调控、转录后水平调控、翻译水平调控、翻译后水平调控等。这些调控过程之间动态、精确地调控对于基因表达效率以及精确性起至关重要的作用。近年来,越来越多的研究人员对基因表达调控在各种疾病的诊断和治疗等方面的应用寄予了极高的厚望。本文利用稀疏多块偏最小二乘回归算法和粒子群算法的稀疏多块偏最小二乘回归算法对多层基因表达调控模块的鉴定展开了深入的探索。首先本文采用稀疏多块偏最小二乘回归算法在包括拷贝数变异,DNA甲基化,microRNA的表达和基因表达的TCGA卵巢癌数据集上鉴定多维调控模块,通过程序得出了其中的34个调控模块,并对这34个模块的生物学意义做了部分的阐述。同时得到拷贝数变异,DNA甲基化,microRNA的表达与基因表达调控的关系图。其次,由于稀疏多块偏最小二乘回归算法在进行模型求解的过程中,对于参数的选择上具有主观性,因此在稀疏多块偏最小二乘算法的基础上,引入粒子群智能算法,对我们所建立的模型中的参数进行优化,并以交叉验证的CV得分值作为适应值。经验证,选取适当的参数可以得到更加优化的结果,使得所得的结果更具统计学意义,同时也会有更好的现实指导意义。