基因芯片预处理中的位置相关紧邻的扩展模型(GPDNN)

来源 :北京大学 | 被引量 : 0次 | 上传用户:mars1998
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Microarray芯片的预处理一直是生物信息学研究的热点,从探针层面提取出准确基因的信息是芯片数据后续分析成功的关键因素。成功的预处理方法必须既能够去掉芯片探针非特异性杂交的噪音,又能够最大限度地保留探针特异性杂交的信息。解决这一问题的出发点便是准确地理解芯片探针与靶序列间的杂交机制,正确地区分非特异性杂交和特异性杂交。   位置相关紧邻模型(PDNN)对非特异性杂交和特异性杂交进行了区分,并对特异性结合与非特异性结合分别建模,本文在这套方法的基础上进行了扩展。在研究中我们发现,MM探针包含了大量的非特异性结合的信息,因此我们在非特异性结合模型中,增加MM探针的信息来提高估计的精度。在模型实现过程中,我们引入Wilcoxon符号检验,判定基因的表达与否,根据基因的表达判定确定出特异性结合和非特异性参数的两个训练集,对两套参数进行分别训练。这样不但可以提高参数的精度,也更有利于解释特异性杂交和非特异性杂交的特性。   我们将扩展的模型(GPDNN)应用到三类不同芯片(HGU133plus2.0、Rice Array和HGU133A)的实验数据上。通过聚类等分析方法比较发现,GPDNN模型从精确度和稳定程度上都优于常用的四种预处理方法Mas5.0、dChip、RMA和PDNN。
其他文献
稳健性是数据分析中十分重要的概念,可以说它与数据分析有同样悠久的历史,但百余年来只限于朴素的思想和简单的方法,直到本世纪60年代P.J.Huber和F.R.Hampel等人建立了一套理论
关友声先生的山水画作早被大家熟悉,而张茆才先生的写意花鸟画,却因其独到的艺术见解,受历史局限,不被众人所知。张茆才先生(1894—1963),山东省安邱县人。1916年考入济南高
故事对儿童具有一种特殊的吸引力,生动、有趣的故事能够引起孩子们极大的兴趣。在我们的英语教学中,把学生们对故事的喜爱引入学习中去,有利于小学英语的课堂教学,提高小学生
如今的电子商务时代,企业日常运作中需要保管大量的、含有核心商业机密的电子文档。而随之出现的,却是企业文件泄密的现象日益严重。例如,非法用户通过入侵的手段,窃取其他用户计
新课改的深入和发展对小学语文的教学方法和内容提出了更多的新要求,为了适应这些新要求,各种新的学习模式便应运而生.合作学习就是其中一种应用型极强的学习模式,备受教师和
近年来,对于复杂网络的研究已经成为数学、计算机、物理等多学科交叉的热点研究领域之一。通过研究发现,复杂网络具有一些重要的性质比如小世界性质(Small World)、度序列幂率
本文主要研究单纯集及其同伦理论,以及单纯同伦论在经典同伦论中的应用.在此基础上给出了单纯群的自由积在单纯集同构意义下的分解.利用组合的方法,结合单纯理论给出了一些回路空
非线性最小二乘问题是最优化领域里非常重要的一类问题。工程计算中大量的实际问题最终都会归结为非线性的参数估计或数据拟合问题,而非线性最小二乘问题正是这两类问题的数学
本文首先讨论Ginzburg—Landau方程的结构稳定性,证明了方程的解对系数b和c的连续依赖性。接着在齐次Dirichlet边界条件下,用两种方法得到了倒向时间(backward in time)的Ginzb
随着科学技术的迅速发展及计算机应用的广泛普及,科学与工程计算已深入到许多科学与工程领域,非线性数值分析的理论与方法日益受到数学、计算科学、信息科学、物理及生命科学等