用于基因芯片和质谱数据分析的混合模型研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:jpjxn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高通量生物技术的长足发展,基因芯片和质谱技术逐渐取代传统方法成为对各种疾病和生理特征进行准确比较和量化的重要手段。尽管其前景可观,这类高通量技术给数据分析却带来众多挑战。其根本原因是采用这些技术时,通常所产生的数据集都具有高特征项低样本量的特征。因此,要对数据样本进行准确分类,如何选取数据中的相关特征项成为数据分析成败的关键。经过近十年来的不懈研究,许多运用于其它领域和许多直接针对这类数据而设计的统计方法和算法被运用于解决进行数据关键特征选取的问题。然而,没有哪一种方法是所谓的“最佳方法”。相反的,对于不同数据,各种方法的分析结果显现出不稳定性。对于某种特定方法,分析效果时好时坏的情况在这类数据集的分析中时常发生。为了克服各种分析算法的弱点并合并它们的优势,进行混合型算法研究成为这类数据分析的一种重要途径。本文中,我们就如何进行基因芯片和质谱数据分析的混合算法设计进行讨论。我们首先给出一种基于多目标遗传算法和联盟分类算法的混合模型,并将其应用于基因芯片数据的特征基因选取和样本分类中。最终通过对多组两类和多类别型基因芯片数据的分析实验,验证了我们的多项假设和这种方法的有效性。在此基础上,我们进一步提出一种将聚类算法与上述多目标遗传算法模型进行组合的混合算法。基于生物学中心法则,我们成功地将原来用于基因芯片处理的数据分类概念运用于质谱数据的分析,并运用两组高通量质谱分析产生的数据集对所提出的基于聚类的混合模型进行了有效性的验证。实验结果表明,我们提出的混合算法在基因芯片和质谱数据的分析上有其独特的优越性,能起到为后续的各种生物分析和验证工作提供重要指导的作用。
其他文献
一个“智能”的系统必须能够感知,规划和控制,只有具备了上述能力的系统才能够完成不平凡的任务。在这篇文章中,我们讨论了这样一个系统:一个在动态环境中基于自身传感器工作的四
Java语言使用垃圾收集器自动回收无用对象的内存单元,造成Java语言相较于C++等其它面向对象语言运行效率低。因此,有必要通过优化对象内存空间管理模式,提高Java虚拟机的运行性
互联网的开放性为信息共享和交互提供了极大的便利,但随之而来的网络安全问题也日益明显。防火墙作为一种有效的安全防护措施被广泛应用于各种类型的网络当中。然而,传统的防火
智能规划与规划识别是人工智能(Artificial Intelligent)研究领域的一个重要分支。1995年Blum和Furst提出基于规划图的快速规划方法——图规划(Graphplan),使智能规划领域的
网络地理信息系统(WebGIS)作为网络技术和GIS技术的结合点,随着计算机技术、网络通讯技术、地球空间技术的发展,万维网地理信息系统正成为大众化的信息工具,越来越多的Web站点提
复杂性科学被誉为是"21世纪的科学",主要研究复杂系统与复杂性,涉及领域广泛。其中生物领域的系统最为复杂,与其它领域的系统不同,它们具有一个明显的特点:拥有“活”的元素。这些
随着Internet的飞速发展,网络中的信息急剧增多,网络已成为人们获得信息的必要途径和重要手段。网络中的海量信息既给人们带来方便,也带来了许多问题。面对信息的海洋,如何从中找
目前基于内容的图像检索(CBIR)系统在图像的低层特征与图像的高级语义特征之间还存在着较大的鸿沟,本文针对此问题,提出了一种基于迭代logistic回归和贝叶斯(Iteration Logis
随着芯片技术、通信技术和传感技术的飞速发展,目前传感技术正迈入无线传感器网络新时代。这种网络由大量集成有传感器、数据处理单元和无线通信模块的微小节点组成,通过自组
随着信息技术的飞速发展,计算机网络已经渗透到人们生活和工作的各个方面,移动互联设备也正在逐步成为人们获取信息的主要工具。在此背景下,利用移动设备澡的通信能力进行动