模糊聚类在基因表达数据分析中的应用研究

来源 :西南科技大学 | 被引量 : 0次 | 上传用户:cgz1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因表达数据分析是当前国际生物信息科学研究的热点。针对基因表达数据的海量性和已知功能基因少量性的特点,采用不需要先验知识的聚类方法,能够直接将具有相似表达水平的基因聚在一起,是分析基因功能的有效途径。 本文根据四川省医学科学院动物研究所提供的大鼠抑郁症基因芯片生物实验数据的特性对其进行数据挖掘分析,主要内容包括: 第一,根据芯片上看家基因的表达值对其它表达值进行标准化,使来自不同批次实验的同一基因的表达数据在量纲上达成统一;根据基因表达数据的生物意义对其进行降维,不仅减少了数据量,而且保持了数据集的完整性。 第二,把大鼠同一基因在其不同病理状态下表达值的比值作为数据挖掘的输入数据,可快速找出变化相似的基因,使挖掘结果能更好反映基因的生物学意义。 第三,采用改进的FCM算法和xie—Beni指数相结合的方法作为基因表达数据的挖掘算法,不仅对基因样本类属的不确定性进行了描述,而且避免了无根据确定聚类数的盲目性。 第四,针对基因表达数据分析和模糊聚类的特点对挖掘结果进行可视化描述,使复杂结果简单化。 经过测试,上述研究达到了从数据中提取具有生物学意义的抑郁症相关基因分类结果和测试新药疗效的目的。
其他文献
随着电信业的迅速发展,用户对新业务的需求不断增加,传统的以电路交换为主的电信体系已经不能适应新业务的需求,因此建设以软交换为核心的下一代网络势在必行。 下一代网络通
可执行程序的反编译是逆向工程中一个重要的研究领域,自高级程序设计语言出现之时,反编译就随之出现了。传统的针对过程式语言的反编译的研究已经颇有建树,而如今随着面向对象概
作业调度是影响面向大数据应用分布式计算的MapReduce框架性能的重要因素,成为近年来的研究热点。相互独立的周期性执行批处理作业是MapReduce环境下的重要作业类型。本文研究
排样是计算机技术和现代经济发展的产物。排样问题的目标就是尽最大可能在材料上放置尽可能多的零件,以减少材料损失。计算机辅助排样是广泛应用的计算机辅助技术之一,具有板
论文主要分三部分。第一部分(第二章),介绍了遗传算法的主要思想,起源,优点,缺点,主要应用框架,主要因素对遗传算法的性能的影响。第二部分(第三章),结合遗传算法的不足,有针对性的对
网络的飞速发展,政务、商务及日常生活的信息化,使得与公钥密码技术相伴的数字签名技术有了广泛的应用前景。数字签名之于数字文件,正如手写签名之于纸质文件,在电子商务和政务中
人们使用互联网方式的改变增加了对组播技术的要求。从视频会议到网络直播,从数据共享到多方游戏,网络带宽的耗费越来越高。以节省网络资源著称的组播技术无疑将发挥越来越重要
近年来,随着计算机视觉技术的快速发展,新兴的无人驾驶汽车、增强现实、虚拟现实等领域取得了显著的成绩,然而随着工业界的推进,这些领域在精度和效率上有了进一步需求,光流估计和
近年来,数据挖掘逐渐成为研究的热点。数据挖掘是从大量数据中发现知识,源于诸如数据库系统、数据仓库、统计学、机器学习、数据可视化、信息检索和高性能计算。获取的信息和知
面对存储数据的爆炸性增长,知识发现和数据挖掘应运而生。它能从大量、不完全、有噪声的实际数据中,有效提取隐含在其中的、事先未知但又潜在有用的知识,并能够为我们的现实决策