谱聚类在基因表达数据分析中的应用与研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:laoniuge
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着基因芯片技术的快速发展和广泛应用,产生的基因表达数据呈指数增长。如何分析和处理这些海量的数据成为分子生物学领域一个新的问题,为此,生物信息学作为一门新兴的学科快速发展起来并成为了前沿研究领域。基因表达数据反映的是通过基因芯片实验得到的基因转录产物mRNA在细胞中的丰度,通过分析这些基因表达数据,可以获取基因功能和基因表达调控信息。对基因表达数据的分析研究己成为生命科学、数学与计算机科学等学科非常活跃的交叉课题之一,也是目前生物信息学领域研究的热点之一。   聚类技术是分析海量数据的一种重要手段,通过聚类分析,能够将表达相似的基因划分到相同的类,从而可以通过已知功能的基因推测同一类中未知功能基因的功能,进一步可得到基因表达的调控网络。   论文着重研究基因表达数据的聚类分析,主要进行了以下的研究工作:   ①针对目前常用于基因表达数据的聚类算法中存在对数据分布形状依赖性强、聚类结果收敛于局部最优等缺点,论文引入了谱聚类来对基因表达数据进行聚类分析。谱聚类是一种基于数据矩阵特征向量的方法,也是一种能够根据顶点之间的权值对图进行划分的方法,该算法不依赖于数据的分布形状,且收敛于全局最优。   ②由于谱聚类无法自动确定聚类数目,需要通过反复迭代来计算特征值和特征向量,算法运行时间比较长。因此论文提出了Vp方法,使谱聚类能自动确定聚类数目,这对于分析庞大的基因表达数据是非常必要的。   ③针对基因表达数据维数高、样本少的特点,结合生物领域知识,论文提出了样本放大权重的思想,使聚类结果更准确,聚类效果更明显。   ④针对基因表达数据聚类分析的目的,论文提出了一种计算聚类正确率ARI的方法,然后以该方法作为聚类效果的外部评价指标,再与经典的内部评价指标adjust-Fom一起对各算法的聚类结果进行了评价和分析。   ⑤对上述研究进行了模拟实验。实验证明:1)谱聚类能对任意分布形状的数据进行较好的聚类;2)对于基因表达数据,谱聚类的聚类效果优于层次聚类算法和Kmeans算法;3)论文提出的Vp方法使谱聚类能够自动确定聚类数目;4)对指定样本进行放大后,聚类结果更准确。   ⑥确定了论文所用数据集的样本放大权重θ与亲密度函数参数σ之间的关系,以及各数据集合理的θ取值范围。
其他文献
伴随着计算机技术的发展,虚拟植物在教育、娱乐、农业研究等诸多领域得到了广泛的应用。虚拟植物已经成为计算机图形学的一个重要研究领域。虚拟植物,就是在计算机上利用虚拟
学位
前些年,汪中求先生写了一本叫做《细节决定成败》的书,这本书很快风靡海内外,被各领域的成功人士尊为宝典。其实,细节无处不在,对一个细节的关注,就可能带来一次意想不到的成
南非Palabord铜矿作为露天矿的设计经济开采年限是2002年,需处理的粗玄岩的数量越来越大。如果2002年后,矿山向地下采矿发展,与粗玄岩的硬度、耐磨蚀性和抗冲击磨矿性相关的
武警黑龙江省大兴安岭地区森林支队四中队的前身是黑龙江大兴安岭森警支队一大队。在1987年“5·6”特大森林火灾中,因作战勇敢顽强,该中队荣立集体一等功。1988年7月,该中队
在这个新的数字时代,电子商务已被证明是刺激企业增长和收入的有效工具,例如中国的阿里巴巴和美国的亚马逊。另一方面,因为中小企业是一个国家的发展动力,而中国是安哥拉最大的贸
美联社21日自北京报道,中国对政府官员发出警告,赈灾过程中出现的任何腐败都将受到严惩。中国国务院周三在其网站上发布公告说,中国最高反腐败部门将严肃处理滥用或延迟发放
图形用户界面缺陷产生的一个可能原因是:代码中存在code smells,导致重构问题,引起图形用户界面缺陷。在软件缺陷报告的辅助下,可以较快定位缺陷代码,以此加快图形用户界面缺
无线传感设备均存在电池供电、内存小、CPU处理能力低和数据实现率等限制,因此在提供QoS保障的同时必须考虑如何高效使用这些资源。在特定的多媒体网络环境下,我们不仅仅要考虑
[摘 要] 培养研究生的科学精神可有效提升其创新能力。从旅游管理专业毕业生就业状况、旅游行业实践以及旅游学科发展态势分析,旅游专业研究生教育亟须强化科学精神培养。鉴于旅游实践和学科发展现状,旅游管理专业研究生教育应在培养方案、课程设置及教学过程中充分体现对学生科学精神的培养。任课教师和导师应努力培养学生敢于质疑的勇气和勤于思考的习惯。在理论教学环节中应注重对旅游理论的反思与探索,在实践教学环节中应
随着Internet的蓬勃发展,计算机和网络已成为人们工作和生活中不可或缺的一部分,利用计算机和网络开展的业务也越来越多样化,其中之一就是电子商务。电子商务是在开放的互联网基础上实施的,由于其高效率、低成本的优势,为企业的发展带来了新的机遇,逐渐成为新兴的商业模式,以后必将成为未来信息社会商务活动的主要形式。在网络上,每个用户都面临着各种各样不安全因素的威胁,而电子商务中有涉及到很多个人的敏感信息