基于模糊理论的基因表达双聚类算法研究

被引量 : 0次 | 上传用户:shanian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物基因测序的发展,基因表达数据量大且复杂,双聚类算法已被广泛用于挖掘基因表达数据,成为一个新的研究热点。与传统的聚类不同,双聚类是从行和列两个方向同时进行聚类,具有局部聚类的特性。为了对基因表达数据进行更好的处理,双聚类问题也越来越被重视,是生物信息领域的一个重要研究课题。本文提出了用模糊理论的方法在Cheng和Church算法的基础上对其进行改进,实现了应用在大数据上使得聚类更加精确。首先对双聚类算法加入综合评判标准,让算法在对行和列进行添加删除操作的同时考虑加入综合评判,使得筛选更加精确,能找出更加精确的双聚类。然后用模糊随机变量特征值取大的方法,配合评判矩阵(平方残基隶属矩阵),使得算法的迭代不会在原始数据上失真。最后对基因表达数据做预处理,选取一个大数据跟一个小数据进行实验,并对实验结果作对比。该方法主要加入了模糊理论的综合评判等方法,并使得算法迭代数据不失真。实验结果表明改进后算法在大数据筛选上的平均平方残基与得到的双聚类的容量都优于原算法。在上面改进的算法基础上,考虑用多目标优化的方法对算法进一步改进。多目标优化考虑到双聚类算法的两个标准:最小化平均平方残基和最大化双聚类容量。加入多目标优化后的算法在对基因表达数据做实验,实验结果与前面的实验作比较,加入多目标优化的算法在平均平方残基与双聚类容量上都得到优化。再与现在的主流双聚类算法作比较,多项数据位居第二。
其他文献
介绍核电企业供应商绩效评价的目的及评价指标、周期等内容确定的基本原则,对绩效评价分数的计算方法及定级原则进行了阐述,并对绩效评价结果的应用提出建议。
纸制食品接触材料与人们的生活密不可分,由于其相对于塑料食品接触材料更加环保和卫生,近年来被广泛采用,而且其进出口贸易额也迅速增长。随着食品安全定义范围的不断扩大,各国
[目的]观察综合疗法治疗神经根型颈椎病(气滞血瘀证)的临床疗效。[方法]将120例患者随机分为两组。对照组50例口服美洛昔康同时配合颈椎牵引,治疗组70例在对照组治疗基础上内
新的会计准则包容性较强且具有普遍适用性,没有更多考虑到一些特殊行业核算上的特殊性,致使相关行业在实施新会计准则时遇到很多困惑。本文仅就公路经营企业在执行新会计准则
大清咸丰十年(1860),两万英法联军侵略中国,从香港、广州、舟山、上海、烟台、天津一路进占北京,劫掠并烧毁了万园之园——圆明园。举火之前,英法联军对圆明园实施了大规模的全面洗
报纸
企业培训是企业人力资源管理的重要内容,是企业生存与可持续发展的源泉。然而,当前我国大多数中小企业的培训还比较薄弱。本文分析总结出我国中小企业存在培训意义认识不到位
随着旅游业的持续快速发展,我国酒店业已经进入到品牌竞争时代。品牌建设对于酒店提升自身核心竞争力的作用已不言而喻,而体验营销则是区别于传统酒店品牌建设的一种全新且有
本文采用直流磁控溅射法在玻璃态SiO2衬底上制备Au薄膜。由于两者之间错配系数太大,导致Au膜与衬底之间附着力较差,在沉积Au之前,先在衬底上沉积一层Cr作为中间层。最后制得SiO2
文章基于资源基础理论,探讨民营企业继任的三种模式:内部继任、职业经理人和团队继任模式,分析各种继任模式的特点,并构建民营企业不同继任模式的选择路径,针对不同继任路径的
随着社会经济的发展和人民生活水平的提高,在我国的许多城市里,越来越多的如展览会、体育赛事或文娱演出这样的大型活动频繁地举行着,近年来,这些大型活动都在朝大规模、大影响和