应用于癌症基因表达数据的OMB双向聚类算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:tdcdc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症基因表达数据的聚类分析可以为癌症的早期诊断和精确的癌症亚型分型提供依据。针对癌症基因表达数据的特点,提出一种称为OMB(OverrideMatrixBicluster)的双向聚类算法。OMB算法分别在基因表达数据矩阵的行和列上搜索低于阈值的行和列,用删除添加算法产生一个子矩阵;构建与基因表达矩阵大小相同的覆盖矩阵,标识矩阵中上一次迭代产生的子矩阵的位置;在标识出来的矩阵中,重复贪婪迭代搜索找到K个聚类结果。Matlab实验结果表明OMB算法对具有重叠结构的癌症基因表达数据具有更好的聚类效果。
其他文献
介绍了单孔检层法测量剪切波速的基本原理,搜集了锡林浩特地区的32个钻孔共计984条不同深度的土层剪切波速数据,通过数理统计方法计算出土层剪切波速在不同土层埋深段下置信
阐述了机务运用安全运程管理系统组成、系统功能设计及运行环境。
利用苏玛罐采集柴油车尾气,大气预浓缩系统与气质联机联用,分析柴油车尾气的挥发性有机物源成分谱,共分离出C4~C13的脂肪烃、醛、酮、酸、醇、醚、呋喃衍生物、芳香烃衍生物,以及
煤炭采制样对于技术有非常高的要求,是一项环节复杂,任务繁重的工作。本文分析了煤炭采制样必须按照国家的标准进行采样需要进行细致化分工,严格进行每项环节的管理和实施,采