基于DNA计算的CLIQUE聚类算法研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:csxna
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球科技的发展,世界网络化程度日益加深,互联网的普及导致信息量激增,对海量信息的数据挖掘已经引起了信息产业界的极大关注。聚类是数据挖掘的重要手段,然而现代计算机已经很难满足传统聚类算法对速度和存储能力的要求,因此设计新的高效的聚类算法势在必行。DNA计算是借助DNA分子和生化操作实现数学运算的一种新兴的学科交叉计算模式,它将电子计算机解决的问题转换到特定编码的DNA序列上,通过杂交、电泳、提纯等一系列的生物反应得到问题的解空间,具有并行性高、速度快、存储能力强的特点。本文将DNA计算与经典网格聚类算法CLIQUE相结合,提出了一种基于DNA计算的CLIQUE算法,仿真实验结果表明,该算法可以有效降低网格聚类的时空复杂度,提高计算速度,具有一定应用前景。本文的研究内容和主要成果如下:首先,提出基于DNA计算的CLIQUE算法。将CLIQUE网格中的单元格转换成节点并连接那些候选节点成图,利用Adleman博士解决哈密尔顿路径问题的模型,建立适合转换图的DNA计算模型,在DNA分子进行生化反应后的产物中提取聚类结果。其次,通过仿真实验检测DNA计算模型效果。仿真实验通过计算机模拟顶点和连接边的DNA编码,然后进行杂交、电泳、提纯等整个生化反应过程,生成生化操作的所有可能解,从中提取出聚类结果。仿真实验用人工合成的少量数据证明了DNA计算解决CLIQUE算法的可行性,与原CLIQUE算法相比,新算法在保证聚类效果的前提下提高了执行效率。最后,在乳腺癌病历三维数据集上进行仿真实验。将该三维数据集映射到二维平面上,形成三个二维数据集,通过计算机模拟得出这三个二维数据集的聚类结果,再取其交集获得三维聚类结果,得出的乳腺癌发病高峰期和完全治愈时间与实际数据的分析结果相符合。
其他文献
近年来,随着计算机网络与通信技术、多媒体技术的快速发展,传统的监控系统也不断向着新的发展方向进行更新与发展。进而出现了结合计算机网络技术、多媒体技术及通信技术的多媒
本文基于OGSA(OpenGridServicesArchitecture)架构,采用WSRF(WebServiceResourceFramework)框架与WSN(WebServiceNotification)规范相结合,构建了一种虚拟化网格资源管理平台。
近年来随着手机技术的发展与手机的普及,基于手机的应用服务也越来越多,包括短信、网络浏览甚至可以进行个人信息的处理工作.一种既能快速输入又易学易用的手机汉字输入法对
创新知识的运用受到了越来越多的关注。其中突出存在的一个问题是解决创新知识社会共享和敏感知识私有的矛盾。只有创新知识的全社会共享才能最大限度发挥创新知识的再利用价
本文介绍了我们结合国外某公司的具体项目,所进行的一次ATM产品可用性研究的过程。该研究过程共分为三个阶段,我们总共运用了焦点小组、访谈和问卷、专家评估、用户反馈收集型
80年代中期,工作流(Workflow)概念被提出。90年代,随着计算机的普及,网络的延伸,工作流管理系统也由最初的创建无纸办公环境转而成为同化企业复杂信息环境、实现业务流程自动
在网络化制造模式下,企业联盟通常根据市场需要,因某个特定的项目而动态形成,并且随着项目的结束而结束。因此,项目管理技术对网络化制造的成效具有重要的作用。虽然项目管理技术
本文对通用的人脸检测算法进行研究,提出了一种融合使用灰度、梯度和肤色信息的人脸检测方法。在Viola-Jones的检测方法中,使用了类Haar特征描述人脸模式的灰度差规则,用AdaB
细分方法是近些年几何造型领域最活跃的研究热点之一:细分曲面连续性分析理论逐渐完善;新的细分模式不断涌现;细分技术被广泛应用于三维模型的多分辨率表示、计算机动画、数
视频点播系统依托音视频数据压缩技术和流媒体传输控制技术,利用网络为用户提供节目点播服务,实现了节目的按需收看和任意播放,为用户提供了极大的灵活性。如何确保音视频实