【摘 要】
:
聚类分析方法按一定的距离或相似性测度将数据分成若干不同的组,由此发现整个数据集合的分布、结构与模式。根据学习方式的不同可将聚类算法分为两大类:有监督聚类和无监督聚
论文部分内容阅读
聚类分析方法按一定的距离或相似性测度将数据分成若干不同的组,由此发现整个数据集合的分布、结构与模式。根据学习方式的不同可将聚类算法分为两大类:有监督聚类和无监督聚类。监督方法的分类精度通常较高,但它的结果直接依赖于所选取的训练样本,为此需要大量高质量的有标记样本,这在一定程度上限制了其应用;而且确实在很多实际应用中由于缺少形成模式类过程的知识,人们往往只能用没有类别标签的样本进行工作,即非监督分类方法,但它得到的结果通常很难令人满意。针对这种情况,本文将非监督和监督分类方法结合起来,提出一种基于K-means和SVM模型结合的全自动分类方法,主要工作总结如下:(1)对无监督聚类算法进行了讨论,着重介绍了K均值(K-means)和模糊C均值(FCM)算法,并进行了实验对比。(2)对支持向量机算法进行了深入研究,结合无监督聚类和监督分类方法的优点,提出了一种K-means和SVM结合的混合模型,Iris、Wine和遥感数据实验结果验证了混合模型的有效性。(3)深入研究了K-means算法,利用粒子群和量子粒子群算法对其进行了改进, Iris、Wine、Breast cancer和遥感数据实验结果显示了改进方法的优势。(4)将改进的K均值算法与SVM算法结合,Iris、Wine和遥感数据实验结果进一步验证了混合模型的可行性。
其他文献
随着网络技术的飞速发展和液晶显示面板的不断普及,生动的影音视频信息以其独特的视觉感染力受到了越来越多的商家与客户的青睐,在商务楼和商场中随处可见各种形形色色的多媒
随着近年来移动设备的应用越来越广泛,对其中存储的隐私数据的保护也越来越重要。应用程序行为审计方法能找出应用程序中的敏感信息泄漏行为,从而有效地保护用户设备中的敏感
软件外包成为当今软件行业的热门话题之一,随着目前国内软件外包企业的兴起,大量的外包项目从日本、欧美等大中型企业发单过来,不仅促进了国内经济的增长,更带动了国内软件企
随着Internet技术的快速发展,Web数据库得到了广泛应用。这些Web数据库能够根据用户提交的请求,将其内容以HTML页面的形式动态呈现出来。对于传统搜索引擎来说,这部分页面信
应用集成一直都受到学术界与工业界的重视。从应用集成技术的发展来看,工业界对应用集成的研究要比学术界更加深入,并推出了多种产品和标准,其原动力主要是来自于实际分布式集成
随着服务计算技术的迅速发展,Web服务应用日趋深入,Web服务注册与发现技术成为企业级应用集成系统研究的热点。Web服务注册中心是面向服务软件体系结构(SOA)的重要组件,是Web
近年来,随着智能便携式设备、社交网络和无线传感器网络的发展和普及,各种基于位置的服务和应用越来越多,大量同时包含空间信息和文本信息的空间文本数据也随之产生。如何为
传感器技术、微机电系统、网络和无线通信技术的发展与融合,催生了集信息获取、处理和传输为一体的无线传感器网络(Wireless Sensor Networks,无线传感器网络)技术的发展。作
在新闻出版行业中,上下游单位之间存在出版物信息流通不顺畅、人工干预过多、大量信息重复录入等现象,造成了信息不一致、出版成本升高、出版周期加长、人员工作强度增加等问
随着信息技术的迅猛发展,可扩展标记语言XML凭借它良好的可扩展性、自我描述性、文档结构化以及与传输协议无关的优势迅速成为网络上数据传输的主要载体,被广泛地应用于各种领