基于核函数的聚类分析研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:dingyibin1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是信息管理领域中一个重要的研究课题,数据挖掘技术已经广泛地应用到很多行业中。聚类分析是数据挖掘中的核心技术之一,目前聚类算法中应用最广泛的k-means算法虽然简明、实用,但它没有对样本特征进行优化,其有效性很大程度上取决于数据点的分布情况,当样本边界为线性不可分或者样本分布为非高斯分布时,聚类效果较差,无法达到高精确度的聚类要求;而核函数的引入增加了对样本特征的优化,通过将样本点从输入空间映射到高维特征空间,将非线性学习问题转化为线性学习问题,从而实现了更为准确的聚类。而目前核聚类算法中的硬划分方法缺乏健壮性,模糊聚类方法又存在需要人为定义模糊参数等不足,因此有待于进一步改进。 本文借助于近似极大值函数的凝聚函数,提出一个既为软聚类格式,又无须选择模糊参数的核k-凝聚聚类算法;并且针对现实中存在大量的分类属性和混合属性数据而k-prototype和模糊k-prototype算法在处理分类型属性和混合属性上的不足,本文又将类属性分解的方法与核凝聚聚类算法相结合,将算法推广到类属性与混合属性,使算法更具有通用性。 本文首先对聚类和核方法的背景知识以及核函数相关理论进行阐述,在说明现有算法不足基础上分别提出了适用于数值属性以及分类和混合属性的核k-凝聚聚类算法,并通过Matlab编程进行数值实验,证明了该算法在聚类的准确性、稳定性、健壮性等方面取得了一定的改进。最后将该算法应用到某生发保健品连锁店客户细分的管理实践中,为他们针对不同细分市场采取不同营销策略提供了指导和依据。
其他文献
小学时期是学生发展的关键时期,直接影响着学生今后的发展,这一时期的教育对于学生的塑造作用非常强,而语文是小学教育中必不可少的一门的课程,是教学的基础.所以,当前学校必
预设和生成二者相得益彰、不可偏废.教师在数学教学过程中要平衡好二者关系,才能保证教学计划高效完成.教师应该采取相应措施保证预设和生成的平衡:创设情境,引导生成;尊重学
随着社会的不断发展,对于教育的关注不断增强,进而在最近几年,在新课改的背景下,对于教育提出了不同的理念和思想,比如说"以生为本
级数是研究函数的重要工具,正项级数是级数的重要组成部分.正项级数的敛散性判别对于级数的研究是至关重要的.本文在已有结论的基础之上结合一些例题归纳总结了正项级数敛散
在新课程改革中明确提出了对学生数学思维能力的培养,以及自主探究能力的锻炼,更为突出了学生在教学活动中的主体地位.在这种背景下,将导学案运用到高中数学教学过程中,将学
生活离不开数学,数学来源于生活,我们的生活便是数学的大课堂,而数学课堂的种种素材也都来源于生活,可见生活与数学是密不可分的.所谓数学教学“生活化”便是将生活中的素材
数学是一门对数量关系、空间形式展开研究的基础性学科.对于初中生来说,他们的数学思维能力有限,所以在面对一些抽象的概念或者题目时,难免会出现思维困顿.而数形结合思想的
党要受监督,党员要受监督,八大强调了这个问题。毛主席最近特别强调要有一套章程,就是为了监督。毛主席说,要唱对台戏,唱对台戏比单干好。我们党是执政的党,威信很高。我们
新课程标准下的初中数学教学,教师应采取有效措施来提高学生的学习效率.提高学习效率,实现有效教学是当下教学的要求.教师要积极引导学生在课前做好预习,在课堂上给学生讲解,
不断完善、深入的新课改革,引领着教育事业发生“质”的大跃进.在成绩的面前,教育者即是需要肯定工作中好的一面,对于有待提高的方面,也需要做好反思.而农村小学数学的时效性