基于遗传算法与密度及距离计算的聚类方法

来源 :计算机应用 | 被引量 : 19次 | 上传用户:zhaiyiyang9708
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决聚类中心选择困难和数据点密度计算泛化能力弱的问题,提出一种基于遗传算法与密度及距离计算的聚类方法。该算法通过指数方法计算数据点密度,降低参数对算法性能的影响;用遗传算法搜索最优密度和距离阈值,同时引入惩罚因子,克服算法搜索域偏移从而提高收敛速度,寻找最优聚类中心,并用归属方法完成聚类。通过4组人工数据集和4组UCI数据集实验证明,该方法在RI指数、聚类精度、聚类纯度、召回率等4个聚类评价指标上都达到与K-means算法、快速搜索聚类算法和Max_Min_SD算法相当或更好的效果,算法是有效的。
其他文献
小学生的语文学科学习不仅仅包含对汉字的认知学习,学科教学的最终目的是提升小学生整体的语文学科素养,包括词汇量的积累、知识面的拓宽、语句语法的学习、文学作品的赏析等
本文通过研究教育产业再生产的特点和义务教育成本形成、补偿的特殊机理,结合国际经验和国内实际情况,根据科学发展观的要求,提出了改革中央、省、县三级政府分担义务教育成
市场经济体制下,会计监督作为经济监督的一部分,既有经济监督的共性,又具备其独有的个性,是一种复杂的经济管理行为。对会计监督进行理论上的分析评介,有助于我们正确理解会
期刊
提出将最优化问题的对偶间隙改写成函数的积分形式,即转化为次模函数极小化问题,再通过Lovász延拓来实现正则化.并实际讨论了基于最接近方法和多面体的最优化问题的次模
宜昌市夷陵区地处长江西陵峡畔,现辖11个乡镇,1个街道办事处,总人口52.51万人,其中乡镇人口40.46万人。耕地面积44 581公顷。2002年全区实现国内生产总值(不含坝区)66.04亿元
期刊
本报告通过对比分析,不仅肯定了中国队的长处,而且还指出了某些不足之处。此外,还对后备力量训练和准备用94年亚运会队伍的训练提出了建设性建议。
较准确的语音切分方法可以极大提高语料标注等工作的效率,有助于语音识别等应用中语音与模型的对齐。利用汉语语音在时频二维的能量特征设计了一种新的汉语语音音节切分方法。用传统方法判断静音帧,用相同时间不同频率的二维能量判断清音帧,用不同时间特定频段的0-1二维能量判断浊音帧及有话帧,综合4种判断结果给出音节切分位置。实验结果表明,该方法切分准确度优于基于归并的音节切分自动机(MBSDA)和高斯拟合法,其
<正>门窗是一个家的"面子"工程,不管是毛坯房装修还是二手房翻新,如果不是钱包非常紧,新业主一般都会选择更换门窗。今天我们就来了解一下,更换门窗的一些注意事项。一、确定
世界中长跑训练方法的变革更新推动了中长跑运动的发展。文中指出,“马家军”的训练方法是以其训练量、强度和恢复手段的突破才取得当前在世界女子中长跑中的领先地位。
本文就社会主义市场经济与体育的关系、体育领域中的政府行为、市场力度、体育产业等问题进行了初步探讨,为深化体育改革提供理论依据。