ISODATA模型及其Gap统计应用研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:xianfaxianfa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Gap Statistics是在K-means基础上建立的,考虑到K-means算法容易受初始聚类中心以及簇的数目的影响,并且通过Gap Statistics方法估计聚类数能够得到数据集的粗略分类,不能进一步对数据集进行细分类。针对这一不足,本文将ISODATA算法引入到Gap Statistics中。首先,由于ISODATA算法需要估计初始聚类数目这一参数,本文验证了多维切比雪夫不等式与马氏距离之间的关系,并基于它们之间的关系提出了聚类初始数目的估计方法。而后提出了改进的ISODATA算法,即MISODATA算法,继而提出了MIGS模型。实证分析了MIGS模型的可行性与有效性,MIGS模型不仅可以实现数据集的细分类,而且通过MIGS模型估计数据集的最佳聚类数的准确率高于原GS模型。其次,改进后的MIGS模型虽说有很多优点,但是MISODATA算法中仍需要人工设定控制分裂和合并的参数,对于不同的数据集,这两个参数值的选取也不同,取值属于零至正无穷范围内,故两个参数值难以确定。针对这一不足,对MISODATA算法进行改进,引入了合并度和分裂度的概念,提出了基于变异系数的分裂度估计模型和基于合并度的归一化估计模型,进而提出了 FMISODATA算法。通过实证分析FMISODATA算法的收敛速度和收敛精度,以及分裂度和合并度对聚类分析结果稳定性的影响。实证表明,FMISODATA算法不仅保证了数据集最佳聚类数的准确率,而且简化了操作,使得MISODATA算法更加便捷有效。最后,探讨FMISODATA算法在Gap Statistics上的研究应用,提出了FMIGS模型估计数据集的最佳聚类数。并通过实证分析FMIGS模型的可行性与优越性。实证表明,FMIGS模型在保证准确率的同时,更能体现出数据集的特点。论文最后对模型中存在的问题进行分析探讨,并指明了今后要研究的方向。
其他文献
摘 要:中职班主任工作艰难,这是中职班主任的普遍感受,本文分析影响班主任工作的因素,并根据多年班主任工作的实践,谈谈自己面对班主任工作困境的一些对策建议。  关键词:中职;班主任;工作困境;对策  目前中等职业学校的生源质量普遍不高,因此做好中职学校的班主任工作显得尤为重要。良好的师德、无私的爱、较高的理论知识水平,是做好班主任工作的前提。通过各种手段培养学生的自我评价、自我管理能力是做好班主任工
摘 要:小学语文教材的“教育性”与“趣味性”之争一直是教育界颇为关注的话题,我国的儿童文学通常也划分为教育性读本与乐趣性读本两种,但是要知道,二者并非是对立的。我国小学语文教材的主要内容主要由儿童文学构成,随着教育改革的发展和新课程标准的应用,小学语文教材也随着时代的发展和教学要求的提高而不断改革,改革的过程中不断呈现出类似的博弈现象。本文中我将重点对小学生思维特征及发展规律进行分析,从而探讨小学
新课程背景下的写作教学,要求教师关注学生的全面和谐发展。针对这一改变,我在作文教学上做了些探索,打破只有在作文课上进行作文指导的观念,改变单纯由教师教学生写的现象,冲破作文只能写在作文本上的惯例,通过各种途径激活学生的写作需求,让写作真正成为学生自身发展的需要。因为只有当学生自觉付出辛勤劳动时,才能达到良好的作文教学效果。近两年来我的探索取得了一些效果,结合自己的教学实践,谈谈自己的实践和感受: 
积极心理学的运用使老师站得更高,看得更准,使学生走得更快,走得更快乐。激励教育使受教育者积极进取、健康发展,老师以激励的教育行为,从外部给受教育者以适当的激发,使受教育者将要求内化为个体自觉行动的过程,尤其是英语教学,激励教育的作用显得尤为突出。  一、激励树立信任形象  布鲁纳指出:“教师是教学过程中最直接的有象征意义的人物,是学生可以视为榜样并拿来与自己相比较的人物。”教师信任形象深刻有影响的
随着互联网信息技术的成熟化,网络运营商及新媒体用户的不断增多,用户在消费意识上更趋向理性,针对服务品质的要求也越来越高,企业向用户提供的服务质量进一步影响着用户未来