【摘 要】
:
聚类问题一直是数据挖掘领域的一个重要研究方向。本文首先介绍了聚类问题的广泛应用。随后,在聚类方法分类的基础上,重点介绍了层次聚类方法和划分聚类法—k-平均方法,k-中
论文部分内容阅读
聚类问题一直是数据挖掘领域的一个重要研究方向。本文首先介绍了聚类问题的广泛应用。随后,在聚类方法分类的基础上,重点介绍了层次聚类方法和划分聚类法—k-平均方法,k-中心方法以及它们的改进方法。综合分析和比较了层次聚类方法和k-平均方法的优点和缺点。在聚类分析中,k-均值算法可以说是应用较为广泛的一种算法,虽然传统的k-均值聚类算法方法简单、执行速度快且效率高,但同时它的一个致命弱点是它对初始值敏感而且容易陷入局部最小值。而且算法需要人为地预先指定类别的个数,而实际中类别的个数不能简单明确的确定。本文的主要工作可以概括为两个方面。1.本文提出了一种比上述两种聚类方法更有效的聚类方法。改进算法由层次凝聚算法得到的初始分区,这就避免了出现随机地选取k个初始分区的现象。在某种程度上,大大降低了准则函数收敛为一个局部最小值的可能性。2.本文分析经典的k-均值算法的一个重要缺点:需要用户事先给出要生成的分类数目,提出了一种寻找最优k值的方法。引入了一个简单函数来描述聚类质量,通过遍历所以可能取到的k值即可确定最优的聚类个数。
其他文献
随着电子器件微型化、薄型化、高性能化及特殊功能化的快速发展,柔性封装技术也在朝着超薄型化、布线精细化及多层化等方向快速发展,因此要求柔性封装基板用薄膜材料必须具高
浅谈平面几何教学中的思维训练曹文平(山东省胶南市教委教研室266400)现代教育理论认为,教学过程由教材、教师和学生三个因素构成,这三个基本因素构成三对矛盾.教材具有相对的稳定性,而教
<正>目的评价鞘内注射甲氨蝶呤对胫骨癌痛大鼠机械痛敏的影响。方法雌性未交配SD大鼠48只,体重150~180 g,采用随机数字表法,将其随机分为6组(n=8):假手术+人工脑脊液组(SA组)
语言是人们表达思想,交流感情的工具,在人际交往中起着重要的作用。新课标特别强调:要"创造一个自由、宽松的语言交往环境,培养学前儿童语言交往的兴趣和习惯,发展语言的理解能
2010年7月,中国科学院上海光学精密机械研究所高功率激光单元技术研发中心胡丽丽研究员、张军杰研究员课题组承担的科技部863项目2007AA03Z441“2μm稀土掺杂激光玻璃光纤研
当今科技发达,电脑合成技术方便高超,足以乱真。如果利用此项技术制作动漫或个人写真,自是科技的恩惠。但网络上也流传有明星的合成照片,多属于恶搞性质,则是一种侵害他人肖
暗示是人类一种普遍的心理现象,是影响人的心理的一种特殊形式,暗示功能是语文教师教学能力中极为重要的能力,语文教师的暗示能力必须具有渗透性,启发性,愉悦性,自觉性和协调性等基
研究背景:糖尿病已经成为威胁全球人类健康的主要威胁之一,并且其心血管并发症是糖尿病患者死亡的重要原因。糖尿病性心脏损伤(diabetic heart injury,DHI)是糖尿病的常见心
<正>序言在中国,以城市为主,房地产价格大幅上涨,政府在不断加强措施,抑制房地产市场过热。从房地产交易的实际需求走势以及民间部门的杠杆率来看,目前中国的房地产市场与20
据阿里钉钉的数据统计,2020年的春节假期延长期间,超2亿人在家打卡办公。同时,在2月3日开工的第一天,钉钉也首次超过微信,一跃成为苹果App下载量排行榜的第一位。$$疫情期间要求员