【摘 要】
:
聚类分析是数据挖掘中的重要内容之一,是将数据对象按照相似性度量划分成各类簇的过程,并广泛的应用在数据挖掘,模式识别等领域。K-medoids聚类算法是一种基于划分的聚类分析方法,具有对孤立点敏感度较低和良好的鲁棒性等优点。但由于初始聚类中心的选取和中心点迭代更新等,聚类精度和效率较低,严重地影响了聚类分析效果。本文针对K-medoids聚类算法中的初始中心点的选取和k值的确定等进行了深入研究,其主
论文部分内容阅读
聚类分析是数据挖掘中的重要内容之一,是将数据对象按照相似性度量划分成各类簇的过程,并广泛的应用在数据挖掘,模式识别等领域。K-medoids聚类算法是一种基于划分的聚类分析方法,具有对孤立点敏感度较低和良好的鲁棒性等优点。但由于初始聚类中心的选取和中心点迭代更新等,聚类精度和效率较低,严重地影响了聚类分析效果。本文针对K-medoids聚类算法中的初始中心点的选取和k值的确定等进行了深入研究,其主要成果如下:(1)给出了一种基于标准差的K-medoids聚类算法。该算法利用标准差定义了初始中心点候选集,并采用逐步增加的方式确定初始中心点,从而保证了选取密集程度较大的样本点作初始聚类中心点,同时避免选取到密集程度较低的样本点尤其是孤立点作为初始中心点。采用UCI数据集和人工数据集,实验验证了该聚类算法的有效性。(2)给出了一种自适应聚类簇数的K-medoids聚类算法。该算法利用聚类中心点通常具备较高的密度,并且聚类中心点之间相距较远的原理,定义了一种在聚类过程中决策聚类簇数的方法。采用了UCI数据集,实验验证了该聚类算法的有效性。(3)在上述研究成果的基础上,利用eclipse开发工具,设计实现了一个天体光谱聚类分析原型系统,其运行结果分析表明该原型系统可为特殊未知天体光谱的知识发现,提供一种有效途径。
其他文献
目前我国企业,特别是中小型企业在发展中由于贷款困难、无法进入资本市场等原因导致融资困难,这使得企业出现资金缺口,不仅影响企业的发展,还影响社会经济发展。另外随着我国社会经济的发展,不少行业也随之蓬勃发展,迈入新的发展阶段,这时企业不仅考虑的是筹资的问题,还有扩大规模、提升竞争力的问题。为解决上述问题,企业会考虑通过上市来募集资金,其中主要的两种途径就是IPO上市和借壳上市。相比起IPO上市来说,借
博士生教育作为我国教育层次的最顶端,代表着我国教育的最高标准与水平。针对博士生培养质量影响因素的研究,主要聚焦于博士生攻读期间的科研产出、师生关系等制度性与结构性因素。同时,上述研究领域也是博士生培养质量提升的资源投入重点。但是,在对博士生深层学术精神的树立与引导方面的研究,则仍待研究者进一步探析。在已有研究发现的基础上,本研究以博士生所秉持的关于学术知识生产与发展的信念为侧重点,通过测量博士生的
纳米胶体广泛分布在地表水中,但是纳米胶体的特定物理化学性质及其对水生生物的影响在环境领域仍然知之甚少。基于改良的切向流超滤的提取方法和多种分析手段,包括透射电子显微镜、能量色散X射线光谱仪、原子力显微镜、傅里叶变换红外光谱仪、三维荧光激发发射矩阵光谱、热重分析和电感耦合等离子体质谱等,对纳米胶体的性质进行了深入研究。目前的研究工作发现,在真实地表水中纳米胶体的浓度范围为3.62至7.66 mg/L
本文以近代的时间为研究对象,但不同于以往的技术史、制度史路线,本文并不过多着墨于具体的计时方式,而是意图探讨中国近代各群体“现代时间意识”的形成。过去虽有“一寸光阴一寸金”的说法,但并未普遍反映在人们的日常生活中。直到近代,这种状况产生了巨大的转变,这种转变的一个表现就是现代时、分、秒制钟点时间的确立。以往对这一现象的研究多从技术史、制度史的角度进行解释,认为更精确的钟表的诞生、工厂制下的工作时刻
大豆根腐病是世界大豆生产中危害严重的土传性真菌病害,极大程度地导致大豆的产量和品质下降。镰孢属,是造成大豆根腐病的重要致病菌之一,但在世界各地造成大豆根腐镰孢菌种类不尽相同。为明确吉林省敦化和公主岭大豆根腐镰孢菌种类,本研究对发病植株进行病原真菌的分离与鉴定,以期为吉林省的大豆根腐病的防治提供科学依据。从吉林省敦化和公主岭大豆试验田采集了93份具有典型大豆根腐病植株进行病原真菌的分离纯化,并利用I
斑痣悬茧蜂,一种内寄生容性寄生蜂,是斜纹夜蛾、棉铃虫、舞毒蛾等鳞翅目农业重大害虫的寄生性天敌。但在桑园生态系统中,斑痣悬茧蜂暴露常用农药后的生活史特征尚不明确,本研究旨在阐明斜纹夜蛾响应斑痣悬茧蜂寄生的免疫反应调控过程,探究了斑痣悬茧蜂暴露于辛硫磷和氯氰菊酯两种桑园常用杀虫剂后的适合度特征以及解毒机制,从miRNAs调控寄主免疫反应的角度揭示斜纹夜蛾响应斑痣悬茧蜂寄生的生理变化机制,分析了寄生蜂响
目前,我国大部分油田的产液都是含蜡原油,大部分原油中的蜡质占比均在20%以上,其中大庆油田的产液含蜡量高达28.44%。油井结蜡会造成诸多不利影响,如致使产量降低、损坏采油设备甚至影响采油生产工作,油井结蜡已成为各大油田亟待解决的问题。特别是无杆抽油方式,由于缺少抽油杆的往复运动或旋转运动的搅动作用,油管结蜡更加严重。传统清防蜡技术如机械刮刀清蜡、热洗以及化学清防蜡技术等都存在着或多或少的缺陷。因
随着现代混凝土的发展、基础设施建设的需求量增大,多种多样的矿物掺合料(例如:石灰石粉、粉煤灰、矿渣等)逐渐取代水泥作为一种复合型的辅助胶凝材料,这极大地减少了环境污染和资源浪费。研究表明加入掺配合理的矿物掺合料的混凝土与普通混凝土相比,力学性能相差不大甚至略占优势,但是胶凝体系随着多种矿物掺合料的加入变得更加复杂,混凝土耐久性能的退化规律及机理也更加复杂。同时混凝土本身产生的收缩裂缝与混凝土的耐久
数列是一种特殊的函数,学习数列即可以培养学生的抽象思维、逻辑思维,也有助于提高学生的数学学习能力.但是数列部分的公式、知识点较多,用到的数学方法和数学思想多,综合性强,题目灵活性高.所以很多学生虽然掌握了公式,但是做不到举一反三,触类旁通,经常会出现无从下手的困难.本文试从ACT-R理论的观点出发,从单元教学的视角为数列寻找一个行之有效的教学模式,以达到优化教学设计,提高教学质量和提升学生的非认知
识字教学是培养小学生语文阅读和写作能力的基础,同时,也是提升学生综合素养的前提和保障。随着教育部新课程改革的不断推动,传统教学方法下的识字教学已经很难满足学生的多样性与个性化需求。游戏教学法和识字教学的融合,不仅调动了学生识字的主动性和积极性,而且使教师和学生在愉快生动的课堂中双向互动。然而,游戏教学在小学语文识字教学上的实践还处于探索阶段,缺乏系统的理论基础和实践指导。基于探究游戏教学法在小学识