面向高维数据的聚类算法改进研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:coolboywcp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高维数据的复杂性、稀疏性和多样性等特点制约着传统聚类算法的有效性,面向高维数据的聚类分析已然成为数据挖掘领域的重要研究方向之一。子空间聚类算法是传统聚类算法在高维空间中的延伸,能够有效实现高维数据聚类。稀疏子空间聚类算法是一种基于谱聚类方法的子空间聚类算法,它具有不依赖子空间的维度和数量、能够处理噪声和奇异点等优点。本文从传统的K-means聚类算法和稀疏子空间聚类算法出发,在分析现有聚类算法的基础上,对高维数据的聚类算法展开了改进研究和应用。本文设计出一种结合了“距离优化法”与“密度法”的K-means改进算法—DK-means算法,用于确定初始聚类中心;为了解决DK-means算法加入额外的计算量而导致时间复杂度增高的问题,本文引入了一种基于“安全距离”的优化策略,设计了 EDK-means算法,进一步改善了 DK-means算法的执行效率,提高了聚类质量。同时通过将Trace Lasso引入稀疏子空间聚类的正则项,设计了一种新的自我表示模型,将EDK-means应用到谱聚类过程中,设计并实现了 TL-MSR子空间聚类算法,较好地解决了聚类算法的性能问题。本文对改进后的聚类算法进行了实验验证,并与原始聚类算法进行比较分析。实验结果表明,改进的聚类算法优于原始聚类算法。同时本文还针对改进的聚类算法设计并实现了一个聚类算法原型系统。
其他文献
禽大肠杆菌病是严重危害养禽业的细菌病之一,主要依赖于抗生素防治,但大肠杆菌极易产生耐药性,且其耐药性可在人和动物间传播,对人类健康和公共卫生安全造成了巨大危害。超级
目的了解间质性肺疾病合并肺部感染的病原学分布。方法回顾性调查并分析2009年10月至2011年10月在广州呼吸疾病研究所呼吸内科因间质性肺疾病病情加重住院患者的病原学检查资
湖湘文化是湖南地区形成的具有独特风格的地域文化。湖湘文化融入高校民族音乐课程,有助于彰显民族音乐的精神气概,滋养民族音乐的文化内涵,丰富民族音乐的艺术元素。汲取特
处置群体性闹事事件要充分运用情报。情报运用要抓住群体性闹事事件的特点 ,实现处置群体性闹事事件的工作目的。同时 ,情报运用应针对处置群体性闹事事件采取措施。
儿童游戏辅导是处理青少年学生,尤其是小学生情绪困扰等心理问题的最适当的辅导和治疗模式。本文从儿童游戏、游戏辅导的概念入手,对如何利用游戏辅导对小学生进行心 理健康
本文讨论瞬心法,它用来方便简单求解物理竞赛中的刚体在平面内运动的一类典型题。
网络文化作为一种新兴的文化方式影响着当代大学生的学习、生活,改变着他们的思维方式、价值取向、审美情趣、行为模式和生活方式。本文结合网络文化的特点,分析了网络文化对
随着经济全球化的进程的不断推进,政府工作需要面对更为复杂的社会环境及政策问题,公共政策的制定不应单纯依靠传统的单向的政策制定过程,而是与各方利益相关方面密切相关,科
随着国民经济的快速发展和人民收入水平的不断提高,人民的消费能力不断提升,特别是对教育消费呈现品质化趋势,随着广大家长对民办教育的接受程度逐渐提高,其中对高质量的教育需求呈现质和量的释放。这一需求很快带动了其相关民办教育产业,特别是基础教育阶段民办教育发展迅猛,其中民办中小学教育市场规模在激烈的竞争中不断扩大完善,成为了民办教育行业的中坚力量,越来越多的民办中小学将专注于差异化办学,并对教育产品服务
<正> 陈垣同志(一八八○——一九七一年)是我国著名的历史学家。年轻的时候,他就爱读四史,注意研究目录学,阅读《四库全书总目提要》。他研究历史是从目录学,掌握目录学知识