符号数据最佳聚类个数的确定方法

来源 :第三届中国数据挖掘学术会议(CCDM2009) | 被引量 : 0次 | 上传用户:wangzhanglu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  在聚类分析中,如何选择恰当的聚类个数是一个非常复杂而又必须面对的问题。尽管针对数值型数据聚类个数的选择算法已经进行了广泛地研究,但如何确定符号型数据的聚类个数仍然是一个富有挑战性的问题。本文结合划分和层次聚类的思想,提出了一种符号数据聚类个数的确定算法,并且分析了该算法的时间复杂度。在UCI数据集上的实验结果表明该方法是有效的。
其他文献
以含铜废渣为原料,采用氨浸、催化氧化、蒸馏、结晶的工艺制备碱式硫酸铜,探讨了氨浸机理,在正交试验的基础上得出了氨浸工艺条件,并对蒸氨等过程进行了研究.该工艺具有设备简单、
建设工程投资控制阶段包括决策阶段、设计阶段、施工阶段、使用阶段的全过程投资控制。但影响最大的是决策阶段和设计阶段。能够有效地控制工程建设投资是在设计阶段。
在平面设计工作中,视觉审美元素的构建工作较为重要,设计者应明确平面设计工作概念,并在设计工作中合理融入审美元素,利用科学方式解决问题,创建现代化与多元化的设计机制,提
用热重法和红外光谱法对100例尿结石进行了综合定性和定量测定。发现该法比单独使用热重法或红外光谱法更为准确、有效。为诊断、治疗和探讨尿结石的病因提供了可靠的数据。
本文采用薄膜超声分散法制备茶多酚脂质体以提高茶多酚的生物利用率。在制备工艺研究中运用响应面分析,确定其最佳工艺条件:药脂比为1:8,卵磷脂与胆固醇比为4:1,缓冲液pH值为
概念书籍设计立足于人文主义精神,在传递信息的基础上,通过全新的创作手法和表现形式展现出书籍本身深厚的文化底蕴,并带给人们独具一格的身心享受。本文不仅叙述了概念书籍
“‘三年投放一百亿,携手共创新辉煌’,这是我行未来中小企业业务的发展蓝图。”11月8日下午,在东莞会展国际大酒店举行的东莞工行中小企业融资业务推介会上,东莞工行沈晓东行长
报纸
烟草行业是最早提出建设烟草物联网的行业之一。本文分析了烟草行业物联网建设的进程和存在的问题,在此基础上提出了以卷烟商业企业为切入点和核心的物联网建设构想,并分析了
运用实验室规模模拟渥堆,通过正交实验,研究不同工艺条件(初始水分含量、初始pH值和翻堆间隔)对普洱茶渥堆过程中微生物(霉菌)和酶活(多酚氧化酶、纤维素酶和果胶酶)的影响。
荆歌,男,中国当代作家,一九六〇年春生于古城苏州。在照相馆、中学、文化馆等单位工作过。二十世纪九十年代开始小说创作,出版有长篇小说《枪毙》、《鸟巢》、《爱你有多深》