属性加权的类属型数据非模聚类

来源 :软件学报 | 被引量 : 0次 | 上传用户:longlivewebdynpro
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
类属型数据广泛分布于生物信息学等许多应用领域,其离散取值的特点使得类属数据聚类成为统计机器学习领域一项困难的任务.当前的主流方法依赖于类属属性的模进行聚类优化和相关属性的权重计算.提出一种非模的类属型数据统计聚类方法.首先,基于新定义的相异度度量,推导了属性加权的类属数据聚类目标函数.该函数以对象与簇之间的平均距离为基础,从而避免了现有方法以模为中心导致的问题.其次,定义了一种类属型数据的软子空间聚类算法.该算法在聚类过程中根据属性取值的总体分布,而不仅限于属性的模,赋予每个属性衡量其与簇类相关程度的权重
其他文献
为贯彻实施《全国结核病防治规划(2001-2010年)》,我市从2003年起不断加大结核病防治工作力度.逐步开展结核病控制项目工作,通过全面实施现代结核病控制策略(DOTS),全市的结核病防治
目的 对中关村地区1984—2000年急性冠心病事件病死率进行流行病学分析.为制定有效的降低病死率的防治措施提供依据。方法 以北京地区人群心血管病动态监测方案中中关村地区近
目的探讨应用母血清标志物联合超声检查筛查胎儿唐氏综合征的临床价值。方法应用罗氏电化学发光全自动免疫分析仪Elecsys 2010对11257例妊娠15-25周孕妇检测血清中的游离雌三