基于改进近邻传播算法的Web用户聚类

来源 :情报学报 | 被引量 : 0次 | 上传用户:ansunyou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Intemet和电子商务的迅猛发展,聚类技术在Web用户划分方面的作用越来越明显。Web用户聚类的难度在于有成千上万的用户需要聚类,而且每个用户的偏好向量是高维稀疏的。对于处理大规模的数据集。近邻传播算法是一种快速、有效的聚类方法。但面对高维稀疏的数据,近邻传播算法往往不能得到很好的聚类结果,而且该方法不能产生指定类数的聚类。本文提出一种改进的近邻传播算法,使用该方法对Web用户进行聚类。根据灰关系等级和Jaccard系数定义用户相似度矩阵,对算法产生的初始聚类进行重新分配,获得指定类数的聚类。实验结
其他文献
探寻自动文摘的研究起点,挖掘自动文摘研究领域的核心作者、期刊分布及其发展动向等,不仅有助于国内业界人士明确自动文摘的研究源起和重点,而且有利于把握未来的自动文摘研
上海市节能环保系统转型升级又有新亮点:上海市资源综合利用协会更名为"上海市循环经济协会"。11月10日,上海市资源综合利用协会召开四届二次会员大会,通过了关于协会更名为上海
本文对通过《国防科学技术叙词表》来构建国防科技领域本体进行了研究。文章简要介绍了几种本体描述语言,在详细描述W3C新推出的本体描述语言标准SKOS的基础上,结合《国防科学
专利文献的引用行为表达的是技术之间的竞争关系,专利计量方法已经成为企业技术竞争情报研究的一种主要手段。本文选择《财富》杂志(Fortune)2009年评选的世界500强企业作为研究
《长宁区“十三五”节能低碳和应对气候变化规划》近期编制完成,根据规划,“十三五”期间,长宁低碳示范区将全面建成。到2018年,长宁区域内节能3.3万t,单位增加值能耗比2010
协同过滤算法是目前最主要的个性化推荐算法之一,它根据当前用户的最近邻居集所给出的评分来预测该用户对未评分项的评分。评分数据的稀疏性会影响协同过滤算法的推荐精度,为
对城市中心区快速路普遍存在的交通问题进行分析,从宏观层面提出改善策略,并以重庆主城区快速路四横线为例,对其存在的交通拥堵问题进行具体分析,针对发现的问题,提出改善措
116例癫痫患儿脑CT检查,42例(36.21%)表现异常,其中半数以上病例显示为脑萎缩性改变,这可能是癫痫发作所致脑缺氧的结果。每天发作的患儿和伴有脑炎、颅内出血、产伤、高热惊
本文针对信息科学领域相关性研究对客观知识体系中相关性(即语义相关)的忽略问题,对语义相关进行了较全面的综述性研究,从语义相关的概念理解、语义相关与检索相关的比较、语义
知识地图是组织实施知识管理的有效工具。随着组织中知识资源存储量的日益增加,手工编制知识地图的方式显得非常低效,甚至难以完成。针对组织中以文本形式大量存在的显性知识,提