Web聚类相关论文
Internet的迅猛发展,尤其是Web的全球普及,使得Web上信息量无比丰富。通过对Web的挖掘,可从Web页面中提取所需的知识:对总的用户访......
Web上的信息资源呈爆炸式的增长,人们查找信息越来越难。搜索引擎是其信息利用的主要工具,然而当前搜索引擎存在不足:基于关键字匹......
Web用户访问过的网页以及在该网页上的浏览时间体现了用户的访问兴趣.为了更好的衡量任意两个用户访问模式之间的相似/相异度,每个......
引入编辑距离的概念,探讨如何构造标签树,并利用标签树匹配算法来量化网页结构相似度。该算法被应用于Web信息抽取,通过URL相似度......
本文研究了聚类和关联规则等与Web使用挖掘有关的理论和技术基础,提出了Web使用挖掘的系统框架,阐明了从Web数据预处理、Web用户访......
提出了基于关联规则的多层次、超图分割聚类方法,用于对Web网页和用户进行有效聚类。该方法借助网站层次图,可以根据实际需要,在各......
通过分析在电子商务环境下Web挖掘的现状,考虑到Web数据的海量性和高维度性对抽取隐含的、事先未知的知识所带来的复杂性和维数灾,......
请求分发是为网簇服务者的一种关键技术。这篇论文论述一个产量驱动的安排算法(TDSA ) 。算法采用簇后端的产量评估他们的负担并且......
分析Web聚类,并针对Web用户聚类提出了使用二值属性描述对象.利用Zipf定律将时间属性进行二值化,然后采用ROCK算法进行聚类.通过实验证......
提出一种模糊的粗糙近似法用于对web日志中的用户浏览模式进行聚类.在聚类过程中,一个网页是否被访问反映了用户的浏览兴趣,一个网......
在电子商务应用中,为了更好地了解用户的内在特征,制定有效的营销策略,提出一种基于混合概率潜在语义分析(H-PLSA)模型的Web聚类算......
基于关键字匹配的搜索引擎排序网页时仅仅考虑评价网页的重要性,而忽视分类;基于分类目录的搜索引擎很难动态分析Web信息。本文在分......
在目前主流搜索引擎中,链接分析是最常用的计算网页价值度的工具,但是对于用户输入比较宽泛的查询主题,链接分析算法很难得到一个令所......
研究web用户访问模式的聚类问题,提出了双层的用户访问模式的聚类方法.第一层采用简单易实现的LVQ(学习向量量化)神经网络方法对日志......
随着Internet的普及和WWW的迅猛发展,用户对Web访问的信息己经成为世界上最大的信息仓库之一。而信息的爆炸式增长与人们注意力的有......