论文部分内容阅读
随着互联网市场竞争的日益激烈,用户已成为网站的最大财富,他们迫切希望用最简单、最快捷的方式获取最精确的信息,希望网站能够根据用户的特点来推荐他们可能感兴趣但尚未阅读的内容。这就要求网站信息服务改变过去那种对所有用户提供界面统一、内容相同的服务方式,从“以站点为中心”向“以用户为中心”发展,即站点不但要有针对所有用户共同感兴趣的信息和服务,更要有针对各个用户的不同兴趣、爱好自动组织和调整的个性化服务。在这种情况下,针对不同用户的需求,建立相应商品服务措施的个性化推荐服务技术被越来越多的企业迅速地采用,个性化技术已成为电子商务领域中一项迫切而重要的研究课题,个性化推荐技术的研究将具有较高的学术价值和应用前景。论文总结了个性化推荐领域中Web聚类算法的国内外研究现状,分析了已有算法的优缺点。针对K-means聚类算法对初始参数敏感的问题,利用竞争凝聚方法自动获得最佳聚类数和相应的初始聚类中心。针对CobWeb聚类算法在利用大数据集上构建分类树时的数据偏斜和对模糊属性数据聚类上的不足,结合模糊概念格和低偏差模糊概率效用,提出一种集成模糊逻辑和低偏差性的F-CobWeb算法。本文采用理论分析和模拟实验相结合的方法展开研究,其主要研究内容如下:1.总结了个性化推荐中Web聚类分析技术的研究现状,介绍了两种常用的聚类算法和Web数据预处理的流程,阐述了Web站点拓扑结构和动态链接结构的提取方法。2.提出了一种基于K-means的用户聚类算法CAKPS。该方法融合用户访问时间、点击次数、访问顺序三大因素建立访问矩阵,结合页面关联度和绝对值倒数法提出用户相似度公式,建立用户相似矩阵。3.提出了一种基于模糊概念格和CobWeb的页面聚类算法F-CobWeb。该算法融合Web访问日志和Web站点结构,在模糊形式背景下建立页面模糊概念格,利用改进的低偏差模糊概率效用构建概念分层,利用F-CobWeb算法自动生成本体的概念表示和关系,并用本体来描述页面聚类集。4.设计并实现了一个基于Web聚类的个性化推荐系统PRWCL。该系统包括离线数据预处理、用户和页面聚类集提取以及在线个性化推荐等。