基于Web聚类的个性化推荐服务研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:wangxq198
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的不断发展,信息过载和资源迷向已经成为制约人们高效使用Internet信息的瓶颈。人们希望网页的内容能够尽可能地根据用户的浏览兴趣自动调整,从而使每个用户感觉好像自己是网站的唯一用户,实现这一目标的关键在于Web网站如何发现用户喜好、动态地为用户定制观看的内容或者提供浏览建议。这就要求网站信息服务改变过去那种对所有用户提供界面统一、内容相同的服务方式,从“以站点为中心”向“以用户为中心”发展,即站点不但要有针对所有用户共同感兴趣的信息和服务,更要有针对各个用户的不同兴趣、爱好自动组织和调整的个性化服务。在这种情况下,针对不同用户的需求,建立相应商品服务措施的个性化推荐服务技术被越来越多的企业迅速地采用,个性化技术已成为电子商务领域中一项迫切而重要的研究课题,个性化推荐技术的研究将具有较高的学术价值和应用前景。   论文总结了个性化推荐领域中Web聚类算法的国内外研究现状,分析了已有方法的优缺点。针对Web数据的非结构性特征以及用户浏览Web时的模糊性与不确定性问题,提出了一种新的相似性度量方法,进而给出了一种基于模糊多重集的Web用户聚类算法。针对核K-means聚类算法对初始参数敏感的问题,利用局部密度的方法获得初始聚类中心。本文采用理论分析和模拟实验相结合的方法展开研究,其主要研究内容如下:   1、总结了个性化推荐中Web聚类分析技术的研究现状,介绍了两种常用的聚类算法和Web数据预处理流程,给出了常用的预处理算法。   2、提出了一种改进的Web用户聚类方法。把模糊多重集的概念引入到模糊聚类算法中,将反映用户浏览行为的页面点击次数、访问时间、访问顺序等因素用模糊多重集来综合刻画用户访问站点的兴趣度,最后形成用户相似模式库。   3、提出了一种局部密度和核K-means的页面聚类算法,选择具有高密度且低相似性的样本点为初始聚类中心。通过实验对比结果证明该算法可以有效地改善核K-means聚类算法的效果,在处理大数据集时有较高的聚类质量,同时提高聚类的稳定性。   4、设计并实现了一个基于Web聚类的个性化推荐系统。该系统包括离线数据预处理、用户和页面聚类集提取以及在线个性化推荐等。
其他文献
随着Web服务技术的快速发展与成熟,Web服务的应用越来越广泛,Internent上的Web服务数量越来越多。如何从众多的Web服务中快速的发现并选择出既满足服务消费者的功能性需求,又
随着高职院校教学管理现代化进程的加快和教学体制的改革,各大院校的教务管理正向“规范化、信息化、网络化”的方向发展,而基于学分制的选课方式也被运用到教学管理中。基于
为保护数字作品版权人的利益,数字版权管理DRM技术得到人们的广泛认同。然而DRM技术重在保证获得权限的用户可以访问数字内容,却在支持权限的合理转移方面略显不足。对应传统的
20世纪以来,不确定性的科学价值和现实意义逐渐被人们所接受。学者们通过对概率论、模糊集理论以及近年来发展起来的粗糙集理论的应用,使得不确定性问题的研究取得了很大进展,其
认知图是一种软计算工具,是近年来兴起的一种新的知识管理方法和知识表达工具,它可以用来表示相关领域中实体之间的因果关系。认知图推理就是在认知图的基础上,利用已知的知
图像中包括哪些类别的对象?对象的具体位置在哪里?每一类的对象有几个?对象有什么姿势动作?它们之间的关系又是怎样?如果让人们回答这些问题,是一件很容易的事情。但普遍意义
当今信息存储对于各行业的重要性日益明显,对存储软硬件的容量增长、可靠性和高效性等都提出了新的要求和挑战。在信息存储领域,磁盘阵列技术从产生起就一直发挥着重要的作用
中文信息处理技术在当代有广泛的应用。随着互联网和计算机应用技术的快速发展,大量数据向中文信息检索、处理提出新的课题和需求。本文在计算语言学及形式语义学的基础上:(1
计算机断层成像技术(Computed Tomography, CT)是与MRI、同位素扫描、超声图像等一样重要的医学图像诊断手段。与其他医学成像方法相比,CT成像具有检查方便、无痛苦无创伤、
随着数据库技术的成熟和知识发现等领域技术的不断发展,数据挖掘技术应运而生,并在越来越广阔的领域得到应用和发展。粗糙集方法是一种重要的数据挖掘方法,是由波兰科学家Z.P