基于聚类的动态情景协同过滤推荐策略研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:jyjs1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国社会、经济等领域的不断进步,因特网技术的日臻成熟和快速发展,推荐系统也被广泛应用于各种电子商务网站,推荐系统的广泛应用能够促进广大用户在互联网应用领域从浏览者到消费者之间的身份快速转换,让用户获得更加智能高效的信息生活的同时给服务提供商带来更大的商机。协同过滤算法(Collaborative Filtering)作为推荐系统的主要技术,能够有效地解决信息过载的问题。协同过滤算法的核心思想是,根据用户更愿意采纳与其具有相同或相似兴趣爱好的朋友提出的意见这一中心思想,运用最近邻相似技术研究用户的兴趣特征,通过预测用户的几个兴趣点,进行个性化的推荐。在项目-用户的评分矩阵中,每位用户给出的项目评分的数量可能与用户数量相比非常稀疏,导致推荐的成功率急剧下降,所以用户的使用体验较为不理想。协同过滤是推荐策略中使用较为广泛的算法,其目的在于通过过滤大量信息,将用户引导向可能感兴趣的项目。此外,协同过滤算法还存在诸如冷启动问题,未考虑用户兴趣动态变化和扩展性差等问题,导致推荐的结果准确率很低。因此,我们还要针对上述的诸多问题进行进一步的研究。本文的具体工作如下:(1)主要介绍课题的研究背景及其意义,综合论述推荐领域的相关技术,包括基于模型的和基于邻域的协同过滤算法,系统的总结了推荐领域的主要数据集和几个常用的评价指标。(2)基于用户的协同过滤推荐方法在进行推荐的过程中,比较侧重于如何利用用户给出的历史评分数据来进行用户相似度的计算,针对传统协同过滤推荐算法存在数据稀疏性及动态情景下推荐质量急剧下降的问题,我们提出了一种基于加权聚类的动态情景协同过滤推荐算法(dynamic collaborative filtering algorithm based on a weighted clustering method,WCM-DCF)。该方法对提供较多评分的用户给予更多的重视,在运用SK-means聚类方法的基础上引入用户权重的概念,有效的解决了数据稀疏性的问题,在此基础上考虑增量更新的情况以便处理推荐过程中数据的频繁变化带来的影响,优化了对目标用户的偏好预测和个性化推荐建议。实验结果表明,相比于IUCF、IICF、和COCLUST算法,该算法在有效缓解用户评分数据稀疏性的同时,还以非常低的计算成本提供了高质量的推荐建议。(3)针对传统的文本聚类方法在聚类性能上存在的不足,本课题提出一种基于最大熵原理的聚类算法。该算法采用传统文本聚类算法SP-Kmeans中引用余弦相似度的方法,引入最大熵理论构造适合文本聚类的最大熵目标函数,然后将最大熵原理引入到球形K均值文本聚类算法中。实验结果表明,与DA-VMFS和SP-Kmeans算法相比,本课题提出的CAMEP聚类算法性能上有大幅度的提高,整体性能良好,能够大幅度提高聚类的准确率。
其他文献
协同分割方法通过获取图像间前景相似性先验知识,能够实现对含有共同目标的多幅图像进行良好的目标分割,弥补了传统单幅图像分割方法在缺少人工交互的情况下表现出目标分割性
随着科学技术和多媒体技术的快速发展,人们获取信息的方式也在不断地增多,从传统的单视点图像获得的信息量已经难以满足人们的需求。基于双目视差原理的立体图像产品能够将不
近年来,从视频中进行目标识别的应用非常广泛,例如公共场所的视频监控、智能交通中的车牌识别、军事武器的瞄准等。若要使用人工观察视频中某个物体的异常移动,会非常耗时耗
CMOS工艺尺度的缩小使芯片的集成度更高,但同时也为半导体工业带来了前所未有的设计难题。其中,电路的可靠性问题在亚微米级别的集成电路设计中受到了强烈关注。除了面积、功
对国家珍珠及珍珠制品质量监督检验中心而言,建设珍珠鉴定信息管理及防伪系统的意义在于显著提升其企业信息化水平,使其能够在信息化的社会条件下提升服务水平和市场竞争力。
在职业学院内部管理业务中,教职员工的培训及评价工作是重要的业务内容,对于提高员工培训评价工作的整体效率,促进职业学院教职员工队伍的整体素质以及培训工作的质量有着重
Java虚拟化技术是一种新的J2EE移动互联资源管理形式,复合数字资源传输特点,结合点至点的方式,这样的移动互联结构中的文件共享计算,按关键词文本索引引擎有一个很大的优势,
基于三角法的三维扫描技术在农业、医疗、高铁列车检修等领域应用广泛,其目的是获取物体表面高精度的三维点云数据,而激光光条中心提取是扫描的关键环节。但在实际三维扫描过
在当今的电子对抗领域,雷达辐射源信号分选技术是其中的核心技术。在现代战争中,电子威胁环境中的信号密度越来越高,敌对双方所装备雷达系统的工作体制也越来越先进和复杂,使
场景流估计是三维场景理解、场景动态重建等领域的重要一环,在计算机视觉领域逐渐引起人们的关注。然而,由于求解空间尺度较大,场景流一直受求解速度的影响,同时,多个子问题