融合专家信任的协同过滤推荐算法研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:a395744775
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协同过滤推荐算法作为当前应用率最高的个性化推荐技术,不仅迎来了机遇,也面临着重大挑战,其中,数据稀疏、冷启动、可扩展性不高等问题一直制约着协同过滤推荐算法的发展。针对以上问题,本文设计低值填充方法缓解评分数据的稀疏性;为相似度计算设计惩罚权重增加推荐的准确性;改进聚类算法提高算法的泛化性;融合专家信任因素降低冷启动的影响。本文主要做了以下两项工作。(1)提出基于数据填充和聚类的改进协同过滤推荐算法ICFDFCA(Improved Collaborative Filtering Recommendation Algorithm based on Data Filling and Clustering Algorithm)。首先,在数据预处理阶段设计了LF(Low-Filling)数据填充方法,填充用户评分矩阵中空缺的低期待值项目,改进了数据填充方式。在计算相似度时,综合Jaccard和Pearson相似度计算方法各自的优势,并进一步考虑到用户自身活跃度对相似度计算的影响,设计活跃度惩罚权重对相似度计算进行了改进。其次,对聚类算法进行改进,为了使各聚类内部的紧凑度和各聚类间的分离度更高,不再随机选取聚类中心,而是选取核心点集合中差异最大的一组点作为聚类中心,然后将剩余用户划分到不同的聚类中,并在各聚类内部利用相似用户进行推荐。实验证明,ICFDFCA算法在很大程度上缓解了数据稀疏性问题。(2)提出融合专家信任的协同过滤推荐算法CFRAIETS(Collaborative Filtering Recommendation Algorithm based on Improved Expert Trust and Similarity)。考虑到普通用户习惯性地询问专家,并且专家推荐往往可以得到令人满意的结果,引入专家信任因素,并进行了两项改进。首先,针对已有的信任度计算未将项目间的差异考虑在内,导致得出的结果不准确,设计了Itrust项目因子,对专家评价过的每一个项目赋予独立的信任度值。其次,考虑到LF数据填充方法无法满足专家需要广泛评分这一特点,利用和专家具有相同评分习惯的用户来为专家的评分矩阵进行填充。最后,以ICFDFCA算法为基础,在进行推荐和做评分预测时不仅使用相似用户,同时结合专家因素,提出了融合专家信任的协同过滤推荐算法CFRAIETS,在评分预测公式上为专家用户分配权重,并设计了平衡因子来调和与相似用户的比重。实验证明,CFRAIETS算法不仅有效缓解了冷启动问题,提高了推荐精度,还提升了对长尾物品的挖掘能力。
其他文献
步入数字经济时代,越来越多的经济行为会以线上、虚拟的方式进行。在个人所得税征管中,涉税信息同样起到举足轻重的作用。一方面,涉税信息一直是税收征管能有效进行的基石,税收信息管理能力是税收征管能力的重要方面,在税收征管现代化的道路上,必然对税务机关的税收信息管理能力提出新的要求;另一方面,涉税信息主要以电子化、数据化的新形式呈现的,在此种新变化下,为保证税务机关能够获取足够的涉税信息,产生了税收信息管
学位
数据挖掘领域中的序列模式挖掘是一个研究热点课题,而且带有周期性间隙约束可以使得挖掘更具有针对性。其中,基于无重叠条件的序列模式挖掘问题与其他同类研究相比更具有研究意义。传统的序列模式挖掘只考虑模式在序列中的出现频率,忽略了外部效用对于模式的影响,这就导致一些出现频率低但是极为重要的模式被忽略而一些出现频率高但是影响程度不高的模式被发现。这不仅降低了挖掘效率,而且使用户的可用性降低。鉴于此,本文研究
学位
19世纪,欧洲引入自由贸易规则之时恰逢工业化大发展,竞争成为市场的主旋律,但完全自由竞争带来的弊端也逐渐显现:完全自由的竞争不仅损害了竞争的公平性,也损害了诚信经营者的利益。于是,所有市场经济国家开始研究如何规范市场竞争衍生出来的不公平情形,以保护经营者的利益,由此,反不正当竞争法孕育而生。虽然各国因历史背景和法律渊源不同而采取了不同的立法技术,但是当时所有的立法都关注诚信经营者的利益,防止他们受
学位
推荐系统能够有效的解决信息过载的问题。由于数据集的稀疏性问题,传统的推荐算法采用线性映射的方式往往限制了算法的表达能力。近年来,深度学习通过引入非线性变换成功推动了图像处理等领域研究的进展,与此同时,在推荐系统领域通过引入深度学习也取得了一定的研究成果。本文针对数据稀疏性导致的推荐算法的精准度不高的问题,提出了两种基于深度自编码器神经网络的个性化推荐模型:1)融合用户以及项目特征的双卷积自编码器神
学位
随着卫星遥感技术的快速发展,遥感图像在城市规划、农田规划、自然灾害处理等领域起到越来越重要的作用。语义分割是遥感图像处理中的一个重要任务,而基于深度学习的遥感图像语义分割任务需要为每个像素点标注,这个过程会耗费大量的人力物力。为了缓解遥感图像标注压力,通常采取数据迁移的方式,即在一个有标注的数据集上训练模型,在未标注的数据集上应用。由于不同遥感数据集之间存在较大的差异,导致了训练测试过程中出现域偏
学位
多视图是计算机视觉研究的主要对象,且内容丰富,常作为传递信息的载体。随着当下生活人工智能化的发展,基于视图形式的三维物体识别技术在很多领域都有了广泛应用,特别是在自动驾驶、医学图像分析等领域。在对物体特征信息的描述问题上,与单一视图相比,多视图可以在物体特征信息上相互补充。物体识别技术中特征提取是计算机处理识别物体的前提,如何建立优化的特征提取算法,得到更为精确、完整的物体特征信息成为计算机物体识
学位
近年来,随着我国社会经济的不断发展,当前建筑市场竞争越来越激烈。要想在目前建筑市场中获得一定的地位,建筑工程企业就必须要加大对建筑工程施工质量的监督力度,为社会广大群众提供高质量的产品。保障建筑工程在施工进度的基础上提升工程的质量,从而推动建筑企业的可持续发展。在新时代的背景下,加强建筑工程质量监督管理的研究,有着重要的实际意义。
会议
快速而有效地从海量互联网数据中获取有价值的信息,并利用这些信息扩充知识图谱已成为当前知识图谱构建过程中的热点问题。然而互联网数据不仅包含着结构松散、内容简单的短文本、而且包含规模庞大、内容复杂的长文本。针对包含长文本和短文本的混合文本,本文提出了一种面向混合文本的实体链接模型,并基于上述模型,设计实现了一个完整的实体链接系统。该模型由预训练、实体指称识别、候选实体生成、候选实体消歧、不可链对象处理
学位
行政主导型社区治理是指行政力量在社区组织运作上起主导作用的治理模式,是众多社区治理模式中较为常见的一种。行政主导型社区治理具有单中心、家长主义的特点。文章试图解答这一问题:如果制度环境对社区治理具有决定性作用,为何中国在改革开放后并没有大量形成市场经济主导型社区治理或者社会自治型社区治理,而仍然在许多城市采用行政主导型社区治理。文章以新制度主义为视角,结合个案研究方法,讨论了行政主导型社区治理的历
学位
随着互联网及移动互联网的不断发展,数据以爆炸式的速度增长,知识图谱作为数据的一种直观并形象的表示形式,能够有效地表示数据中蕴含的知识。但由于数据的动态发展以及知识图谱构建技术的不足,目前已知的知识图谱仍然具有不完善性和错误性,因此对其进行补全成为目前的研究热点之一。在知识图谱补全过程中,对实体间的关系进行推理是非常重要的一个环节。目前的关系推理方法一方面忽视了实体间多跳路径中的隐含信息对推理结果的
学位