一种基于情境聚类的协同过滤算法的研究与实现

来源 :湖南大学 | 被引量 : 0次 | 上传用户:w354026268
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无线互联网及移动设备的飞速发展,带动着网络资源的爆炸式增长,加剧信息过载问题,加大了用户寻找所需信息的难度。推荐系统成为解决这个问题的关键,其中推荐算法对推荐结果起到关键的作用。目前的推荐算法当中,应用最广的是协同过滤推荐。它通过分析用户之间的相似性,得到近邻,通过近邻预测未评分项目,将近邻喜欢的项目形成推荐结果。虽然协同过滤算法有挖掘用户潜在爱好等优点,但是它同样存在着一些问题,例如数据稀疏性问题、可拓展性问题以及冷启动问题等等。此外,评分矩阵不能全面的反映出用户的所有情况和偏好,其偏好同样与其年龄、职业以及其所在位置等情境信息有着密切的联系。针对以上问题,本文提出了一种基于情境进行聚类的协同过滤算法,主要研究内容有:(1)深入研究现有推荐算法,分析其情境缺失问题。针对其只考虑用户评分这个问题,引入可能影响用户兴趣爱好的用户情境和外在环境情境,包括用户年龄、职业、时间以及位置等,结合情境语义学,构建了用户情境的形式化表达方法。(2)针对传统协同过滤算法当中存在的数据稀疏性问题,提出了基于情境的聚类算法。深入研究了常见不同数据类型变量的相异度计算方法,计算两两情境相异度,构建情境相异度矩阵。深入研究FCM算法,并针对FCM的收敛性问题,引入了收敛因子,利用改进的FCM算法,在情境相异度矩阵的基础上进行聚类。如此将三维模型降维,缩小了目标用户查找相似用户的范围,降低了复杂度,缓解数据稀疏性问题。(3)针对协同过滤算法当中的用户相似度算法忽略了用户对单条项目评分尺度差异问题,提出一种改进的相似度算法,引入平衡因子,对相似度进行修正,得到更准确的最近邻居。将改进的相似度算法与基于用户情境的聚类算法进行结合,提出了一种基于情境聚类的协同过滤算法。(4)将本文方法在MovieLens数据集上进行反复试验,与基于情境等价相异度矩阵聚类的协同过滤算法进行对比,采用平均绝对误差,召回率和准确率等指标进行评估,实验结果表明该算法具备良好的性能。
其他文献
电子商务中的支付环节是电子商务业务和运营的组成部分,几乎所有的商业银行都提供网上支付业务,而支付宝等第三方支付平台在该电子商务业务中占据着重要的位置。由于不同支付
电信企业要想获得竞争优势,就必须尊重客户的差异性需求,有针对性地为客户提供优质服务,从而才能在获得盈利的同时提高客户的忠诚度以及满意度。目前,电信企业普遍通过各种信
锂离子电池(LIBs)作为多样化便携式电子产品的主要动力源,在我们的日常生活中扮演着重要角色,因为它们的能量密度高、循环寿命长且对环境友好。为了获得更高的LIBs能量密度,电
随着制造业技术的快速发展,工业系统也逐渐向智能化、自动化方向发展,传统的工业测量系统柔性化低、人工成本大,在许多方面已经满足不了制造业的要求。在工业检测系统中加入
镁可充电池有望成为下一代新型高能绿色二次电池。具有高工作电压和高比能量的正极材料是镁可充电池的发展方向。VO2(B)正极材料因有较高的理论比容量和工作电压,已被广泛研究
为研究无线技术在电梯上的应用,本课题将ZigBee无线技术应用于轿厢的串行通信系统中;为了使电梯的使用更加安全和智能化,本课题在轿厢控制系统中增加了指纹识别和指纹智能呼
近年来,随着经济快速发展,人们的生活水平不断提高,购物需求越来越大,然而市面上的商品材质种类繁多、鱼龙混杂,人们在挑选时不能准确评价材质的质量,很多时候买到的商品材质
松脂作为重要的可再生资源,其深加工产品广泛应用于合成香料、药物及精细化学品方面,整个关联产业已占到GDP的10%。松脂经粗加工可制得松香和松节油,有关松香的研究已比较成
聚对苯撑吡啶并二咪唑(PIPD,商品名M5)纤维作为一种新型芳香杂环聚合物,具备刚性棒状聚合物独有的优异力学性能和耐热性能,因结构中含有大量极性基团,使其能形成蜂窝状的三维
在北方季节性冻土区的一些基坑工程,由于规模的不断扩大,施工期和使用期已发生很大变化,可能要经历越冬期。桩锚支护结构是一种桩、锚索及被支护土体协同工作的支护体系,工程