【摘 要】
:
在目前的个性化推荐算法中,协同过滤推荐算法最为经典,是很多推荐算法的理论基础,但仍然存在一些像数据稀疏性、冷启动、可扩展性等干扰推荐效果的问题。其中由于系统中用户和项目数量过多,不是所有项目都被用户所接触,因此会带来数据稀疏性的问题;当新用户加入系统时,由于系统数据库中没有此用户相关的历史数据,无法对用户进行个性化推荐,只能按照某种规则进行推荐,从而产生用户冷启动问题。本文主要针对协同过滤推荐算法
论文部分内容阅读
在目前的个性化推荐算法中,协同过滤推荐算法最为经典,是很多推荐算法的理论基础,但仍然存在一些像数据稀疏性、冷启动、可扩展性等干扰推荐效果的问题。其中由于系统中用户和项目数量过多,不是所有项目都被用户所接触,因此会带来数据稀疏性的问题;当新用户加入系统时,由于系统数据库中没有此用户相关的历史数据,无法对用户进行个性化推荐,只能按照某种规则进行推荐,从而产生用户冷启动问题。本文主要针对协同过滤推荐算法中面临的数据稀疏性与冷启动问题导致的推荐效果不精确,提出了一种优化缺失的数据填充方式和相似度求解的方法。首先根据用户的平均评分将用户划分为三种不同用户群体,对用户进行层次聚类,将用户基本特征如年龄进行编码后初步计算用户之间的距离相似度,并与共同评分项所占比值相乘作为填充值权重的一部分得到用户相似度,利用Slope-one算法计算前K个相似用户的填充值,加入相似度的权重以获得最终填充值,对数据填充方式进行初步改进;其次计算相似度寻找近邻集时,将用户基本属性作为相似度权重,并且引入Sigmoid函数来添加时间戳对相似度的影响,对寻找近邻用户用到的相似度求解方法做出初步优化;最后加入用户ID和项目标签特征,对ID类特征进行One-hot编码之后输入分类或者回归的神经网络进行参数计算,训练得到对应的权重,把权重向量作为ID和标签的Embedding向量,并计算Embedding距离相似性作为相似度权重的一部分,进一步改进协同过滤推荐算法中的数据填充方式和相似度计算方法。本文用Movielens数据集对应提出的优化方法做了相应的实验,实验结果表明,推荐精度得到了显著提高,数据稀疏性与冷启动问题得到了改善,证明了本文提出的改进算法的有效性。
其他文献
拍卖部分国有企业在我国部分地区已有所行动。对此现象,不少同志存有这样或那样的疑虑。我是赞成这种改革行动的。 目前,拍卖国有企业在我国还处在摸索阶段,没有多少现成的经
一、播前准备(一)轮作倒茬轮作倒茬是大豆的增产措施之一。连续2年以上夏季种植大豆会造成土壤养分的非均衡消耗,土壤中水解氮和速效钾质量分数减少,土壤酶活性下降,一些病虫
在新时代的背景下,高中数学着眼于培养学生核心素养,促进学生终身发展,成为社会发展所需要的人才。长期的教学活动实践证明,创设问题情境是培养学生数学素养的一个有效途径。
教学是教师和学生共同参与的"人--人"对话系统.企业管理专业教学重在提高学生的管理能力.对教学内容、方法、手段、反馈、论文指导等各教学子系统进行改革,形成的企业管理专
近几年来,各地都把各类市场的建设作为大事来抓,市场建设面积大幅度增加,建设档次越来越高.但是透过这股市场建设热也不难发现,市场建设存在一定的盲目性,在某种程度上似乎可
从选用良种、合理密植、提高播种质量、科学肥水管理、加强病虫害防治以及适时收获等方面,介绍玉米高产栽培技术,以期为玉米的高产优质制种提供参考.
市场经济作为法制经济,要求政府的最基本职能,就是制定法律和严格运用法律,以确立和维护以市场经济秩序为核心的社会秩序.具体来说,其立法和执法职能包括制定“宪法”;制定“
通过对高职学生职业素质现状的研究和分析,针对其素质方面所存在的主要问题,利用工学结合的教育模式,把学校定向培养和校外工作实践有机结合,发挥学校文化和企业历练的自身优
目的:观察艾司西酞普兰联合米氮平治疗抑郁症睡眠障碍患者疗效及对睡眠结构指标的影响。方法:回顾性分析268例抑郁症睡眠障碍患者临床资料,根据药物治疗方法不同分为观察组(服用
傣族聚居区特殊的地理条件催生了内容丰富、形式多样的傣族医药。归纳出傣族医药与傣族聚居区地理环境的关系:傣族医药深受地理毗邻的东南亚文化的影响;与聚居区的气候条件、