面向数据稀疏问题的协同过滤推荐算法改进研究

被引量 : 0次 | 上传用户:super56x
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术和设备的提高,网络用户已不仅仅是信息的获取者,还是信息的发布者。网络上的信息资源越来越多,要从大量的信息中获取有用的信息变得越来越难。推荐系统能为网络用户提供最相关的和感兴趣的信息,从而满足网络用户的需求。在推荐系统中,使用最广泛的算法是协同过滤推荐算法,特别是在电子商务领域中,协同过滤推荐算法获得了很大的成功。由于协同过滤推荐算法是利用其它用户的信息来进行推荐的,它能为用户推荐任何类型的内容,所以相较于基于内容的推荐算法,协同过滤推荐算法具有更大的优势。协同过滤推荐算法主要是利用用户在网站上留下的评分信息为用户提供个性化的推荐。由于用户和项目的数量非常大,而用户对项目的评分数量十分有限,使得协同过滤推荐算法面临着数据稀疏性的问题。数据稀疏性问题是造成传统协同过滤推荐算法评分预测准确度和推荐质量不高的一个主要原因。本文主要研究了面向数据稀疏性的协同过滤推荐算法,提出基于用户隐性背景信息和非邻居用户的协同过滤推荐算法。本文首先提出了用户隐性背景信息的概念,将用户隐性背景信息引入到协同过滤推荐算法中,利用用户-项目评分矩阵和用户背景信息,得出项目属性值,根据项目属性值和项目类别,计算得到每个项目类别下的用户隐性背景信息;再将用户隐性背景信息与多属性决策方法进行结合,对项目进行过滤,对初始评分矩阵进行降维,形成初始项目集;接着在初始项目集中,用传统相似度算法进行相似度计算,选出目标用户的邻居用户,余下的作为目标用户的非邻居用户,对于邻居用户用传统的协同过滤推荐算法预测评分,对于非邻居用户,用概率来表示与目标用户的评分模式关系,预测出项目的评分;然后分别赋予邻居用户预测评分和非邻居用户预测评分的权重,将这两种预测评分结合起来,得到最终的项目预测评分及推荐项目集,为目标用户提供推荐。本文提出的方法用MovieLens数据库中的数据进行了实验和评估,实验证明相较于传统的协同过滤推荐算法,本文提出的方法在数据稀疏性、项目评分预测准确性和项目分类准确性这三个方面有更好的表现。在文章的最后,本文总结了研究工作内容,分析了研究的不足之处,并对未来的研究方法进行了展望。
其他文献
随着国家加强对海洋的开发,对于海洋功能区划的要求越来越高.从国内外海洋功能区划研究现状和发展趋势出发,通过采用标准的三层结构,建立了连云港市海洋功能区划信息系统,实
民间组织与政府的关系构建既是国家与社会关系理论研究领域的重要问题,也是中国整体社会变迁中的重要问题。当前,从社会问题角度看,民间组织与政府关系是一个民间组织如何发育,提
贝拉·巴托克(Béla Bartók,1881~1945年)是二十世纪匈牙利著名的民族主义作曲家、钢琴家、音乐批评家和音乐教育家。他的音乐创作植根于民间音乐的土壤,并把民间音乐元素运用于
各种原发性或继发性肾脏疾病的病理改变持续发展,导致固缩肾或小白肾[1].由于肾实质已被破坏,原发性的病理特征已多数消失,故病理检查时已不能确定原发病的性质[2].其临床表
随着我国经济社会水平的全面提升,网络信息技术的迅猛发展,中小企业的信息化服务体系也得以逐步建立,信息化和工业、农业的融合也变得越来越紧密。但是众所周知中国是一个农
目的探究儿童孤独症患儿实施家庭综合护理的临床治疗效果。方法选取本康复中心2016年5月—2017年1月收治的80例儿童孤独症患儿,采用奇偶法将其平均分为观察组40例与对照组40
针对某汽车物流公司仓库进行仓库布局规划设计,采用EIQ分析与SLP方法相结合的方式,根据仓库中出入库订单的特点,找出仓库布局时应注意的要点,并对仓库内部布局进行规划设计,
基于自适应噪声对消原理的自适应谐波检测方法具有众多优点,但算法中步长的选择必须在收敛速度和稳态精度之间做一个平衡。本文基于L2范数和真正跟踪误差提出了一种改进的变
采用衬套连接的方法在ADAMS软件中模拟了集装箱起重机防摇摆系统中的柔性绳索,运用宏命令实现与滑轮机构的装配,建立了防摇摆柔性系统的虚拟样机。通过动力学仿真,系统地分析
2002年7~10月在福建省惠安县开展了采用循环水工艺实施南美白对虾高密度养殖实验,经约90d养殖实验,获得平均产量1.62 kg/m2的收成.结果表明:所设计的循环水道具有实施养殖水沉