基于信息熵的协同过滤算法研究

来源 :北京交通大学 | 被引量 : 3次 | 上传用户:bjyoung
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展和大数据、云计算时代的到来,海量资源的产生使“信息负载”现象日益加重,导致消费者难以从中筛选出有价值的资源,同时造成网络中的大量资源由于利用率低而成为长尾数据。因此如何帮助用户从海量数据中快速高效地发现所需信息,提高用户体验,也一直是近几年互联网领域研究的热点。而推荐系统的诞生帮助用户改善了这个问题。为了适应不同场景下的资源推荐,推荐技术也处于不停的改进和更新中,其中协同过滤推荐是迄今为止应用最广泛也是最成功的技术之一,但是仍然存在一定的局限性。本文在传统协同过滤推荐的基础上,对其存在的问题进行深入分析和研究。本文的主要研究工作如下:(1)传统协同过滤推荐中推荐精度不高主要是由数据严重稀疏引起的,而在传统用户相似度度量中只考虑用户之间共同评分的数量,忽略评分之间的差异,导致推荐效果不理想。针对这个问题,本文引入信息论中的信息熵,考虑用户之间评分差异的影响,通过计算用户差异度的熵值,提出基于信息熵的相似度计算方法。(2)为了提高最近邻居集合的精确度,本文综合考虑用户共同评分项目数量和评分数值的影响,将基于信息熵的相似度度量方法和传统协同过滤算法中的皮尔逊相似度计算方法进行线性加权,得到加权相似度计算方法。(3)针对传统相似度计算中忽略用户兴趣度的问题,本文在加权相似度的基础上,结合用户评分数值变化趋势,引入用户的兴趣度,提出融合信息熵和兴趣度的相似度计算方法,以此来提高推荐质量。最后为了验证提出的相似度计算方法是否有效,将算法应用于MovieLens等公开数据集进行实验,并设置与传统的协同过滤算法的多组对比实验。实验结果表明,综合考虑共同评分数目、评分数值和评分趋势三种因素得到的推荐效果比传统协同过滤推荐有所提升,从而证明了方法的有效性和可行性。
其他文献
节能是世界主题,建筑节能更加重要。本文主要从墙体、遮阳来说明建筑设计中的节能措施。
在小学阶段的语文习作教学中,一定要放宽学生习作的个性化培养,放手让学生我手写我心尤为重要,同时也是为张扬学生习作的个性,培养学生良好的习作习惯打下坚实的基础。但是小
随着公共卫生条件的不断改善、人们对疾病的重视、辅助检查手段的提高以及生存环境的变化,越来越多的卵巢肿瘤被发现,许多卵巢肿瘤甚至在产前即可检测到。针对不同年龄阶段、不
目的:本文通过调查我院300例胃脘痛住院病人疏肝理气药物使用情况,并进行频率分析,研究疏肝理气药使用规律,为治疗胃脘痛提供有意义的临床参考。方法:通过回顾性的临床研究,
众所周知,煤矿开采的第一道工序是掘进,而确保高效采掘煤炭的根本原因是挖掘比例的协调。对于矿山的生产,岩石隧道的挖掘工作量一般约占道路挖掘总量的四分之一。与煤巷相比,岩石隧道的开挖速度通常较慢,特别是淮北矿区及全国其它各大矿区煤层开采相继进入深部之后,由于地质条件、水文条件等因素影响,再且地质条件的复杂多变性、不稳定性等因素使得岩巷深部大断面较普通岩巷断面大,上述原因导致该地区煤开采的掘进效率较其他
目的探讨三种方案治疗2型糖尿病的药物经济学分析。方法选取2013年6月至2015年11月浙江省嘉兴市第一医院收治的120例2型糖尿病患者作为研究对象,根据治疗方案不同将患者分为A
从"实物法"间接费的工作内容界定及项目划分入手,介绍了实物法,并举例说明水电工程"实物法"间接费的分析计算思路。
期刊
引入微分求积法,分析高速小展弦比机翼的气动弹性问题。将小展弦比机翼等效为悬臂板,基于一阶活塞气动力理论建立机翼颤振偏微分方程,采用微分求积法将偏微分方程转化为常微分方
整个研究主要是建立在2015年冬季对拉萨城市公园的实地调研、录像拍摄、问卷调查的基础上,并结合有关资料绘制出拉萨城市公园的现状图。此外,经过对各个综合性公园现状、公园