协同过滤算法中的相似度计算与用户兴趣变化问题研究及应用

被引量 : 11次 | 上传用户:ZhangQin520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网、电信网以及广播电视网的融合(三网融合),作为新一代有线数字电视产品的双向互动数字电视IPTV,在世界范围内得到了迅速发展。自从2005年进入中国以来,由于其良好的互动性,他的用户数量增长迅速。节目内容提供商在IPTV平台上向用户提供了大量的图像、音频、视频等多种信息。在这种环境下,容易让用户迷失在庞大的节目信息空间中,用户即使经过繁琐的操作,也往往仍然难以找到自己喜爱的节目。由此可以看出,对于IPTV服务提供商而言,为用户提供精准高效的个性化节目推荐服务,进而提高服务质量,已经成为一种迫切的需求。现存的推荐算法主要有基于内容的推荐算法、协同过滤推荐算法和混合推荐算法等主要针对电子商务系统的推荐算法,而电子商务系统与IPTV系统有着显著不同。正是由于这些不同,使得以上推荐算法在IPTV系统中进行应用时,与在电子商务系统中进行应用时相比,准确性大大降低。其中,协同过滤算法是目前现存的个性化推荐系统中应用最广泛、推荐效果和计算效率最为稳定的推荐算法,同时也是最成熟、最成功的推荐算法之一。相似性度量是协同过滤算法的核心内容,传统的相似性度量方法,例如余弦相似性和Person相关相似性等方法分别在向量长度和交叠程度方面考虑不足。除此之外,传统的协同过滤算法对用户在不同时间的兴趣偏好同等对待,缺乏实时性。针对以上这些问题,本文分析了IPTV系统与电子商务系统之间存在的差异,并在此基础上对传统的基于内容的推荐算法和协同过滤推荐算法进行改进,进而提出了一种改进的基于内容的推荐算法和一种基于TJacUOD的协同过滤推荐算法。基于T_JacUOD的协同过滤推荐算法是引入JacUOD的方法来计算用户之间的相似度,并引入时间权重来体现时间因素对推荐结果的影响。将其与传统的协同过滤算法及其目前存在的几种改进算法进行对比,使用MovieLens数据集进行实验得到的结果表明,基于T_JacUOD的协同过滤算法对不同的邻居个数,其MAE值均有所降低,在一定程度上提高了预测精度。改进的基于内容的推荐算法考虑用户多次观看同一个节目的情况对用户兴趣的影响,使用逻辑运算来简化相似度计算,并引入开放式电影标签作为推荐的依据。使用福建电信iTV系统点播电影的数据集进行实验来验证提出的算法的有效性,实验结果表明,本文提出的算法与基于标签的协同过滤等其他算法相比,推荐命中率均有所提高,召回率降低,在一定程度上提高了预测精度和性能。最后,本文在福建电信iTV视频推荐系统的应用背景下,根据其各自的特点,把本文提出的两种推荐算法应用到电信iTV视频推荐系统中以应对不同的场景,从而实现了理论与实践相结合。
其他文献
在当今科技和知识快速发展的时代,从宏观层面上讲,国家的技术创新水平能够决定它的产业结构转型道路,提高国家在国际领域的地位和竞争力,而从微观层面上说,一个企业的技术创
随着移动智能终端设备的飞速发展,人们的生活与工作离不开平板电脑与智能电话等移动设备的应用,信息安全问题已经不仅仅局限于PC机。因此,智能终端的操作系统安全成为了一个
近些年来,由于网络经济的蓬勃发展,电子商务成为了人们生活中的一部分,作为电子商务最末端的环节,快递成为了从虚拟到现实的桥梁。电子商务的发展给快递行业带来了巨大的市场空间
近年来,产业集群在国内外地区经济发展中发挥的作用越来越大。这些集群,很多都是我们耳熟能详的。国外成熟的产业集群中,美国有好莱坞影视娱乐产业和硅谷高新电子产业,意大利
自改革开放以来,我国与世界其他各国的联系愈加紧密,并以更加开放、包容的姿态积极活动于世界舞台中心。要展现国家形象、传播国家立场和中华文化,对外宣传是必不可少的手段,
本论文来自于作者所在实验室与北京市某公司的联合研发项目,设计并实现一款基于TI (Texas Instruments)最新KeyStone II架构高性能DSP的可支持LTE-A的基带处理板卡。该板卡属
当今中医学在以《黄帝内经》和《伤寒杂病论》为核心经典的主流医学之外,仍然存在着道医、铃医、巫医等其他医学门类,其学术与主流医学存在明显差异。同为华夏医学之脉,各自
近年来,随着国外物流企业的纷纷入驻以及本土物流企业的快速发展,我国第三方物流企业间的竞争是日趋激烈。第三方物流企业要想在激烈的竞争中站稳脚步,源远流长,就需要先进的业绩
无论是针对小型机械零件的故障检测,还是大型机械设备的振动监测,其振动噪声信号为分析故障、监测状态提供了重要的数据参考。而振动噪声信号的采集和存储需要可靠高效的采集
数据挖掘是为使人们能够充分理解和应用隐藏在数据中的有效信息和知识而发展起来的一门新兴技术。聚类分析作为数据挖掘中的一种重要无监督模式,大致可分为以下几类方法:基于