论文部分内容阅读
随着人民文化生活水平的提高,电视节目的数量也日渐丰富。观众面对海量的电视节目,通常需要花费大量的时间和精力才能找到自己喜爱的节目。因此,观众需要服务提供商帮助其推荐节目,实现节目的快速定位,电视节目的个性化服务已经成为了一种趋势。随着微博等社交网络、IPTV等服务的快速普及,服务提供商可以通过分析社交网络的开放数据,以及IPTV的收视记录,来更好的了解用户的收视行为和偏好。本文主要围绕两个数据来源,展开电视节目推荐工作:微博对电视剧讨论的数据,以及IPTV收视记录数据。对于推荐来说,微博有以下优点:微博用户的社交网络好友关系,以及微博好友之间的转发关系,使得现实生活中经过好友推荐的方式可以更好的融入到社交网络中;微博用户产生的丰富的文本信息,不仅可以反映用户的喜好,同时可以描绘物品的属性。基于概率矩阵分解模型,我们提出了混合推荐模型,并提出了两个正则项:基于用户信任度的正则项和基于物品相似度的正则项。其中用户信任度来自用户之间的好友以及转发关系,物品相似度来自讨论电视剧的微博文本的相似度。我们在新浪微博数据集上实现了该算法。通过和现有算法进行比较,我们的算法在RMSE指标上最高达到9%的提升。此外,我们在冷启动的场景下,可以向新用户进行节目推荐,验证了我们的算法的有效性。IPTV相对于普通电视的优点在于用户可以和电视进行交互,用户的观看行为更具有个性化。服务提供商可以通过分析用户收视纪录产生的大数据,来构建节目推荐系统。相比于传统互联网应用的推荐,IPTV推荐面临不同的挑战:一个家庭有一个或多个成员;每个家庭成员的收视偏好可以由多个主题的电视节目构成;每个用户的收视时间相对固定。根据上述假设,我们提出了耦合LDA模型,同时考虑了收视记录中的节目信息和时间信息。我们在IPTV数据集上验证了该模型分析家庭用户行为的效果。实验证明该算法可以得到相关性更高的节目主题,可以得到家庭在不同时段的收视喜好分布,从而为每个家庭求出更加个性化的收视行为模式,并在此基础上进行更准确的节目推荐。