基于公共微博数据和收视行为数据的电视用户画像研究

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:ferer1019
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电视技术与互联网的高速发展,传统的单向接受信号的电视发生了巨大改变,人们现在可以在家中通过智能电视或者安装双向机顶盒来获取海量的电视节目,与此同时电视服务商也能够实时、准确的获取到电视用户所有操作数据。为了给电视用户推荐更符合用户口味的电视节目和更契合用户需求的广告,通过分析用户的收视行为数据构建准确的用户画像就显得至关重要。传统的电视用户画像方法一般先从电子节目表单系统(EPG)获得节目的标签,然后通过分析用户与电视节目的关系从而得到用户画像标签,但是由于EPG标签主观性太强、最后得到的标签覆盖面窄等原因而具有一定的局限性。本文针对如何使用公共微博数据提升电视用户画像的准确率进行了研究,其核心在于本文将处于不同平台的微博用户与电视用户相关联,使用准确的微博数据完成电视用户画像预测。具体工作内容包括:1)介绍了电视用户画像的背景与意义,研究并确认微博用户含有对电视节目关注的行为并且拥有准确的用户画像信息;2)设计了高效网络爬虫以获取微博数据,并使用分词算法、配置词典、TF-IDF从博文中挖掘出了微博用户关注电视节目的特征;3)对大量电视用户收视数据进行清洗,得到电视用户关注电视节目的特征;4)将微博用户与电视用户相关联,设计了用户画像标签集,对每个标签使用微博数据构建分类预测模型,并使用该模型对电视用户进行用户画像预测;5)为了检验用户画像的准确性,使用某市一个月的真实收视行为数据,采用基于内容的推荐系统,检验了基于微博数据的电视用户画像方法的有效性。实验结果表明,本文所述方法相比于传统方法无论在准确率还是AUC值上都有明显的提升。
其他文献
在日常生活中,不管是训练,还是参加各种比赛,运动员体内每天都需要消耗巨大的体能。在运动结束后,他们体内会流失大量的营养物质,而为了尽快补充这些营养物质,就需要一些适宜
在我国证据法上,曾一度只承认客观性(真实性)和相关性(关联性)是证据的属性。其原因在于在我国法律历史传统上对实质真实的追求具有压倒--切的至上价值。在实践上,普遍的观念
<正> 慢性前列腺炎,是中、老年男性常见疾病之一。本组患者曾应用过数种抗生素,或性激素治疗,但仍未获得令人满意的效果。现将采用中医辨证治疗50例情况报告如下: 1 一般情况
创新对于我国经济的发展来说是必由之路,而不同领域的创新为知识产权的发展提供了很大的空间。与此同时,知识产权的保护提高了创新的价值。2018年我国提出要加强知识产权的保护,完善知识产权制度等重要内容。知识产权的发展与保护可以推动经济的发展,并且获得知识产权保护的商品往往意味着更高的价格和收益。我国在1985年就已经认识到了知识产权的重要性,颁布了专利法。随着时间的推移,知识产权相关的法律法规也不断完
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
<正>~~
会议
使用2010-2015年美国一流大学的商业R&D经费、大学科研产出、本科教学成果的面板数据,结合固定效应分析模型,实证分析了美国一流大学商业科研经费投入对科研成果产出和本科教
2008年爆发金融危机后,巴塞尔委员会推出了《巴塞尔协议Ⅲ》,加大对风险的控制力度。主要探讨《巴塞尔协议Ⅲ》对中国商业银行风险管理的影响和中国商业银行应该做出的对策。
目的 研究产品说明书的信息可视化表达。方法 以产品说明书为载体,梳理信息可视化发展的时代脉络,分析不同时代的技术、载体、表达内容对表达方式的影响,对产品说明书的信息进行