基于标签的推荐系统研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:qianqian3580
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
“互联网+”时代产生了巨大的信息浪潮,在为用户带来更加宽泛的选择同时也增加了信息筛选的难度,降低了信息利用率。推荐系统存在的目的就是帮助用户快速发现所需信息,并结合用户自身特点和兴趣爱好,为用户寻找高质量高价值的资源,从而减少用户接触重复或无关信息带来的不利影响,提升用户体验度。以往的推荐常以评分或投票作为用户对资源态度的衡量指标,但这类数据往往对资源本体的依附性过强,当资源消失这些指标便会失去价值。大众标注法的引入带来了推荐系统中对资源评价的另一种方式,标签简便易用且利于传播,它不仅能够体现出资源的差异性也反映出了标注者的行为特征与个人偏好。本文对基于标签的推荐系统进行了深入了解,分析了时下主流的三种推荐算法在标签推荐系统中的应用情况。在传统算法的基础上引入关联规则挖掘,并通过使用K-means聚类方法对标签集合分类来降低矩阵的数据稀疏度。通过寻找海量用户行为中的频发行为集合,从中发现隐含规律并以此作为对未来用户的推荐指导,这不仅提高了推荐系统的准确度也增加了结果集中项目类型的覆盖率。主要研究工作如下:第一,提出了一种基于标签的关联规则挖掘方法。传统的标签推荐系统都不同程度的会存在数据稀疏问题和标签语义问题。本文将关联规则挖掘技术应用在对标签的规律发掘过程中,以事务为中心,弱化标签语义的影响。同时,为了增加标签的关联度并考虑长尾标签的价值,使用K-means算法对用户标签集合进行散点聚类。此处通过结合层次聚类算法来设定合理的K值,形成以质心标签为代表的标签簇,簇内标签聚和度高,簇间标签差异性大。然后,将用户一次完整的标签使用情况视为一项有效事务,从所有的事务集合中寻找频发项目。在保留具有一定支持度和置信度的通用规则的情况下,考虑规则可能存在的不对称性因素,并剔除热门标签的影响,发现真正具有一定代表性的关联事件。最后根据目标用户的需求与关联规则触发前件的匹配程度选择Top-N作为推荐标签。第二,根据图书系统的特点,设计了一套适用于该领域的个性化推荐模型。该模型将读者的用户文件作为标签数据来源之一,并根据系统记录提取用户属性作为属性标签,把此类标签视作不同维度的数据,计算其在关联规则中的效用值,从而细分规则。同时,根据用户的阅读记录建立用户知识体系,对用户提出系统的学习建议,让图书推荐结果兼顾个性化与连贯性。本文最后使用豆瓣网的图书数据设计实验,与传统标签推荐系统的测评指标进行对比,验证了该模型的可用性和有效性。
其他文献
以姚鼐为首的桐城派研究是文学研究的热门。学者多从辞章入手,探讨姚鼐思想、经历和古文特征及其在桐城派文统和清代散文中的地位。但是,从姚鼐和乾嘉学派的关系入手,细致入
目的探讨铸瓷和氧化锆两种材料的髓腔固位冠修复大面积缺损磨牙的临床效果。方法选取2015年1月至2016年12月在北京丰台医院口腔科就诊的83例患者的100颗大面积缺损磨牙,采用
十七大提出“推动当代中国马克思主义大众化”的任务后,这一问题随即成为学界和理论界研究的热点问题。学者们不仅围绕理论依据、时代背景和实践基础对其进行了全方位探讨,而且
狄金森诗歌中体现出的独特生态智慧使其在当今社会依然具有研究价值,而作为中国古代智慧精髓的道家哲学在自然的本质及人与自然的关系等方面也有精辟论述。本文旨在从道家哲
最近,中央反复强调,党内监督要“抓早抓小”,把纪律和规矩挺在前面。巡视作为党内监督的一项重要制度设计,必须自觉转变观念,调整工作思路,严格按照党内监督的特点和规律,扎实有序推
报纸
针对欠驱动桥式吊车系统的抗摆控制问题,提出一种新型的解耦滑模控制算法。相比于传统解耦滑模控制算法,该控制算法采用可导的中间变量来定义系统的第二层滑动面,并利用等效
以鲜切紫甘薯为原料,用0.5、1.0、2.0、3.0、4.0 g/L,五种不同质量浓度的L-半胱氨酸(L-cysteine,Lcys)溶液分别对鲜切紫甘薯做浸泡15 min处理。通过对各项理化指标与营养成分
通过对欧洲铁路经营模式和日本铁路发展特点的比较分析可见,国外铁路的经营经历了从"建运合一"到"建运分离"的发展模式。现阶段我国铁路投资公司的投资管理模式大致可以归纳为三
针对日益突出的水体重金属污染问题,采用液相还原法制备海泡石负载纳米零价铁(S-nZVI),并研究其对Cu(II)、Zn(II)的去除效果.同时,利用比表面积与孔径分析(BET)、透射电子显微镜(TEM)、
为了解近年来山西省冬小麦生产现状,对山西冬小麦水肥管理进行科学指导,2011—2014连续3年在山西小麦种植面积第一大县闻喜县调查冬小麦水肥管理状况。结果表明,闻喜县冬小麦