融合社交和物品信息的隐语义模型研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:Rosa1201
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息时代的到来,在给我们带来便利的同时,也为我们提供了更多的选择,在面对多种选择时,我们无法快速准确地选择所需信息,这就是信息过载问题.推荐系统在解决信息过载问题上取得良好的效果,能帮助用户更精确更快速地从大量信息中找到满意和合适的信息.隐语义模型(Latent Factor Model,LFM)作为一种经典的推荐算法被广泛应用于各种推荐系统.但是传统的LFM只是单一地使用了用户对物品的评分信息,导致推荐质量不佳.因为社交、物品标签与物品类别信息的广泛运用使得推荐系统在数据稀疏的情况下能获得更高的推荐准确度,所以本文将社交和物品信息融入LFM中,可以更好地描述用户和物品的概况,从而可以更了解用户偏好,为其推荐合适的物品.本文提出一种新的算法框架,不仅融合了用户对物品的评分信息和用户的社交关系信息,还融合了物品信息,综合这些信息为推荐模型提供约束,所得到的结果不仅是相似用户的偏好,也是潜在的相似物品,更能保证推荐质量.通过对物品信息的利用,可以更好地寻找到潜在相似物品,做出更好的推荐.物品间的相似度主要是通过物品的标签或类别向量来计算的,但由于标签或类型数据的稀疏性,导致物品间的相似度计算结果并不理想,从而影响推荐精度.因此本文利用潜在语义索引(Latent Semantic Index,LSI)技术来处理物品信息,以更好地刻画物品间的相似度,对相似程度不同的物品给予不同的权重,可以有效发现潜在相似物品,从而提高推荐质量.在Douban数据集上和Last.fm数据集上实验,实验结果表明提出的算法可以提高推荐精度.针对LSI技术只是依靠物品自身所标注的标签,而未能统筹并综合利用所有物品标注标签的弊端,本文还利用了改进的LSI技术来处理物品信息.改进的LSI技术通过全局统筹标签和物品之间的关系,构建出标签频数权重,标签局部权重和物品全局权重这三个部分,通过它们联合作用来获取标签-物品矩阵,更有效地利用标签信息,能有效提高推荐准确度.在Last.fm数据集上进行实验,实验结果表明标签信息对推荐质量有着重要的影响.
其他文献
益生菌具有安全性、功能性和在胃环境中生存的能力。由于具有比其他天然产品更多的优势,益生菌已被广泛应用于有益健康的产品中。旨在开发一种具有多重保健作用的复合益生菌
企业筹划者在纳税筹划中需要具体问题具体分析,有时也要打破思维定式,独辟蹊径。$$ 如增值税免税是国家为鼓励一些特殊行业的发展而采取的税收优惠政策,如果企业筹划者采取主
报纸
我们以韩国留学生为研究对象,以其输出的汉语口语为研究内容,采用个案跟踪的调查方法,力求能够比较全面地查看韩国留学生汉语补语的中介语系统。本文共分为六章,第一章为绪论
教师职业生涯的头几年是决定其一生专业素质的关键期。解决初任教师问题,是提高教育质量的前提和保证。本文从国内外研究角度综述入职适应期研究对新疆学前双语教育发展的重要
新的基础教育课程改革,以培养学生的创新精神和实践能力为重点。教师在面临新课程改革时,除了要认真解读、领悟新课程体系中蕴含的思想,树立正确的教育观念外,还应根据新课程的要
长江优势是重庆拥有的垄断自然力,对重庆经济具有持续的基础性影响。重庆应战略性利用长江优势来构建沿江综合交通轴、产业-城镇带;发展与周边地区的沿河经济联系,在保护三峡
针对转炉底吹系统存在的底部气体流量小、不能动态调节以及吹炼模式简单单一等问题,分析终点碳氧积并进行回归分析,采取优化底吹PLC程序、建立底吹流量控制模型、合理选用底吹
目的观察峻竣煎内服结合中药灌肠治疗输卵管阻塞性不孕症的临床疗效。方法136例输卵管阻塞性不孕患者随机分为治疗组(102例)和对照组(34例);治疗组采用峻竣煎内服配合活血通