基于综合标签因素与聚类算法的推荐技术研究

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:wanily1123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0技术的迅速发展和普及,互联网数据呈现出了爆炸式增长。为了高效地帮助用户从海量数据中找到其真正感兴趣的资源,推荐系统应运而生。推荐系统解决了信息过载问题,同时也面临着数据稀疏和冷启动问题。推荐系统成功的关键在于对用户兴趣的理解,通常用户兴趣是用户自身都难以描述的内容,标签系统正是通过利用含有丰富特征信息的标签找到用户感兴趣的资源。因此,本文针对传统推荐系统的不足,在对当前标签系统、推荐系统以及聚类算法深入研究的基础上,综合考虑标签的各个因素并结合聚类算法对传统基于标签的个性化推荐算法进行了优化,使其能够灵活应对数据稀疏、冷启动和时效性等问题,进而达到提高推荐质量的目的。为了解决传统推荐算法面临的数据稀疏和冷启动问题,在传统基于标签的个性化推荐算法的基础上,引入了用户特征,并利用用户特征对用户聚类,缓解冷启动问题。另外,用户兴趣有时会随时间发生变化,因此算法加入了时间衰减因子,根据标签的标注时间不同对标签给予不同权重。同时,为能够快速找到与目标用户兴趣相同且易被其接纳的用户,增强用户认同感,提高推荐效率和精准度,算法引入了信任关系和用户偏好。实验结果表明本文算法有效提高了推荐准确率。最后,针对传统推荐算法在处理海量数据时存在的可扩展性较差的问题,利用Hadoop平台实现算法的并行化设计,提高了计算效率,具有较好的可扩展性。
其他文献
上海公安交通指挥调度、事故应急处理智能化系统是为加强世博安全、保障世博交通而提出建设的。本文介绍了系统的建设目标、总体建设思路和系统总体架构,以及系统的功能特点,关
宋元时期是中国传统数学发展史上一个特殊的时期,这一时期取得了巨大的数学成就,像天元术等一些数学成果处于世界领先地位.同时,这一时期也涌现出了一大批数学家.他们撰写出一大
二十一世纪,资源短缺成为人类面临的巨大挑战。光能作为一种清洁能源由于具有取之不尽用之不竭、可再生等特点倍受关注。如何有效地利用光能成为缓解资源短缺的有效途径。LaB
本论文主要研究光学格子中的空间光孤子。研究光孤子有十分重要的理论价值和现实意义:在理论方面,对它的研究能够指导相关学科的研究,并相互验证;在应用方面,它在光开关逻辑器