基于机器学习的推荐系统关键技术及其应用研究

来源 :电子科技大学 | 被引量 : 4次 | 上传用户:choww
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,推荐系统在信息过滤和信息检索中起着至关重要的作用,并广泛应用于社交网络,电子商务以及新闻推荐等领域,取得了巨大的经济效益和社会效益。但是,推荐系统仍然存在数据稀疏性及冷启动等问题,导致推荐精确性偏低,因此,如何解决信息过载问题,为用户提供高质量的推荐信息,仍然是当前的研究热点,具有重要的研究价值。本文重点研究了基于机器学习的推荐系统关键技术及应用,解决数据过载问题,旨在为用户提供高效的个性化推荐。主要研究内容分为四部分。(1)基于pairwise排序学习方法,研究了如何利用隐反馈信息学习用户的兴趣偏好,并提出了BPLR模型。基于用户兴趣偏好模型,BPLR根据用户历史行为将项目分为正反馈项,潜在反馈项及负反馈项,以便进行细粒度的兴趣偏好学习,其中潜在反馈项的生成利用了用户社交网络与项目的流行度,确保推荐结果的准确性与完整性。BPLR使用贝叶斯推断进行模型学习,并采用随机梯度下降法进行参数学习。此外,为过滤掉无效的样本,选择有效的模型训练样本,论文提出了一种动态采样策略DSS,该算法能够明显减小计算复杂性,并加快模型训练速度。在实际应用中,隐反馈信息非常丰富,并且容易收集,而BPLR能够有效地利用用户隐反馈信息进行排序推荐,因此具有广泛的应用前景。此外,论文还从理论上分析了BPLR模型的收敛性,并给出了相关的定理及证明。(2)深入研究了用户社交关系及兴趣偏好对推荐结果的影响,提出了SRMP推荐模型。该模型将用户信任关系进一步细分为信任与被信任关系,计算用户在社交网络中的专家水平值,并将其作为用户的权重,以限制矩阵分解中用户和项目的特征向量的学习。在模型优化阶段,SRMP将项目按照类别标签进行分类,将每个类别的项目作为独立的社交群体,并进行模型训练及评分预测,以提高推荐精度。研究表明,SRMP能够捕获用户间复杂的社交关系,学习用户的兴趣偏好,以此解决推荐系统的数据稀疏性问题,此外,SRMP还可以利用社交关系解决冷启动问题,并明显提高推荐的准确性及用户满意度。(3)深度学习方法在信息处理与信息检索中具有强大的优势,重点研究了深度学习算法利用数字评分,用户画像,项目属性以及可用附加信息进行精确推荐的原理及技术,并提出了深度推荐模型DLMR,该模型主要包括推荐选项生成与推荐选项重排序。在推荐选项生成过程中,DLMR采用主题分布模型LDA,从文本评论信息及项目背景信息中学习用户的兴趣分布,再将其融入卷积矩阵分解模型,提取用户和项目的特征向量,并据此进行数字评分预测,生成推荐选项。为进一步提高推荐精度,DLMR采用了一个三层降噪自编码器网络,利用可用的附加信息对生成的推荐选项进行重排序,生成最终的top-N推荐列表。实际应用中,DLMR利用深度学习模型,能够捕获用户之间、项目之间以及用户与项目之间的复杂关系,学习用户的兴趣偏好,为用户提供精确的个性化推荐。因此,基于深度学习的推荐方法具有强大的数据处理能力,能够处理具有各种不同特征的数据,有效地利用各种有用信息提高推荐结果精确度,是当前的研究热点,具有较好的发展应用前景。(4)研究了大规模在线推荐中的数据稀疏性问题,以及在线数据更新问题,提出了在线推荐模型LsRec,该模型主要包括离线计算和在线更新。LsRec根据用户的社交网络,计算用户的社交影响力,并将其融入矩阵分解模型,以限制用户和项目的特征向量学习。为了提供更加精准的推荐,LsRec采用TF-IDF将项目表示为向量,并采用k-means++聚类算法,对项目进行聚类。LsRec分别在生成的项目聚类中进行模型学习,以此提高推荐精准度。为确保模型的有效性和收敛性,论文给出了相关的定理,并提供了相应的理论证明。为解决在线数据更新及冷启动问题,LsRec基于快速矩阵变换法,提出了在线增量更新策略,能够及时捕获用户的兴趣偏好变化,具有良好的可扩展性,为用户提供准确的推荐服务。在大规模在线推荐应用中,LsRec能够有效地缓解数据稀疏性问题,并且快速高效地更新数据,为用户提供及时高效的在线推荐服务。
其他文献
目的:建立牛黄清胃丸对照制剂,并对其进行标定。方法:优选道地优质原料制备对照制剂。采用显微和薄层色谱法进行全处方鉴别。分别采用薄层色谱、气相色谱-串联质谱、高效液相
为量化高速公路路侧景观色彩与驾驶人脑电α/β值之间的关系,在吉珲高速公路进行道路试验采集所需数据.基于双指数函数建立景观色彩值与脑电α/β值的关系模型.考虑到驾驶时
随着新课程改革的不断深入,提高课堂教学有效性的呼声日益高涨,而打造高效课堂更是目前普通高中英语教学面临的又一个挑战,小组合作与个性化分层学习成为高校课堂的亮点。 W
随着汉语的传播和国内外汉语教育事业的发展,关于汉语习得及汉语教学的相关研究颇为丰富。在现有研究成果中,基于汉语学习者书面语语料的研究相对较多,而针对汉语学习者口语
癌症是世界上威胁人类健康最主要的疾病之一,大量不同的癌症形态限制了人们对癌症的研究。泛癌分析旨在研究不同癌症类型之间的相似性和差异性,通过联合多种癌症数据,我们可
在西北腹地宁夏,一个乳品行业的新星正在崛起,在市场经济的大舞台上烁烁闪光,引起了党和国家及自治区领导人的关心与支持。她──就是宁夏夏进乳品饮料有限公司。$$ 宁夏夏进
报纸
<正> 当代解释学家伽达默尔曾在其《真理与方法》一书中提出,“能被理解的存在就是语言”的命题。他认为,这个陈述是指,凡是某种东西是可以被我们所构造及以此而能想象到的,
简要介绍721型分光光度计的工作原理,重点描述721型分光光度计光学系统常见故障及维护保养方法,对保持仪器的良好性能以及保证测试的准确度有所帮助。最后简单介绍清洗比色皿
煤中氮元素在煤燃烧过程中会转化为各种氮的氧化物,从而造成环境污染。针对煤中氮元素的化学赋存形态、煤热解过程中氮元素的迁徙规律以及煤燃烧过程中氮氧化物的释放规律进
焚烧垃圾发电技术被广泛应用于处理城市生活垃圾。生活垃圾焚烧炉渣(MSWI-BA),即焚烧垃圾发电技术处理城市垃圾后的产物。炉渣不仅产量大,且属于一般废弃物,因此如何有效地利用