基于用户评论的公园推荐算法研究

来源 :北京林业大学 | 被引量 : 0次 | 上传用户:acy333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
公园是城市园林绿地的主要组成部分,为人们日常的游览、休闲、娱乐等活动提供了舒适的环境。但由于公园种类繁多,游客在出行选择公园时需要花费较多的时间和精力,因此在推荐算法领域进行公园推荐的研究分析,可以帮助游客更好的选择喜爱的公园。其中,协同过滤算法是实际中最常用的推荐方法,但在协同过滤算法中,通常仅使用用户的评分,而忽视了用户的评论。针对上述问题,本文在协同过滤算法的基础上,使用情感分析、主题抽取两种方法分析在大众点评网上采集到的用户对公园的评论,提出两种不同的基于用户评论的公园推荐算法。(1)提出了一种基于情感分析的公园推荐算法。该算法首先通过用户在公园上的评论语料库提取出用户最关注的公园特征,其次通过用户在公园各个特征上的情感偏好为用户寻找相似用户并进行公园评分预测。最后为了验证算法的性能,在真实的公园数据集上进行了实验,从实验结果中可以看出本文的方法具有较高的准确性,在一定程度上缓解了数据稀疏问题。(2)提出一种基于Latent Dirichlet Allocation(LDA)主题模型的公园推荐算法。该算法首先使用LDA主题模型来提取每个公园的特征分布,并根据公园的特征分布和用户评分来计算用户偏好分布。为了避免用户随意评分,引入用户评分可信度修正用户偏好分布。其次使用修正的Kullback-Leibler(KL)散度即Jensen-Shannon(JS)散度来计算用户之间的相似性,进而预测目标用户对未知公园的评分。最后,在真实的公园数据集上对提出的算法进行实验验证,并与其他的算法进行了对比。
其他文献
人类对传统化石燃料的大肆开采带来了日益严峻的能源匮乏和环境恶化问题,发展新型可再生清洁能源已刻不容缓。氢能集绿色环保、燃烧热值高、可再生等优点于一身,在减缓能源危
稀疏优化问题是对变量选择,误差修正,压缩感知,势约束投资管理等一系列实际应用问题的数学优化模型描述。(?)_p拟范数模型在许多稀疏优化问题应用中表现出更好的效果。(?)_p
本文以“铁磁/压电”复合磁电薄膜为研究对象,开展了电场对铁磁相磁特性的调制研究。主要工作如下:(1)采用脉冲激光沉积法(PLD)在石英衬底上沉积铁磁形状记忆合金Ni43Mn41Co5
近年来,纳米技术快速发展,纳米颗粒的应用深入到生活的方方面面,从而导致纳米颗粒不可避免地进入到水体环境中。纳米银(AgNPs)因其具有较强的抗菌性能,成为应用最为广泛的纳米颗粒之一,其暴露可能会对环境产生潜在的负面影响。因此,AgNPs的毒性机理及相应的环境效应值得深入研究。本研究以黄菖蒲下行流人工湿地生态系统为研究对象,考察低浓度(0.5mg/L)、高浓度(2mg/L)的AgNPs、Ag+、Ag
当细胞处于应激状态和细胞内压力增大时,会激活细胞自噬功能。自噬可分为巨自噬、微自噬和分子伴侣介导的自噬(chaperone-mediated autophagy,CMA)。细胞应激时,巨自噬、微自
多糖在自然界中广泛存在,是一类重要的生物大分子,在食品、化工、医药等行业中具有广泛的应用。作为高分子材料的主要组成部分,多糖类大分子可以通过分子间或分子内相互作用
近年来随机微分方程发展迅速,在生物数学领域尤为突出。本文先是构建了一类非自治时滞比率依赖的捕食随机模型,通过运用Milstein方法、L’Hopital法则、伊藤公式,研究非自治
目的探讨晚期卵巢癌R0术后不同化疗方案的疗效及影响疗效的相关因素。方法回顾性分析2010年1月-2014年12月期间辽宁省肿瘤医院收治的217例病理证实为上皮性卵巢恶性肿瘤,且行肿瘤细胞减灭术术后无肉眼残留病灶(R0)的患者的临床资料。根据其化疗方案分为DC(多西紫杉醇+卡铂)方案化疗组和TC(紫杉醇+卡铂)方案化疗组。比较两组患者化疗后的近期临床疗效、远期临床疗效(无进展生存期(PFS)及总生存
魔芋葡甘聚糖(KGM)是魔芋块茎中的一种水溶性非离子型高分子资源多糖,因其优良的凝胶特性,被广泛地运用于食品、医药等领域。因其链状结构具有复杂性,导致其构效关系的研究进
公司风险投资起源于20世纪60年代,经过五十多年的发展,公司风险投资成为资本市场中的重要参与主体,得到了越来越多关注。据统计,截止2018年12月,美国的公司风险投资额共711亿