【摘 要】
:
随着互联网信息的全球流通和数字化、网络化和智能化设备的普及,社交网络的发展亦日新月异。其中,基于位置的社交网络(LBSN,location based social network)中的兴趣点(POI,Point-of-interest)推荐问题愈发受到广泛的关注。LBSN可以为用户提供实时的位置服务,方便用户记录他们感兴趣的位置并与朋友分享他们愉悦的生活经历。POI推荐通过挖掘分析用户的历史签入
论文部分内容阅读
随着互联网信息的全球流通和数字化、网络化和智能化设备的普及,社交网络的发展亦日新月异。其中,基于位置的社交网络(LBSN,location based social network)中的兴趣点(POI,Point-of-interest)推荐问题愈发受到广泛的关注。LBSN可以为用户提供实时的位置服务,方便用户记录他们感兴趣的位置并与朋友分享他们愉悦的生活经历。POI推荐通过挖掘分析用户的历史签入数据来进行位置推荐,它在大数据挖掘、人工智能等学术领域和商业推广和潜在用户筛选等商业领域发挥着重要作用,也在数据的稀疏性、隐性的用户反馈机制和用户偏好的个性化等方面面临挑战。为了充分挖掘LBSN中有价值的信息,使推荐的位置更能贴合用户的需求,本文充分利用用户签到数据中的位置、类别、时间、空间等信息,分别为个体用户和群组提出更合理的兴趣点推荐策略,提高了推荐精确率和用户的满意度。本文的主要工作包括两部分。第一,在个人推荐方面。本文提出了一种集成时间感知、类别过滤、空间约束和流行度吸引力的POI推荐模型(TDCF),具体包括:(1)研究了时间在位置推荐中的影响,并为目标用户在一天中任意指定的时间点进行兴趣点推荐,采用融入用户相似度和时间相似度的方式进行平滑过滤计算从而对候选位置进行评分预测;研究了协同过滤中相似用户个数对于推荐结果的影响。(2)针对用户的签到记录不一定全都是积极的,即存在用户进行了签到但是评价很低的“噪声位置”这一现象,本文采用用户-类别-时间的三阶张量分解算法挖掘用户的类别偏好,从而过滤不属于用户偏好类别的位置,减少了“噪声位置”对于推荐结果的影响。(3)采用改进的空间约束的超文本诱导主题搜索(HITS)算法来计算兴趣点的流行度吸引力,并在地理空间上模拟用户的活动区域对候选位置进行了约束;采用加权的方式把时间感知模型和具有地理约束的流行度模型融合在一起;最后采用Foursquare中的两个数据集NYC和YK对本文提出的模型进行了实验对比和方案评估,结果表明相较于其他前沿算法,TDCF在精准率、召回率和F-measure值等评价指标上均有明显的提升。第二,在群组推荐方面。提出了一种基于群组类别特征和组内分歧的群组POI推荐方法(CFID),具体包括:(1)研究了群组成员个数对于兴趣点推荐结果的影响,将群组按大小分为二人小组和多人小组,并针对两种不同的群组提出了不同的推荐策略。(2)区别于用推荐策略融合个人推荐结果的方法,本文并没有直接计算组内成员对于各个候选兴趣点的预测评分,而是将群组看作一个整体而不是松散的个体集合,综合考虑类别因素和时间因素的影响建立了群组特征偏好模型;此外,本文还融合组内成员的用户偏好模型对群组偏好模型进行补充。(3)分析了群组内所有成员及其好友对于候选位置的历史访问记录来计算群组对于候选位置的分歧度,同时考虑到了群组推荐的完整性和差异性。最后,提出了一种从个人签到数据中挖掘群组访问数据并划分训练集和测试集的方法,并在Foursquare中两个真实的个人数据集上模拟群组访问,解决了群组访问数据集稀缺的问题。同时,本文还与其他三种群组推荐算法在不同方向进行了对比实验并在所有的实验中均明显优于其他对比算法。
其他文献
"玩事"是数字化人力资源管理时代的文化沟通工具,它把一个非常"软"的内容,即企业文化,借助于具体的勋章和金豆等做法构成的体系,做得非常实在。它的理念是:解决好人的因素,则开展工作任务更顺畅,更有利于达成工作目标。2018年4月,时任用友网络科技股份有限公司首席技术官、"玩事"项目创始人程操红先生,应邀来到清华经管学院MBA课堂,对用友企业文化落地互联网工具——"玩事"进行了主题分享:
随着信息时代的发展,互联网带给人们生活便利的同时,也产生了海量的数据。在数据爆发式增长的趋势下,如何处理海量的非结构化数据,抽取有效信息成了当下最为重要的问题。而命名实体识别技术可以从海量文本数据中提取关键实体信息。因此,命名实体识别任务起着至关重要的作用,具有极高的应用价值与研究意义。近年来,随着计算机硬件条件的提升,GPU的发展十分迅猛。在充足的算力面前,深度学习的应用越来越广泛。在没有计算能
分类是机器学习领域常见的问题之一,多标签学习是传统分类问题的变体,它能够处理每个实例同时和多个标签相关联的问题。目前已经存在大量成熟的方法用于解决多标签学习,这些方法整体可以被划分成两类:问题转换方法和算法自适应方法。问题转换方法通常会先将多标签学习问题转换成其他类型的问题,比如二元分类、多分类等,然后再利用相应的算法进行处理;而算法自适应方法则通过改变现有的算法来实现直接处理多标签学习问题。另外
研究目的:通过系统评价的方法来分析不同治疗方式对子宫内膜癌术后局部复发率的影响,以期为临床治疗提供循证学方面的证据。研究方法:通过计算机检索Pubmed、Cochrane、Web of science、Medline、重庆维普中文期刊全文数据库(VIP)、万方数据库、中国期刊全文数据库(CNKI)等中外文各大数据库中研究不同治疗方式与子宫内膜癌术后局部复发关系的相关文献。检索语种为中文和英文,检索
针对目前赤铁矿阴离子反浮选工艺所存在的问题,开发出了药剂制度及流程简单、可常温浮选的赤铁矿柱式阳离子反浮选工艺。该工艺的特点一是引入了以高效回收微细粒矿物为特点的新型浮选柱—微泡逆流接触式浮选柱;二是工艺流程中引入一种新型阳离子捕收剂GE-609,GE-609具有高效起泡性、耐低温、选择性好的优点。以该工艺中的微泡逆流接触式浮选柱为研究对象,对其捕集区的气泡行为特性进行深入研究。首先在自行设计的浮
随着医学影像学的快速发展,医生显著提高了对不同疾病的检测效率和诊断精度。其中,医学图像病灶区域的分割结果是医生作为临床学诊断的重要依据。因此,各种医疗图像分割技术涌现出来,极大地帮助医生提高医学诊断的效率和准确性。然而,医学图像具有高度复杂性、噪声分布不均匀以及不同医学研究部位差异较大等问题,传统的图像分割方法不足以很好地克服这些挑战。近年来,得益于数据规模的快速增长以及计算力的飞速提高,深度学习
随着信息技术的快速发展和5G时代的到来,每天都有大量的用户在微博,Twitter和淘宝等平台上对于某个事件或者某些产品发表评论。然而,传统的情感分析方法的对象通常是整篇文章、段落或者句子。这类方法在信息多元化的今天已经不能满足对具体事物进行情感分析的实际需求。方面级情感分析能够实现对评论文本中的不同方面进行情感极性判断,它可以为政府、企业、消费者提供全面且科学的决策依据,因此受到了广泛的关注。方面
科学计算软件现已广泛应用到了各个研究领域中,而科学计算软件的功能实现需要由多个数值计算程序构成,所以数值计算程序的输出结果是否正确将直接影响科学计算软件能否正常使用,因此对数值计算程序进行测试也是软件测试中必不可少的一部分。在对数值计算程序进行测试时,由于程序的输出常常十分复杂,测试人员很难直接判断程序的输出结果是否正确,Oracle问题广泛存在。所以将蜕变测试应用到数值计算程序的测试中是十分必要
选区激光熔化技术作为一种新兴的制造工艺,逐渐受国内外学者重视,将此工艺应用到高氮不锈钢制造领域,可以提高材料的质量和性能,而对激光照射到粉体材料过程中熔池的传热与流动规律的探讨,可以为选区激光熔化制造高氮不锈钢提供理论依据,因此采取了多种不同参数的激光热源照射不锈钢粉体,研究了粉体熔化与凝固过程中的传热机理和熔池流动状态的影响因素。传热模拟计算表明,热源参数的不同对熔池熔化与成型效果有很大的影响,
变形是自然界普遍存在的重要现象,其具有极大的危害性,往往会引发重大灾难。针对动态变形进行监测,分析内在的规律,研究有效的预报模型,科学的进行灾害防治,对国民经济可持续发展与社会稳定具有重要意义。本文对GPS动态变形数据处理做了一定探讨,同时对预报模型的构建进行了较深入的研究。本文首先对小波分析的基本理论进行了概述,随后在小波阈值降噪模型的基础上,根据GPS动态变形监测数据序列的特点,利用改进的动态