含地理位置信息的社交媒体挖掘及应用

被引量 : 0次 | 上传用户:qingquan528
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着移动互联网技术的发展和智能移动终端的普及,人们越来越习惯于通过智能移动终端上的应用随时随地获取或分享信息。在用于信息获取和分享的移动应用中,基于用户地理位置的服务已成为主流。人们在使用此类应用的过程中,产生了海量的含有地理位置信息的社交媒体数据,并且此类数据的规模呈爆炸性增长。这一类新型的海量媒体数据的出现,为许多研究领域带来了新的机遇和挑战,吸引了研究人员的兴趣和广泛关注。与传统的媒体数据相比,含地理位置信息的社交媒体数据具有独特性质,主要表现在以下三个方面:异构的地理信息表达和组成方式;强调移动性、时效性和交互性;包含空间、时间、社交等丰富上下文信息和多模态媒体内容。本论文针对含地理位置信息的社交媒体的上述三个特性所带来的科学问题,研究此类媒体的挖掘和推荐算法,包括:异构地理信息社交媒体融合挖掘算法;面向移动应用的高效在线推荐算法;以及融合多种上下文信息的个性化推荐算法。论文的主要研究工作和创新成果如下:1.提出了一种异构地理信息社交媒体融合挖掘算法以及基于二部图结构的重排序算法。论文针对点评网站等基于地理位置的服务中,结构化数据缺乏语义信息而难以应对特定信息需求的问题,提出了结构化和非结构化社交媒体数据的融合挖掘算法,用来对结构化数据的语义信息进行补充。在此基础上,又提出了一种基于二部图的排序算法对基于地理位置的服务中的商户进行重排序。实验结果表明:与仅使用点评网站中结构化信息的挖掘算法相比,论文所提出的融合挖掘算法的平均准确率均值相对提升了73%;相比于仅使用点评网站中结构信息的排序算法,以及仅使用商户在点评网站中原始评分的排序算法,论文提出的基于二部图结构并融合多种因素对商户进行重排序的算法更能满足用户的特定信息需求。2.提出了一种面向移动应用的高效在线推荐算法。论文针对移动应用场景中的在线地点推荐问题,提出了一种基于前缀树结构的可变记忆马尔科夫模型。论文所提出的算法从用户的历史地点序列中挖掘频繁序列模式,并以此构建前缀树结构,从而能够根据用户当前的地点高效地向用户推荐下一个地点,并根据用户的反馈动态调整模型。对于长度为l的地点序列,论文所提出的算法相比于传统的可变记忆马尔科夫模型:概率后缀树算法,将时间复杂度从O(Dl)降低至O(l),因此可以满足推荐的实时性要求。在提升算法效率的同时,实验结果表明,论文所提出的带有平滑模型的可变记忆马尔科夫模型能获得更高的推荐准确率。与固定阶数马尔科夫模型所能取得的最好结果相比,论文所提出的算法的平均准确率均值相对提升了69%;与概率后缀树算法相比,论文所提出的算法的平均准确率均值相对提升了36%。此外,论文所提出的在线地点推荐算法仅依赖于用户当前地点信息,所以该算法能够以很少的代价嵌入现有的各类基于地理位置服务的移动应用中。另外如果将“地点”的概念进行推广,该算法可以应用于地点推荐以外的其它问题,例如网页中用户点击行为预测、搜索引擎查询词推荐等。3.提出了一种融合多种上下文信息的个性化推荐算法。论文针对照片分享网站中海量社交媒体数据及其包含的丰富上下文信息,研究个性化的地点推荐算法。论文所提出的算法首先充分挖掘了照片分享网站中各种上下文信息,包括GPS位置信息、照片拍摄时间、用户信息、文本信息、照片视觉信息。在此基础上,该算法从多个方面计算地点与用户兴趣的匹配程度,并把融合多种上下文信息进行个性化推荐的问题建模为排序学习的问题,从而融合多种地点与用户兴趣度评分进行个性化的地点推荐。实验结果表明,论文所提出的算法能有效提高推荐的准确率,特别是在用户的历史信息比较稀少的情况下有显著提升。例如,实验数据集里42.7%的用户的历史地点序列中仅包含4个地点,论文所提出的算法在这种情况下平均准确率均值相对现有典型算法提升了27.5%。此外,论文提出的利用排序学习框架进行推荐的算法不仅限于个性化地点推荐问题,也可以应用于其它需要融合多种上下文信息进行推荐的问题。论文的最后对全文的研究工作进行了总结,并对未来的研究方向做出了展望。
其他文献
海洋是人类生存和发展的新空间,21世纪是迎接海洋、开发海洋和保护海洋的新世纪。《联合国海洋法公约》在旧的海洋条约的基础上,把全球海洋划分为不同法律地位的海域,使海洋秩序
在回顾中国早期步入奥林匹克大家庭的苦涩经历和两岸体育交往的曲折历程基础上,有感于两岸同胞心系北京奥运的民族情结,对加强后奥运时期两岸体育交流与合作进行理性的思考,
随着数字信息时代的到来,数字图像成为获取信息的主要渠道之一。然而,面对日常生活中充斥的大量图像信息,还没有一个有效的方法判定图像信息的真伪。形成这一现象的原因在于
摩擦阻力是制约数控机床直线驱动系统性能的重要因素,将磁悬浮永磁直线电动机应用于数控机床系统中,既省去了中间机械传动机构,又能够有效解决削弱高精高速数控机床摩擦阻力的问
海洋是21世纪希望之所在,其对一国的经济、政治、安全等领域都有重要的影响力,世界上许多国家都制定了自己的海洋发展规划,对海洋发展方向予以明确,甚至将其上升到国家战略的
<正>以不动点为载体,与数列紧密结合求通项公式,是近年高考数学压轴题的常见题型.聂文喜[1]、林国夫[2]等均进行过初步研究,但是例证都是关于2010年之前的高考题.本文基于"不
<正>众所周知,位于欧州中部的德国在历史上对数学发展有着重大贡献,如此的数学强国对数学教育必定有自己的传统特色.本研究选择德国巴伐利亚州LS版教材[1]与我国人教A版教材[
国外已有人把智库看作是立法、行政、司法、媒体之外的"第五种"权力。国内实现从传统决策到现代决策的转型较为缓慢,教训很深。目前,政策决策咨询类智库时代已经开启。建议在
中学生排球运动员作为我国排球新生力量肩负着接班我国传统优势项目和传承民族精神、凝聚民族力量的重任,因此在排球运动发展的过程中中学生排球后备人才的培养尤其重要。中学
<正>文[1,33~34]描述了一位数学教师在讲评一道高考题时出现的"意外"情况及其处理策略和课后反思.一方面反映了该教师有临场应变能力,能及时调整教学进程,并能给学生许多自主