基于手机端用户数据的地点预测模型研究与实践

被引量 : 2次 | 上传用户:huangjh9246
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
用户的活动地点,反应了个体的喜好、活动规律及一个人的社会关系。如果能够建立一个人的地点预测模型,就可以根据用户当前的地点预测用户下一次可能出现的位置。智能手机已经成为了人们生活中不可缺少的一部分,所以研究手机端用户数据,建立地点预测模型具有深远意义。本文对人类地点空间活动轨迹模型和数据挖掘技术中的预测技术等相关理论进行了深入的探讨,总结归纳了目前国内外在人类地点空间活动轨迹研究领域的研究成果,针对人类活动轨迹总是同时频繁访问某一些特定地点的特征和人类访问地点总是具有某种先后顺序的特点,设计并实现了基于改进的Apriori算法的强关联地点项模型和基于改进的PreFixSpan算法的地点序列预测模型,进而实现了对手机端用户的地点预测模型。首先,利用改进后的Apriori算法对用户的历史数据进行关联分析,将具有强关联性的地点项抽取出来,即在历史数据中在同一天出现频率较高的地点项。其次基于改进后的PreFixSpan算法挖掘出用户活动轨迹的先后顺序。为了提高挖掘地点先后顺序的效率,将强关联地点项模型的输出结果作为地点序列预测模型的输入数据,生成强关联地点项的投影数据库即地点预测集。在预测阶段,只要输入用户当前的地点信息,模型就会在预测结果集中匹配下一个将要被访问的地点,将被访问可能性最大的地点作为预测结果。本文建模使用的数据为Nokia手机端用户数据,利用用户前半年的数据作为训练数据,后半年的数据作为测试数据,目前本文提出的预测模型的预测准确率在65%左右。Nokia挑战赛的平均预测准确度为59%左右。在建模阶段,虽然本文是针对一个用户的数据建模,但模型具有普适性,在以后的应用中,只要输入相应用户的历史数据,就可以动态的为该用户生成该用户的预测结果集,从而实现动态地点预测。
其他文献
在小型固定流化床实验装置(FFB)上,采用MLC-500裂化催化剂,在质量空速5h-1、剂油质量比8、反应温度460~540℃的条件下对顶循环油裂化性能进行研究。结果表明:在裂化过程中,有1
<正> 淡淡的月光照着田野,田野上立着一些孤零零的草垛,远处是一抹暗蓝色的森林,夜色柔和、静谧……这是契诃夫书房的壁炉上嵌着的一幅画,题为《慕色、草垛》。这幅画是俄国
2013年8月1日,全国首例纵向垄断纠纷在上海高级人民法院终审宣判。该案在国内反垄断诉讼历史上创造了诸多先例:多达4万余字的终审判决书"半判决半法理"、诉讼双方均委托经济
<正> 一、引言 借助计算机这一先进工具,采用模拟方法进行公交线网的评价,是运用系统工程思想指导公交优化中很重要的一步。而如何求得任两小区间的多条最短路径,则是模拟中
我国一直未建立农村房屋所有权登记制度,宅基地房屋则历经土改登记、农村宅基地使用权登记以及农村村民不断新建、翻建、改扩建的演变。因此,在确定宅基地房屋权属时,应综合
目的探讨金莲花口服液提取工艺。方法采用HPLC法测定金莲花口服液提取液中的荭草苷和牡荆苷,以二者提取质量浓度为考察指标,L18(37)正交试验法逆向连续循环低温提取金莲花,确
电影是运用多种视听手段综合作用于人物的心理活动刻画的一种艺术形式,也正是如此,电影对人物心理的刻画才相对地区别于戏剧。在电影中,导演可以运用视听语言思维和想象,调动
城管执法是为了实现行政管理权与处罚权分离改革,在我国特定时期社会经济条件下的产物。实践表明,城管部门为我国城市化进程做出了相当的贡献,但同时也暴露出了暴力违法执法
在建筑照明领域,选用LED灯应符合下列条件:显色指数Ra不应低于80,同类光源的色容差不应超过5 SDCM,特殊显色指数R9>0,色温不宜高于4 000 K,寿命期内的色偏差不应超过0.007,不
<正> 今年10月16日,国务院、中央军委颁布命令,授予钱学森“国家杰出贡献科学家”荣誉称号,以表彰他在发展我国科技和国防科技事业中作出的巨大贡献。今天是钱老80岁生日,中