基于用户轨迹数据的周期活动模式挖掘

被引量 : 9次 | 上传用户:zphym
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着位置定位技术的快速发展,人们日常生活中积累了大量的轨迹数据。用户历史移动轨迹中蕴含着大量的信息,轨迹数据挖掘技术已经引起了很多专家学者的重视,成为当前的研究热点之一。对用户的历史轨迹进行挖掘,不仅可以发现用户日常活动的模式,还可以发现一些更高层次的信息。周期活动模式是用户生活中最容易出现的活动模式,通过对用户周期活动模式的挖掘可以进一步了解用户的活动习惯及相关爱好。本文主要研究如何通过用户的历史轨迹数据来发现用户的周期活动模式。针对周期活动挖掘中面临的时空数据采样频率不确定、数据稀疏、时空数据噪声等问题,本文提出一种基于概率统计模型的方法来挖掘用户的周期活动模式。由于周期活动本身具有复杂性、多周期交叉性及周期长度不确定等特点,本文周期活动模式的挖掘方法分为三个步骤。第一个步骤,对用户的历史轨迹进行预处理,得到用户的停留点序列;第二个步骤,对得到的停留点集合进行聚类分析,并使用兴趣度计算公式对聚类结果进行兴趣度计算,得到用户的重要兴趣点;第三个步骤,针对每个兴趣点,对用户的历史轨迹进行重构,将用户的轨迹序列转化成二进制序列,然后使用基于概率统计的周期长度探测方法探测每个兴趣点对应的周期长度,最后将同周期长度的兴趣点进行层次聚类,挖掘出用户的周期活动模式。本文给出的周期活动模式挖掘的方法和传统的周期活动发现算法相比有两个优势:一个是可以自动探测周期的长度,不需要根据用户的经验进行参数预设置。另一个是本文使用的是基于概率统计的周期长度检测算法,该算法可以较好的处理数据稀疏的问题,并且对用户原始数据的采样频率不敏感。本文通过在模拟数据集和微软亚洲研究院的Geolife项目的真实数据集上进行实验。结果表明,该算法能够有效的发现用户的周期活动模式,并对稀疏数据集及数据噪声有较高的鲁棒性。
其他文献
随着工业化、信息化与城镇化进程的推进,我国家庭传统功能与家庭现代需求结构相对失衡,家庭功能出现弱化、外化及社会化等趋势。当社会对这种需求增长和变化的反应滞后,尤其
常言道:"生命在于运动。"毛主席说过:"体育于吾人实占第一之位置。体强壮而后学问,道德之进修勇而收效远,体育一道,配德育与智育,而德智皆寄于体。无体是无德智也。身体是革命的本
<正> 铯是1860年用光谱分析法研究锂云母及杜尔汉矿泉水试样时发现的。1882年用电解氰化铯和氰化钡熔融混合物的方法首次制得金属铯。铯在自然界中分布非常广,在地壳中铯的平
自闭症是一种广泛性发育障碍,目前从对自闭症的认知到诊断再到对自闭症儿童的干预这一系列研究得到了广泛的重视。本研究从特殊教育学校的角度出发,分析主流自闭症干预手段,
文章构建了消费者生命周期投资-消费模型,利用动态规划最优性原理,讨论了模型的一般解法。此外,在两期情况下,进一步假设了投资者的需求具有层次性,给出了租房者购房决策的一
当前“90后”高职学生已成为高校的主力军,其自信心方面的表现并不像社会整体评价那样自信积极。从长远看,这一点无论对于学生个人还是对于高职院校的发展,都是相当不利的。结合
文章对非洲猪瘟病毒的结构特征及各种检测方法的应用情况进行阐述,比较各种方法的优缺点和适用性,为非洲猪瘟的诊断及防控提供参考。
目的探讨门诊静脉穿刺时的护理干预对患者满意度情况。方法对在本医院门诊进行静脉穿刺的4000例患者随机分组,干预组采取护患沟通、心理护理等护理干预措施,对照组则不进行相
小儿夜啼与乳母饮食调理小翔小儿夜啼是指非因身体不舒服而引起的包方呼自.老王湘育优日.右的每夜定时啼哭,哭后仍然安静人睡,称为夜啼症。人们每每从小儿人手治疗。谁知,乳母的饮
随着检验医学事业迅速发展,各种检验仪器不断进入临床检验科,在仪器配置及管理中如何讲究成本与效益,已成为检验科经济管理的核心内容。2001年至2004年来,我科仪器设备不断更