基于移动轨迹数据的城市旅行者时空行为模式研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:luther2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高铁、飞机等交通技术的成熟发展,跨城的旅行需求日益增加。针对以城市为旅行目的地的旅行者的时空行为模式进行研究,可以为城市间旅行交通路线规划、旅行产品优化等提供参考依据。本文基于用户真实的时空基站数据及旅行目的地城市的地标数据对城市旅行者的时空行为进行研究,提取城市旅行者的时空行为特征,使用改进的K-prototype算法进行模式聚类,分析不同模式下城市旅行者的时空行为偏好。针对未知模式的旅行者使用KNN算法进行模式识别,提前预测城市旅行者的时空行为。
  首先本文基于规则的定义对城市旅行者进行识别与特征提取。通过城市旅行者与城市常住者的时空行为差异,给出城市旅行者定义并进行城市旅行者的识别,从海量的轨迹数据筛选出城市旅行者的样本数据。针对无旅行语义的手机位置数据及旅行目的地的地标数据,结合时间阈值判定法及网络切分法对旅行者的旅行停留点进行判定,获取旅行序列数据。然后提取其旅行轨迹序列、旅行方式、旅行时间、旅行距离四个维度的旅行时空特征,构建城市旅行者时空特征数据集。
  其次基于改进的K-prototype进行模式聚类。在聚类过程中,将上文提取的城市旅行者时空行为特征集,作为聚类输入的参数。使用欧几里得距离计算数值特征的距离,使用海明威距离计算分类特征的距离,使用Smith-Waterman算法计算旅行序列特征的距离,将不同类型的距离加权求和作为样本之间的距离。最后输出城市旅行者的聚类结果并使用轮廓系数作为聚类效果的评价指标。
  然后提出一种基于旅行者部分信息对其全量时空行为进行识别的方法。在对城市旅行者的时空行为识别过程中,将聚类结果作为样本数据的标签,提取每个模式的N个关键用户的部分特征数据作为训练数据,同时提取新用户的特征集合作为测试数据,使用KNN算法进行新用户时空行为的识别。
  最后以上海市的地标数据及城市旅行者的样本数据应用聚类方法,得出城市旅行者的8种不同模式,发现不同客源地的城市旅行者在旅行时间分配、旅行距离考量、旅行路线规划、住宿点选取等的偏好。使用关键用户到达旅行目的地第一天的特征数据进行城市旅行者的时空行为预测,证明了该方法的有效性。
其他文献
新产品的开发对于企业提升市场竞争力具有非常重要的作用,而对于新产品的概念选型是企业研发过程中的关键环节。在实际市场环境中的新产品概念选型问题,一方面要考虑新产品的创新质量或技术基础,另一方面也要考虑企业决策者对于未来新产品的评价信息、指标的期望信息以及指标的相关权重信息。专利作为创新活动的产物,在很多时候能够作为企业新产品开发的技术基础和概念选型来源,因此,利用专利作为技术基础或知识来源进行新产品
众包竞赛作为一种新兴的社会互动行为下的商业模式,在研发、创意、广告等活动中得到广泛的应用。创意众包通过互联网平台,以众包竞赛的模式来汇集公众的创意思维、创意知识、创新技能和信息等,使得企业直接面对消费者,更有效地开拓创新产品设计,应对市场快速变化的需求。众包竞赛不仅能够充分发挥社会闲散人员的力量,还能够满足企业创新的需求,为企业创新提供一种新的模式。通过这种商业模式可以使企业获得更加广泛的智力资源
学位
自2008年美国次级房贷危机以来,金融市场的系统性风险愈演愈烈,引起了世界范围内的关注。银行间拆借市场凭借其资金融通的便利作用,在金融体系中的地位愈发重要,但同时也成为金融系统性风险发生的重要传播渠道。近年来,网络科学理论逐步成为银行系统性风险领域新的研究方向。目前,国内外学者大多是基于多种外生网络对风险传染进行研究,即事先人为地设定银行节点间的拆借关系,但这种静态网络结构并不能反映真实的银行网络
学位
经济的飞速发展带动越来越多人们生活水平的不断提高,人民对于产品质量水平也是越来越敏感。所以,此时再单纯的依靠低层次的价格战已经不能在激烈的市场竞争中取得胜利,而如何以合适的价格向消费者提供高质量的产品成为企业的必然选择。目前供应链管理的思想引起越来越多企业和学者的关注,供应链质量管理也是目前企业和学者所研究的重点问题。  长此以来,供应链管理的方法和模型研究都是建立在“经济人”假设的基础上,这个假
学位
由于存在计划提前期,服装零售销售预测与实际市场需求不一致是常态,同时服装商品存在季节性和价值易逝性的特征,动态打折销售是服装零售企业进行库存控制,优化运营收益的一个常用工具。因此,从商家角度,基于不断变化的市场需求,进行动态价格折扣调整,以达到有限销售期内的收益最大化,是新零售时期服装零售企业运营管理的一个重要课题。新零售环境下,服装零售实现了线上线下数据整合,积累了大量的历史销售数据,为服装零售
学位
近几年,伴随着共享经济而来的电动汽车分时租赁业务,因其租车的便利性与能源的清洁性,正在逐渐壮大之中。城市共享电动汽车租赁公司,在积极运营租赁业务的同时,需要面临共享电动汽车的清洁问题,以便提供更好的服务获得更高的满意度。本文研究了城市共享电动汽车清洁排程优化问题,即电动汽车需要在有限的时间窗内进行清洁服务,其中每辆电动汽车都有多个可被清洁的时间窗并对应地点信息。论文的主要工作与创新点:  (1)通
本文从经典报童模型出发,研究两个变量(成本与需求、价格与需求)随机且具有相关性的情况。其中关于随机变量的处理,考虑到历史数据稀缺,无法获得准确的分布,而只能得到分布的矩模糊集的特点,本文采用分布式鲁棒优化方法对随机变量进行处理,并采用条件风险价值(Conditional Value at Risk,CVaR)度量决策者的风险态度,基于以上说明,建立了分布式鲁棒方法下基于矩确定和矩不确定模糊集的建模
学位
近年来,数次金融危机对各国乃至全球经济造成了巨大冲击,金融危机的爆发与金融系统内在结构的脆弱性密不可分。因此,研究金融系统内在结构特征,进ー步提升系统稳定性成为国内外关注的重点。而银行在我国金融系统中是重要组成部分之一,从研究银行系统稳定性相关问题出发,了解银行系统构成的网络结构特征及相关参数变化的作用,对于进ー步抓住金融系统内在脆弱性根本原因,维护整个金融系统稳定性有着较强的理论与现实意义。  
学位
商业信用不仅是基于商品而非资金为载体的间接融资服务,也是一种有效的激励协调合同。在供应链的环境中,制造商为下游零售商提供商业信用合同,允许零售商提前付款或延期付款。对于零售商而言,他们可以释放资金占用并鼓励其增加订货量;同时,对于制造商而言,他们也获得了更多的产品批发收益。但在商业信用的实际运作过程中,主要存在以下的结构性问题。第一,组成供应链的每个节点企业由于承担了不同的角色往往会有各自的信息优
学位
随着电子商务的不断发展,商务网站上的商品数量和种类与日俱增,个性化推荐系统可以帮助用户快速的从海量的商品中挑选出满足自己需求的商品。而常用的协同过滤算法存在着数据稀疏性和冷启动等问题进而影响了协同过滤算法的准确性。而商品评论中有大量的消费者对商品及其属性的观点和情感,蕴含了重要的消费者偏好信息;历史销售数据能够直观的反映出消费者的购买行为和偏好,通过对销售数据和评论数据中用户偏好有效的提取并应用于
学位