【摘 要】
:
城市公交系统作为公交交通系统的主要组成成分,是城市居民使用最频繁的交通工具。随着智能公交系统的不断发展,公交系统中会记录下海量的乘客出行数据,这些数据是分析乘客出行行为提高公交车服务质量的关键。然而,目前很多城市的IC卡数据只记录乘客的上车信息,没有乘客的下车信息,根据乘客上车记录推断出乘客下车站点成为目前公交客流问题的研究热点。本文基于IC卡数据和公交GPS数据,从静态推断和动态推断两方面进行公
论文部分内容阅读
城市公交系统作为公交交通系统的主要组成成分,是城市居民使用最频繁的交通工具。随着智能公交系统的不断发展,公交系统中会记录下海量的乘客出行数据,这些数据是分析乘客出行行为提高公交车服务质量的关键。然而,目前很多城市的IC卡数据只记录乘客的上车信息,没有乘客的下车信息,根据乘客上车记录推断出乘客下车站点成为目前公交客流问题的研究热点。本文基于IC卡数据和公交GPS数据,从静态推断和动态推断两方面进行公交客流问题研究。首先,针对IC系统中只有刷卡支付乘客记录没有投币支付乘客记录的问题,使用基于“支付事件阈值”的泊松分布模型补全站点上车人数,该方法主要依据连续两次刷卡记录之间的上车人数符合泊松分布这一结论,概率统计两次刷卡记录之间的投币上车人数,引入“支付事件阈值”将连续两次刷卡时间过长的情况去掉,使结果更加准确。其次,针对IC卡数据没有下车站点记录的问题,提出利用规则推断与序列化标注算法相结合的乘客下车站点推断方法,该方法主要分为两阶段:第一阶段利用行程链模型推出规律出行乘客的下车站点,整理结果构造数据集,第二阶段通过序列化标注模型推断出非规律出行乘客的下车站点,完成静态推断。最后,为实现乘客下车站点的实时推断,提出基于乘客出行记录与静态推断相结合的乘客实时下车站点推断方法,根据乘客实时的上车信息检索乘客历史出行记录,判断是否是规律出行站点,若是则直接标记下车站点,否则,用静态推断模型推断下车站点。本文利用两个城市的公交数据,分别对上述静态下车站点推断方法和动态下车站点推断方法进行了实例分析,验证了本文方法在实际应用中的有效性。
其他文献
实体链接任务是识别文本中潜在的实体指称,并将其链接到给定知识库中无歧义的实体上.在绝大多数情况下,实体链接可能存在中文短文本缺乏有效上下文信息,导致存在一词多义的歧义现象;同时候选链接过程中,候选实体的不确定相关性也影响候选实体链接精确性.针对上述两个问题,提出深度神经网络与关联图相结合的实体链接模型.模型添加字符特征、上下文、信息深层语义来增强指称和实体表示,并进行相似度匹配.利用Fast-newman算法将图谱知识库聚类划分不同类型实体簇,将相似度计算得分最高候选实体所属实体簇映射到关系平面,构建聚类
针对传统的网络安全态势要素获取模型中,当样本分布不平衡时,占比很少的样本(统称小样本)不能被有效检测,准确识别到每一类攻击样本成为研究热点之一.利用深度学习提出了一种面向样本不平衡的要素获取模型,利用卷积神经网络作为基分类器提取网络数据的深层特征,其次使用GAN生成对抗网络扩充小样本的方法,解决样本分布不均衡问题.在扩充后的平衡数据集上采用迁移学习,加快基分类器到适应于小样本的新分类的训练时间.在NSL-KDD数据集上的实验表明,经过生成对抗网络扩充后的数据集,结合迁移学习有效加快了模型训练收敛速度,并有
近几年,随着视频数据规模的不断增加,近重复视频数据不断涌现,视频的数据质量问题越来越突出.通过近重复视频清洗方法,有助于提高视频集的数据质量.然而,目前针对近重复视频清洗问题的研究较少,主要集中于近重复视频检索等方面的研究.现有研究方法尽管可以有效识别近重复视频,但较难在保证数据完整性的前提下,自动清洗近重复视频数据,以便改善视频数据质量.为解决上述问题,提出一种融合VGG-16深度网络与FD-means(feature distance-means)聚类的近重复视频清洗方法.该方法借助MOG2模型和中值
随着网络应用的发展,服务响应速度与延迟的要求日益提升,传统的集中式云计算难以满足网络服务对服务响应、隐私性保护等需求。将云计算与边缘计算融合的云边协同计算日益成为满足网络服务响应速度和隐私保护的一种新型计算模式,受到业内广泛关注。然而,由于边缘计算环境自身的环境复杂性、实时变化性、接入终端多样性等因素,云边协同这一新型架构的安全性与性能开销问题变得日益突出。为能够确保云边协同架构的安全性,如何确保
随着计算机技术的不断发展,软件的规模也在逐渐扩大。但由于在代码开发过程中的各种原因比如主观抄袭,使用复用技术等,导致产生了代码克隆现象。代码克隆虽然能帮助软件系统的开发,但在复杂的软件系统如大型国防软件系统、商用软件系统等会带来漏洞或者后门等危险以及知识产权的纠纷等问题。传统的代码克隆检测主要采用人工特征提取并进行比较,检测效果较差。基于深度机器学习的方法能够挖掘出更深层的语法语义信息,可以有效提
蛋白质是生命活动的物质基础,直接参与、执行生命的活动过程.大多数蛋白质通过相互作用形成复合物来实现各种生物功能,因此预测蛋白质复合物有助于了解复合物的结构及其功能,也为细胞机制的研究奠定了重要基础.目前,随着高通量实验技术的不断发展,全基因组蛋白质相互作用(PPI)数据日益增多,领域内已经出现了很多基于计算的蛋白质复合物预测方法.虽然现有方法各具特色与优势,但也存在一些不足.首先,针对现有基于计算的蛋白质复合物预测方法进行了分类和比较全面、详细的分析评述;接着,介绍了复合物预测中常用的评价指标和主要数据集
针对室内轮椅定位与地图构建中传统ORB(oriented FAST and rotated BRIEF)受到特征点检测与选取策略的影响导致特征匹配正确率不理想,提出一种改进人工鱼群的ORB特征匹配算法.使用改进后的FAST检测特征点,利用改进后的人工鱼群在组合优化问题中具有收敛速度快且易获得最优解的特点,在图像中计算出不同特征区域,根据特征点所在区域位置赋予其相应的状态,对不同状态的特征点选择保留或去除,使用汉明距离的RANSAC算法在特征区域之间进行特征匹配.实验结果表明,改进后的FAST在图像边缘处提
智能优化算法(IOA)指的是一类以自然界的生物生存进化过程或物理现象为算法原理,用于解决最优化问题的算法,较为知名的智能优化算法有遗传算法、粒子群算法、模拟退火算法等.智能优化算法属于启发式方法,广泛应用在解决最优化问题上,传统的群智能算法为解决一些实际问题提供了新思路.随着科学技术的进步和应用场景的改变,传统的智能优化算法在收敛速度、求解精度等方面已无法满足日益复杂的优化问题,因此不断有新的更高效的智能优化算法被提出.选取了近几年国内外提出的几种新型智能优化算法:蝴蝶优化算法(BOA)、飞蛾扑火算法(M
针对基本蚁群算法在机器人路径规划过程中路径转弯角度过大、易陷入局部极小值、收敛速度慢等问题,对其进行改进.在分析机器人路径规划环境建模方法基础上,将转角启发函数引入至节点选择概率公式,以增强路径选择指向性,提高算法搜索速度;通过引入当前节点与下一节点之间的距离和下一节点与目标节点距离之和的二次方对启发函数进行改进,使得算法搜索过程更有针对性,并降低陷入局部极小值概率;提出信息素挥发因子自适应更新策略,扩大算法搜索范围,提高收敛速度;利用遗传算法的交叉操作对移动路径进行二次优化,以增强算法的寻优能力,进而以