基于神经网络和视频检测的公交车内拥挤度预测

来源 :科学与技术 | 被引量 : 0次 | 上传用户:yx10110605
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:公交拥挤度预测是城市公交智能优化的重要部分。城市公交客流分布具有一定的不均匀性,做好拥挤度预测可以有效改变这一现状,从而给乘客更舒适的乘车体验。本文通过研究bp神经网络,改进相应的学习算法,建立不同的拥挤度预测模型,使用在吉林省吉林市调研的客流数据进行训练与检验,保证了实际客观性和较高的预测精度。
  关键词:拥挤度预测;bp神经网络;预测模型;智能优化
  引言
  随着我国机动车保有量的日益增长,现有道路条件不适应交通需求的矛盾日益尖锐,造成了交通拥挤、秩序混乱、事故频发和污染加剧等严重问题。优先发展公共交通已经被世界各国公认为是解决大、中城市交通问题的最佳策略,是城市可持续发展的必由之路。实现高效的公交运营系统需要多方面的努力,提高公交线路的运营管理水平是其关键之一,而公交线路客流预测是实现公交运营调度优化的基础。另外,在客运高峰时段,公交系统面临着客流量过大、车内人流密度过高、车辆利用不合理等问题,在拥挤度方面乘客的需求得不到满足。总之,不管是为了提高公交运营调度水平还是为了优化乘客的出行体验,公交客流的拥挤度预测已经迫在眉睫。本文利用实时调研所得的公交客流数据基于bp神经网络进行了短时的公交拥挤度预测。
  本文通过对公交线路站点上下车人数主要相关影响因素的分析,基于公交车历史车流数据利用人工神经网络的基本原理,根据改进的BP學习算法,建立了公交车内拥挤度预测模型。
  1 公交拥挤度预测研究意义
  在客运高峰时段,公交系统面临着客流量过大、车内人流密度过高、车辆利用不合理等问题,具有一定的安全隐患[1]。而即使避开了客运高峰,每辆公交的拥挤程度也无法满足乘客的各种需求。拥挤度在很大程度上影响人们的出行方式[2,3]。
  我们针对市民对公交车拥挤度的相关看法进行了问卷调查,在数据获取后对问卷进行了筛选,剔除了所有选择单一选项、选择具有明显规律性、反向表述(与正向表述的选择具有明显矛盾)、网络问卷答题时间明显不符合正常答题所需时间等有问题的问卷,得到了相对精准的用户公交出行体验。其中多数乘客对现有的公交车运营调度手段不满意,表示深受无座、拥挤等公交常见问题的困扰。近80%的居民表示在时间充裕的情况下愿意等待下一辆公交车,不愿意等车的人只占少数。居民的出行选择与其职业年龄密切相关,不愿意等公交的几乎均为中年上班族,而青年与老年乘客则更趋向于选择舒适度更高的出行体验。在居民意愿的基础上,我们确定了本项目的切实需求,在基于历史数据的拥挤度预测基础上,根据当前站点车内人数对比数据库中历史数据,预测后面站点的拥挤度。本文面向市民可以方便其更好得做出行选择,面向公交公司可以帮助其进行相关运营调度,根据某站预测拥挤度增减车辆,满足居民的出行需要。
  2 客流数据的处理分析与神经网络的选取
  本文采用的是吉林市56号公交线路2018年6月的公交客流数据作为样本数据,其中工作日的数据有22天,周末的数据有8天,本文仅对于正常工作日的客流数据进行预测。我们选取连续工作日同一时段的客流数据进行处理,将筛选出的异常数据前后相邻数据取几何平均内置作为估计值继而代替异常值作样本使用,之后进行归一化处理。处理好后,建立了BP神经网络预测模型。
  2.1 客流数据的处理分析
  公交车经常出现在某一站点不上下客的情况,我们采取等差并采用等差变换加等比变换的方法,即对样本对的输入输出值先加一常数,再除以一常数,使BP网络的输入输出值限制在区间(0,1)之间,然后输入网络进行计算。受人工统计的影响,样本中有明显不符合常理的数据,我们采用替代法处理异常值,即将异常数据前后相邻数据取几何平均内置作为估计值继而代替异常值作样本使用,避免了数据样本的减少。
  为了减少数据之间的数量级,防止由于数量级差别过大而引起误差,神经网络输入的数据要归一化在一定范围内。通常采用最大最小化的方法将数据统一在(0,1)之间,该方法的公式是: ,式中Xi是当前输入数据,Xmin是所有输入数据中的最小值,Xmax是所有输入数据中的最大值。
  2.2 神经网络的选取
  BP神经网络相比于其他神经网络,具有网络精度高、逼近效果好、计算速度快等优点,有很强的非线性拟合能力,适用于复杂性较高的预测系统,能够对权值进行动态调整。我们进行了BP神经网络与ELM神经网络的对比实验,结果显示BP神经网络更符合我们的数据特点,预测结果的相对误差比较小。网络模型的建立需要确定很多因素,包括隐含层层数、隐含层神经元个数、学习速率、学习次数、网络参数等。网络的训练过程是一个不断修正权值和阈值的过程。通过调整,使网络的输出误差达到最小,满足我们的预测要求。
  1)确定隐含层层数
  BP神经网络的结构和性能受隐含层的层数影响。单隐含层网络非线性映射能力较弱,为了达到预定映射关系,隐含层节点要多一些,使网络的可调参数增加。我们通过构造法得到三种隐含层数,然后逐个验证模型预测误差,选取误差最小的那个。
  2)确定隐含层的神经元个数
  确定隐含层的层数后,就需要确定该层神经元的个数,神经元个数太多的话会花费大量训练时间,容易形成“过拟合”现象;个数太少的话不能准确完整地传递信息。本文采用输入层节点数和输出层节点数之积开平方的方法,不断实验,找出误差最小的那一种。
  3)确定初始权值和阈值
  由于网络的训练过程就是一个不断调整权值的过程,因此训练时间会受到四个因素的影响,分别是输入层到隐含层的权值、隐含层到输出层的权值、隐含层神经元的阈值和输出层神经元的阈值。由于激励函数的中点是零,所以当神经元的初始权值和阈值足够小接近零的时候,能够快速地收敛并获得最小误差。因此将初始参数调整为-1到1之间的随机数是普遍采用的做法。   3 数据的训练
  在选择网络的输入和输出数据时,由于暂时无法获得充足的数据,不能使用相邻周及相邻月的数据,由于六月的天气持续晴朗,天气信息不纳入输入变量的考虑范围。我们选取一个月前29天早上8点的数据作为训练集,预测第30天早上8点全程的车内人数,并把最后一个工作日数据作为测试数据,来验证模型的可用性。
  基于三層神经网络可逼近任何非线性函数的理论,本文选用了三层网络结构。根据输入变量和输出变量的个数,确定网络输入层包含6个神经元,输出层包含1个神经元。我们在判断隐含层包含多少个神经元的过程中,采用了试算法,当神经元的数目为12时,网络的预测误差最小,因此把12作为最终数目。设定隐含层的传递函数为tansig,设定输出层的传递函数为purelin,网络的训练函数选择trainscg。同时,设置必要的网络参数,训练迭代步数 epoch=5000,学习率 lr=0.2,学习目标 goal=0.001神经网络模型构建完毕后,将训练数据输入到网络中,当满足停止条件时训练过程终止:
  numberOfSample = 20;%输入样本数量
  %取测试样本数量等于输入(训练集)样本数量,因为输入样本(训练集)容量较少,否则一般必须用新鲜数据进行测试
  numberOfTestSample = 20;
  numberOfForcastSample = 2;
  numberOfHiddenNeure = 8;
  inputDimension = 3;
  outputDimension = 2;
  通过修改权值:
  %初始化输入层与隐含层之间的权值
  W1 = 0.5 * rand(numberOfHiddenNeure,inputDimension)- 0.1;
  %初始化输入层与隐含层之间的阈值
  B1 = 0.5 * rand(numberOfHiddenNeure,1)- 0.1;
  %初始化输出层与隐含层之间的权值
  W2 = 0.5 * rand(outputDimension,numberOfHiddenNeure)- 0.1;
  %初始化输出层与隐含层之间的阈值
  B2 = 0.5 * rand(outputDimension,1)- 0.1;
  得到不同输出值。
  4 预测模型的建立与结果评价
  网络训练完成后,就可以用来检验测试样本。用网络预测结果与检验样本的实际结果相比较,找出预测值与真实值之间的误差,即可检验出网络的训练质量。网络模拟值是归一化后的数据,将根据归一化公式反推后的模拟结果即可看出网络的状态。
  【预测模型:单站点拥挤度预测(微观)】
  单点预测我们可以采用多矩阵预测同一站点来提高准确度,找出最准确的一组来和真实值比较。其中我们预测过的精度最高的一组,与真实值误差小于10%。
  全程预测我们采用图像法,第一组预测值出来之后,不直接和真实值进行比较,而是根据预测值研究曲线,找出曲线开始趋于平缓的一段,将这一段的预测值提取出来与真实值进行比较,会大大提高效率。
  【预测模型:上下线路拥挤度预测(宏观)】
  这种方法是跨越20多个站点的宏观全程预测,即选取前一周的数据作为训练集,预测下一周某天某时刻全程的车内人数及拥挤度情况。图片为同一辆车上行线和下行线的预测结果图,虽然我们的模型对于每个站点的上下客果不是非常准确。但在整条公交线路上,我们对公交车全程的拥挤度预测与走势判断相当精准,可视为较满意的预测。
  5 基于视频检测的数据实时获取与研究
  本文的拥挤度预测基于历史客流数据,同样也应用历史数据检验。在算法完善之后,此技术可以与大数据相结合,进行实时客流预测与拥挤度判断。下面简单介绍本文采用的视频检测技术。
  5.1 视频检测系统
  传统的数据采集具有调查周期长,后期维护难,实时程度弱等缺点,再加上环境等客观不可控制因素,就无法获得足够准确的信息。传统的采集方法没有可统计性,不能满足当下的管理需求,因此我们要使客流信息化。本系统采用了车载摄像头的方法,在公交车前后门的上部嵌入摄像头,对乘客进行包括形体捕捉和特征提取等一系列操作,利用传感器检测从乘客身上反射回来的光线从而识别并统计乘客上下车方向及人数。这种方法具有很高的识别度,可以识别拥挤人群、正反向人群、滞留与流动人群等不同状态,具有很强的抗干扰性,有效的避免了环境、光线、温度等的影响。此外可以引入红外线激光发射器进行辅助识别,通过装有带通滤波器的车载摄像头捕捉激光线的位置变化来确定乘客人数。
  本系统通过实时分析车载摄像头给出的信息,统计每个站点视频画面中人数,进行实时的数据采集,完成实时的客流统计,从而对车内拥挤度进行准确判断。而精确度的根本在于尽可能地减少摄像头所识别出的人数与实际人数的误差,其度量需要经过目标检测、目标跟踪、乘客行为分析三个步骤。目标检测是计算机视觉处理不可或缺的一环,其焦点置于所选目标的位置并划定范围,基本过程包括了图像数据、预处理、特征提取、分类器训练、目标检测五部分。
  以公交车为例,在前后车门各安装一组摄像头,由于身体躯干等部分在人群密集时会被遮挡,采集不到相应的信息,导致统计出现误差。因此将乘客明显特征如面部、肩部作为目标正样本,进行人脸识别与轮廓匹配,这样会降低颜色、光线、噪声以及阴影的影响。为了增强干扰性,获得真正意义上的边缘前景,对当前帧的边缘图像和背景的边缘图像进行了做差计算。然后利用圆检测进行轮廓识别,相比其他方法更易于操作,识别率高,能够高效的进行检测,为客流统计系统提供了强有力的依据。
  5.2 研究与展望
  该系统用于对公交车各站点人数的预测,进而判断车内拥挤度。此系统可以与app或者小程序结合,给用户提供相应信息。当用户选择公交出行时,输入选择乘车的站点,系统会根据实时数据计算出未来公交车到达本站点时的人数,然后给出公交车内拥挤度,用户可以根据拥挤度选择是否乘坐该公交车。此外,系统还会根据上一时刻的客流数据给出该车辆拥挤度变化趋势,用户可以知道各个路段的拥挤程度,从而选择更加舒适的方式出行。
  6 结论
  本文以bp神经网络建立拥挤度预测模型,并根据实际情况改进相应的算法。以吉林省吉林市56路公交线路的数据为训练样本进行训练,以进行预测检验,结果证明,该模型具有较高的预测精度。
  参考文献
  [1]李荣庆.公交拥挤司乘行为博弈分析及对策[J].对外经贸,2012(04):101-103.
  [2]蒋盛川,孙轶凡,杜豫川.拥挤度对公共交通方式选择意愿的影响[J].同济大学学报(自然科学版),2012,40(12):1831-1835.
  [3]侯现耀. 智能公交信息对城市居民公交出行方式选择的影响研究[D].东南大学,2016.
  [4]刘翠,张艳青,陈洪仁 . 基于 BP 神经网络的公交线路站点时段上下车人数预测模型 [J]. 交通标准化,2008(177):186-189。
  [5]任崇岭,曹成铉,李静,史文雯 . 基于小波神经网络的短时客流量预测研究 [J]. 科学技术与工程,2011,07,11(21):5099-5103.
  [6]范海雁,范炳全,张林峰,等.灰色网络预测方法在公交客流预测中的应用[ J] .上海理工大学 报,2003,25(1):25-28.
  [7]孙爱充.公交客流预测方法研究[ J] .城市交通,1996,(6):32—33.
  (作者单位:吉林大学交通学院)
其他文献
摘要:随着现代企业发展水平的不断提高,计算机信息系统集成已经成为企业发展中重要的组成部分,计算机系统集成在一定程度上代表着企业的现代发展水平。计算机信息系统集成具有复杂性、多学科性等特征,引入项目管理概念,将项目管理在企业计算机信息系统集成中应用可以有效提升计算机信息系统集成的实施效果,确保计算机系统集成项目顺利实施和验收。  关键词:项目管理;计算机信息技术;系统集成  前言  信息系统集成是指
期刊
摘要:随着社会的不断发展,工程建设力度也不断得到加强,市场竞争也日益严峻,为了提升建设工程的市场竞争能力,招投标开始推广和建立。招投标工作是为了工程建设的顺利实施而建设的,能够使社会效益得到加强,这有助于建设工程的发展。随着建设工程中项目招投标的开展和推进,招投标活动相关机制也在不断得到完善,但当前招投标工作中还是会存在一些不足。本文通过论述如何加强招投标管理工作,以及招投标管理工作所存在的问题和
期刊
摘要:文化是国家繁荣兴旺,民族自信的不竭动力源泉。通过文献资料法,在新时代背景下,对中国当代体育文化事业发展的思考与重构。研究认为,对新时代体育文化价值重新审视与界定,去其糟粕、取其精华,构建具有中国特色的社会主义体育文化,强调弘扬中华体育精神,构建中国体育大国文化自信。  关键词:新时代;体育精神;文化自信;体育文化  1体育文化的意蕴  文化是一个国家得以延续发展的内在动力,是社会文明进步的助
期刊
摘要:水资源开发是国家经济建设,促进人民生活水平提高,满足社会发展需求的重点任务。但面对曾经那些因为水资源开发而带来的生态破坏的现实案例,那些血淋淋的教育告诉我们,老路不能再走,必须重视生态保护,才能发挥水运工程建设的意义。文章重点分析水运工程所带来的生态问题,并提出了相应的解决措施。  关键词:水运工程;施工建设;生态环境;影响  中图分类号:TV22 文献标识码:A  引言  水运工程对生态环
期刊
摘要:通过对企业会计成本核算现状的分析可以发现,核算主体单一、核算对象复杂、核算分配随意、人员素质较低是普遍存在的问题,直接导致了企业会计成本核算目标难以达成,企业因而蒙受了巨大的经济损失。考虑到企业会计成本核算的重要价值功能以及新时期赋予其的独特内涵,企业必须要积极融合先进理念和先进技术,实施会计成本核算的改革和创新,确保企业会计成本核算的保质保量开展,从而为企业成本节约和稳定发展提供有力的支持
期刊
摘要:高温作业热防护服是保障高温中人体安全的重要工具。近年来,大量的以高温作业环境为基础的实验测试,无法重复且耗费成本巨大,造成了不必要的资源浪费。因此,建立高温环境下热防护服装的设计模型十分必要。首先,以假人为研究对象,列写出每层热传递的偏微分方程及其初始条件、边界条件,利用MATLAB等软件做出了各层的温度分布图像。发现假人皮肤温度随时间增加而增高,并在时刻t=1645s达到稳态。其次,利用动
期刊
摘要:现场总线是沟通生产过程现场及控制设备之间及其与更高控制管理层之间的联系的工厂数字通信网络基础。该控制系统并不是一种简单的网络管理,而是一种新型的、开放式、全面分布的控制系统,这种系统的应用能够更好地促进设备的运作。现场总线是一种综合技术,其包括控制、计算机、智能传感器、数字通信技术等,这项系统的产生受到了各国企业的广泛关注,从而导致自动化系统结构与设备发生了巨大的变化。本文主要针对现场总线在
期刊
摘要:重金属污染具有潜伏性,对环境及人类的危害巨大。淋洗修复可以去除重金属的总量,对于污染严重的区域,如尾矿堆积处等,淋洗法比一般的修复法更彻底,更快速。本文主要介绍了淋洗剂的种类以及影响淋洗效果的几个因素,以期为以后的工程应用提供理论依据。  关键词:重金属;土壤;淋洗剂;修复  近年来,工业生产在给人类经济带来高速发展的同时,也带来了严重的环境问题。工厂废水乱排,冶炼厂矿渣随意堆放,农药的过量
期刊
摘要:乙烯作为重要的化工原料,一直是国家石化行业的重点发展项目。采用轻质柴油和石脑油进行乙烯裂解生产存在收率低、成本高的特点,而采用轻烃进行乙烯生产则可以有效改进此缺点。本文结合具体炼厂的实际应用,对芳烃尾气回收做乙烯裂解项目的可行性和效益性进行了分析介绍,可看出利用芳烃尾气进行乙烯裂解生产存在较大的优势。  关键词:芳烃尾气;乙烯裂解原料;异构化尾气  1引言  乙烯是一种重要的化工原料,乙烯的
期刊
摘要:众所周知,地铁设施是城市进行物流运输的现代化交通工具,在某一时间段会出现有频率变化的客流密度,通过对地铁车站楼扶梯客流参数进行预测和分析评价,能够归纳出一定的科学化规律,为后续有关地铁人流控制提供一定的数据支持。基于此,本文主要就地铁进出站闸机的AFC数据及楼梯客流参数进行了全面的分析,希望能够进一步提高该系统的数据预测精度,为地铁阶段性拥堵时间段的确立和有效客流状态预判提供有效的决策依据。
期刊