论文部分内容阅读
摘 要:本文主要基于BP算法对共享单车进行需求预测,希望能够为当前共享单车的需求现状提供了参考依据。
关键词:共享单车;BP算法;需求预测
当前我国经济飞速发展,城市居民交通问题也变得愈发复杂。随着共享单车的普及,各种各样的问题也随着出现,常见的就有交通事故频发、乱停乱放、监管困难等等,这一方面对城市交通和公众素质出了考验,另一方面也是对相关企业的管理方法进行了检查。本文正是以当前共享单车的需求预测出发,以BP算法技术为基础,进而构建起完整的预测模型,为当前共享单车的需求现状提供了参考依据。
一、实验设计
1.算法选择
共享单车的需求在各个时间段呈现不同的状态,所以在进行相关算法的选择时要注意对预测方法选择,常用的预测方法包括德尔菲法、神经网络、时间序列发、机器学习、回归分析法、弹性系数法和灰色预测法等等,在对各种方法进行分析和讨论之后,最终决定使用神经网络中的BP算法来构建相关的模型。
2.样本来源
本次数据来源基于某共享单车企业的内部数据,某汽车企业在每量车的的使用人数为1.274人,选取样本的时间为2019年8月25日,当天某共享单车企业的整体数据样本为1000条。本实验将这些参数统共划分为记录编号(id)、1天内某企业共享单车的整体需求量(y)、某共享单车企业投放业务的城市(city)、时间变量(hour)、节假日(is 0 workday)、工作日(is 1 workday)、所在城市当日温度(temp)、所在城市当天天气(weather)8个特征变量。
3.模型构建
基于上述8个特征变量,本次试验BP神经网络结构预测模型的构建步骤如下所示:首先在构建模型之间需要对BP神经网络结构预测模型的拓扑结构进行分析和设置,BP神经网络结构预测模型的结构特点为其输入层、隐层和输出层三层都可以完成由n维到m维的映射,进而可以将节假日(is 0 workday)、工作日(is 1 workday)、所在城市当日温度(temp)、所在城市当天天气(weather)、时间变量(hour)作为本次预测模型的特征变量,将1天内某企业共享单车的整体需求量(y)作为本次实验预测模型的目标变量;其次是对隐含层内的神经元数量和最大迭代次数进行设置,根据本次共享单车預测模型的需求,本实验将最大迭代次数设置为300,将隐层神经元的数量设置为150,在对数值的计算方面选择了相关大规模数值计算表现较好的L-BFGS算法进行计算;最后根据相关拓扑结构代入参数,其中Xn代表相应的特征变量,Y代表1天内某企业共享单车的整体需求量,Wn则代表了相关的阈值。
二、实验结果
1.模型预测
激活函数负责将神经元的输入映射到输出端,常用的激活函数有Tanh函数、Logistic函数、Relu函数、Identiey函数。本研究分别采用这四种激活函数,依次对模型进行评估,从而找到最适合的预测模型。模型评估采用以下四种方法,分别为:RMSE均方根误差、MSE均方误差、MAE平均绝对误差、R2模型拟合度。RMSE均方根误差法计算的是观测值与其真实值,或者观测值与其模拟值之间的偏差。MSE均方误差法是指参数估计值与参数真值之差平方的期望值。MSE可以评价数据的变化情况,MSE的值越小,说明预测模型描述实验数据具有更好的精确度。MAE平均绝对误差是绝对误差的平均值,平均绝对误差能更好地反应预测值误差的实际情况。R2是用来说明回归直线对观测值的拟合程度,R2最大值为1,R2的值越接近1,说明回归直线对观测值的拟合程度越好;反之,R2的值越小,说明回归直线对观测值的拟合程度越差。
2.预测结果
在采用了四种激活函数的情况下。检测评价数据结果表明在激活函数为Tanh情况下,拟合优度R2的值最大,其值为0.819;MSE的值最小,其值为188.508;RMSE值最小,其值13.014;MAE的值最小,其值为9.804。从检验测试数据的结果来看,依旧在激活函数为Tanh的情况下,拟合优度R2的值最大,其值为0.775;MSE的值最小,其值为308.650;RMSE值最小,其值16.771;MAE的值最小,其值为10.574。因此,BP神经网络的激活函数为Tanh函数基于已经找到的共享单车预测模型,选择城市1的数据集,以is_workday、weather、temp、wind、hour、为特征变量,id作为编号,过滤掉其他的无关变量,预测未来一段时间(不同时间点)共享单车的需求量情况。
三、总结
研究表明,在城市温度较适宜、天气状况较好的情况下,城市居民对于共享单车的需求有所增高,节假日的需求也要大于工作日的需求,可以说共享单车已经成为城市居民日常工作生活的重要代步工具之一。
参考文献:
[1]陈毅.基于优化BP神经网络的股票趋势预测研究[J].科技资讯,2020,18(15):198-200.
[2]罗山.神经网络在交通图像压缩中的应用[J].山西电子技术,2019(06):31-33.
关键词:共享单车;BP算法;需求预测
当前我国经济飞速发展,城市居民交通问题也变得愈发复杂。随着共享单车的普及,各种各样的问题也随着出现,常见的就有交通事故频发、乱停乱放、监管困难等等,这一方面对城市交通和公众素质出了考验,另一方面也是对相关企业的管理方法进行了检查。本文正是以当前共享单车的需求预测出发,以BP算法技术为基础,进而构建起完整的预测模型,为当前共享单车的需求现状提供了参考依据。
一、实验设计
1.算法选择
共享单车的需求在各个时间段呈现不同的状态,所以在进行相关算法的选择时要注意对预测方法选择,常用的预测方法包括德尔菲法、神经网络、时间序列发、机器学习、回归分析法、弹性系数法和灰色预测法等等,在对各种方法进行分析和讨论之后,最终决定使用神经网络中的BP算法来构建相关的模型。
2.样本来源
本次数据来源基于某共享单车企业的内部数据,某汽车企业在每量车的的使用人数为1.274人,选取样本的时间为2019年8月25日,当天某共享单车企业的整体数据样本为1000条。本实验将这些参数统共划分为记录编号(id)、1天内某企业共享单车的整体需求量(y)、某共享单车企业投放业务的城市(city)、时间变量(hour)、节假日(is 0 workday)、工作日(is 1 workday)、所在城市当日温度(temp)、所在城市当天天气(weather)8个特征变量。
3.模型构建
基于上述8个特征变量,本次试验BP神经网络结构预测模型的构建步骤如下所示:首先在构建模型之间需要对BP神经网络结构预测模型的拓扑结构进行分析和设置,BP神经网络结构预测模型的结构特点为其输入层、隐层和输出层三层都可以完成由n维到m维的映射,进而可以将节假日(is 0 workday)、工作日(is 1 workday)、所在城市当日温度(temp)、所在城市当天天气(weather)、时间变量(hour)作为本次预测模型的特征变量,将1天内某企业共享单车的整体需求量(y)作为本次实验预测模型的目标变量;其次是对隐含层内的神经元数量和最大迭代次数进行设置,根据本次共享单车預测模型的需求,本实验将最大迭代次数设置为300,将隐层神经元的数量设置为150,在对数值的计算方面选择了相关大规模数值计算表现较好的L-BFGS算法进行计算;最后根据相关拓扑结构代入参数,其中Xn代表相应的特征变量,Y代表1天内某企业共享单车的整体需求量,Wn则代表了相关的阈值。
二、实验结果
1.模型预测
激活函数负责将神经元的输入映射到输出端,常用的激活函数有Tanh函数、Logistic函数、Relu函数、Identiey函数。本研究分别采用这四种激活函数,依次对模型进行评估,从而找到最适合的预测模型。模型评估采用以下四种方法,分别为:RMSE均方根误差、MSE均方误差、MAE平均绝对误差、R2模型拟合度。RMSE均方根误差法计算的是观测值与其真实值,或者观测值与其模拟值之间的偏差。MSE均方误差法是指参数估计值与参数真值之差平方的期望值。MSE可以评价数据的变化情况,MSE的值越小,说明预测模型描述实验数据具有更好的精确度。MAE平均绝对误差是绝对误差的平均值,平均绝对误差能更好地反应预测值误差的实际情况。R2是用来说明回归直线对观测值的拟合程度,R2最大值为1,R2的值越接近1,说明回归直线对观测值的拟合程度越好;反之,R2的值越小,说明回归直线对观测值的拟合程度越差。
2.预测结果
在采用了四种激活函数的情况下。检测评价数据结果表明在激活函数为Tanh情况下,拟合优度R2的值最大,其值为0.819;MSE的值最小,其值为188.508;RMSE值最小,其值13.014;MAE的值最小,其值为9.804。从检验测试数据的结果来看,依旧在激活函数为Tanh的情况下,拟合优度R2的值最大,其值为0.775;MSE的值最小,其值为308.650;RMSE值最小,其值16.771;MAE的值最小,其值为10.574。因此,BP神经网络的激活函数为Tanh函数基于已经找到的共享单车预测模型,选择城市1的数据集,以is_workday、weather、temp、wind、hour、为特征变量,id作为编号,过滤掉其他的无关变量,预测未来一段时间(不同时间点)共享单车的需求量情况。
三、总结
研究表明,在城市温度较适宜、天气状况较好的情况下,城市居民对于共享单车的需求有所增高,节假日的需求也要大于工作日的需求,可以说共享单车已经成为城市居民日常工作生活的重要代步工具之一。
参考文献:
[1]陈毅.基于优化BP神经网络的股票趋势预测研究[J].科技资讯,2020,18(15):198-200.
[2]罗山.神经网络在交通图像压缩中的应用[J].山西电子技术,2019(06):31-33.