论文部分内容阅读
摘要:目前,旅游预测主要采用基于传统研究方法或神经网络技术的单项预测方法。为提高旅游需求预测的精度,文章提出一种基于BP神经网络和ARIMA混合模型的游客量预测方法。该方法能够同时考虑旅游统计数据的线性和非线性规律。以陕西省接待入境游客人数为例,采用文章提出混合模型对其进行了综合分析与预测,预测结果表明混合预测模型相对于单一的预测方法具有更高的精度,该模型在旅游预测中的应用是可行、有效的。
关键词:旅游需求;混合模型;预测
旅游需求预测在旅游业的发展中具有重要的作用,正确的预测是进行科学决策的依据。目前,常见的需求预测方法有传统预测法和神经网络预测法两大类。传统预测法主要有:时间序列预测法和因果预测法。人工神经网络具有极强的非线性逼近、大规模并行处理、自学习、自组织和容错能力等优点,对解决非线性问题有着独特的先进性。旅游市场很难单纯用一种模型进行预测,混合预测本质上是将各种单项预测看作代表不同信息的片段,通过信息的集成分散单个预测特有的不确定性和减少总体不确定性,从而提高预测精度。
本文提出了一种基于ARIMA和BP神经网络组合模型进行游客量预测的方法。ARIMA模型描述历史数据的线性关系,BP神经网络模拟数据的非线性规律。采用1995~2004年陕西省接待入境游客人数统计数据,建立ARIMA和BP神经网络组合预测模型,并利用该模型对2008~2013年陕西接待入境游客量进行了预测。
一、BP神经网络原理
人工神经元作为一种简单的处理器可以将到来的信号进行加权求和处理,其通用表达式为:y=■wixi+b ①
①式中,x1,x2,…,xn表示输入值;w1,w2,…,wn表示权重;b表示阈值,y表示神经元的输出。BP神经网络,即多层前馈式误差反传神经网络,通常由输入层、输出层和若干隐含层构成,每层由若干个节点组成,每一个节点表示一个神经元,上层节点与下层节点之间通过权连接,层与层之间的节点采用全互连的连接方式,每层内节点之间没有连接,典型的BP神经网络是含有一个隐含层的三层结构网络(如图1)。n个输入信号从输入层进入网络,经激励函数变换后到达隐含层,在经过激励函数的映射变换到输出层构成m个输出信号。
设神经网络有n个输入神经元,m个输出神经元和p个隐层神经元,则神经元的输出为:
输出层神经元的输出为:
激励函数通常采用S型函数,如:
式中Q为调整激励函数形式的sigmoid参数。
二、ARIMA模型原理
自回归积分移动平均方法(ARIMA)把回归分析应用于时间序列,又不同于通常因果分析中的普通最小二乘法。对于有趋势的非平稳时间序列,经差分后消除其趋势,满足平稳条件,再使用B-J方法,即ARIMA模型。
ARIMA时间序列预测的建模过程如下所述:
第一,样本预处理:ARIMA模型要求时间序列是平稳随机过程,建模之前需检验时间序列数据的平稳性。
第二,模式识别:非平稳的时间序列经过差分变换后,ARIMA建模的关键是确定阶次。
第三,模型检验:对所建立的模型适用性进行检验,若模型误差εt是白噪声,则建模获得通过,否则需要重新进行定阶和参数估计。
第四,预测:对平稳化的时间序列进行预测。
三、混合模型
混合预测模型的建立思路为:先使用ARIMA模型预测,这样数据的线性规律由ARIMA模型描述,非线性规律包含在了预测误差中,然后用BP神经网络预测ARIMA模型的误差,预测非线性规律。最后用ARIMA的预测结果与BP神经网络的预测结果相加得到混合预测模型的预测值。这样可以同时考虑接待游客量历史数据中的线性趋势和非线性趋势,比单纯使用BP神经网络和ARIMA模型的精度高。
四、游客量预测的ARIMA模型建立过程
(一)接待游客量历史数据的平稳化
图2为陕西省1995~2004年接待入境旅游人次数据的时间序列趋势图和差分处理后的转换图。
图2中(a)为未经变量转换图,由图可知接待游客人数总的趋势是逐渐增加,但在2003年由于非典的原因,数据下降趋势剧烈,因此2003年属于非正常年份,用2002与2004年接待人数的平均值代替2003年数据,剔除非正常年份值的时间序列如图(b)所示。由图(b)可以看出序列的增长幅度不同,这说明该时间序列即存在上升趋势又存在方差不齐。因此,需要对其进行平稳化处理。图(c)、(d)为进行了一次差分和取自然对数后一次差分的转换图,由图(d)可以看出,原变量经过自然对数一次差分后已经基本平稳化,所以设定ARIMA模型参数d=1。
(二)ARIMA模型p和q的确定
利用ACF和PACF图对参数进行预判断(见图3),ACF图和PACF图数据都处于置信区间内。ARIMA模型p和q确定思路为:设定不同的p、q值,通过比较AIC(Akaike信息准则拟合优度)、SBC(Schwarz贝叶斯准则拟合优度),取SBC较小的模型。
从表1的模型指标对比可以看出,模型ARIMA(2,1,2)比较合适预测入境游人数时间序列。
(三)入境旅游人次ARIMA(2,1,2)预测模型的应用
利用ARIMA(2,1,2)模型对陕西入境旅游人次数据进行拟合。预测结果及误差见表2。
(四)BP神经网络预测ARIMA误差过程
由于ARIMA模型预测的误差只有1996~2004年,故BP人工神经网络的总样本量N=9。以1996~1999年、1997~2000年、…、2000~2003年ARIMA预测误差数据分组作为网络输入,2000、2001、…、2004年数据作为理想输出,组成样本数据对网络进行训练。计算前,先将数据归一化到[0.0620,0.7997]。
网络结构采用4-10-1的L-M算法BP神经网络,计算得到该网络的权重和阈值如下:
W1=Wi= wT2=0.02102.0015-0.8524-1.4150-1.8743-0.5396-1.7241-0.25141.29761.4484b1=8.4179-0.4008-6.6974-0.45950.56781.0919-2.54040.7586-1.22460.2890
b2=[-0.7113]
设定L-M算法BP神经网络的训练误差要求为10-7,经过9次训练,预测结果见表2。
根据表2可以看出,基于ARIMA和BP神经网络的组合预测模型预测值与实际值的偏差比较小。另外单纯用ARIMA模型预测偏差较大,其绝对最大偏差为2004年的-8.7711万人次,最小绝对偏差为2001年的3.0418万人次。
从表2中可以看出近几年陕西省入境游客人次将逐年增加,在2009年以后增长的速度放缓,平均年增长率为4.4%。2013年陕西省接待入境游客的规模将达到169.3万人次,是目前接待人数的两倍左右。
五、结论
用ARIMA模型预测陕西省入境游人数的线性规律,用BP神经网络预测入境游人数的非线性规律,形成组合预测模型,该模型同时包含线性和非线性规律,比单纯使用一种模型进行游客量预测的精度高,预测数据更合理、可靠。在2009年以后陕西省入境游客人次增长的速度放缓,平均年增长率为4.4%。表明近几年陕西省入境游客将持续稳定增长。由于旅游活动的影响因素众多,对旅游活动的预测往往很难做到绝对的准确,预测结果仍需等待实践的检验。
参考文献:
1、王磐岩,王玉洁.旅游规划中的旅游经济分析与预测问题[J].旅游学刊,2000(4).
2、武娇,刘新平.我国国际旅游外汇收入的时间序列预测模型[J].纺织高校基础科学学报,2001(1).
3、陈俊,陈兆雄,幸林.基于BP神经网络的云南国际旅游需求预测[J].昆明师范高等专科学校学报,2005(4).
(作者单位:吕扬,江西财经职业学院基础部,作者为中南财经政法大学在职硕士研究生;闫来英,九江学院旅游学院,作者为陕西师范大学旅游与环境学院在读硕士;雷可为,西安欧亚学院外国语学院旅游系,作者为陕西师范大学旅游与环境学院硕士)
注:“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。”
关键词:旅游需求;混合模型;预测
旅游需求预测在旅游业的发展中具有重要的作用,正确的预测是进行科学决策的依据。目前,常见的需求预测方法有传统预测法和神经网络预测法两大类。传统预测法主要有:时间序列预测法和因果预测法。人工神经网络具有极强的非线性逼近、大规模并行处理、自学习、自组织和容错能力等优点,对解决非线性问题有着独特的先进性。旅游市场很难单纯用一种模型进行预测,混合预测本质上是将各种单项预测看作代表不同信息的片段,通过信息的集成分散单个预测特有的不确定性和减少总体不确定性,从而提高预测精度。
本文提出了一种基于ARIMA和BP神经网络组合模型进行游客量预测的方法。ARIMA模型描述历史数据的线性关系,BP神经网络模拟数据的非线性规律。采用1995~2004年陕西省接待入境游客人数统计数据,建立ARIMA和BP神经网络组合预测模型,并利用该模型对2008~2013年陕西接待入境游客量进行了预测。
一、BP神经网络原理
人工神经元作为一种简单的处理器可以将到来的信号进行加权求和处理,其通用表达式为:y=■wixi+b ①
①式中,x1,x2,…,xn表示输入值;w1,w2,…,wn表示权重;b表示阈值,y表示神经元的输出。BP神经网络,即多层前馈式误差反传神经网络,通常由输入层、输出层和若干隐含层构成,每层由若干个节点组成,每一个节点表示一个神经元,上层节点与下层节点之间通过权连接,层与层之间的节点采用全互连的连接方式,每层内节点之间没有连接,典型的BP神经网络是含有一个隐含层的三层结构网络(如图1)。n个输入信号从输入层进入网络,经激励函数变换后到达隐含层,在经过激励函数的映射变换到输出层构成m个输出信号。
设神经网络有n个输入神经元,m个输出神经元和p个隐层神经元,则神经元的输出为:
输出层神经元的输出为:
激励函数通常采用S型函数,如:
式中Q为调整激励函数形式的sigmoid参数。
二、ARIMA模型原理
自回归积分移动平均方法(ARIMA)把回归分析应用于时间序列,又不同于通常因果分析中的普通最小二乘法。对于有趋势的非平稳时间序列,经差分后消除其趋势,满足平稳条件,再使用B-J方法,即ARIMA模型。
ARIMA时间序列预测的建模过程如下所述:
第一,样本预处理:ARIMA模型要求时间序列是平稳随机过程,建模之前需检验时间序列数据的平稳性。
第二,模式识别:非平稳的时间序列经过差分变换后,ARIMA建模的关键是确定阶次。
第三,模型检验:对所建立的模型适用性进行检验,若模型误差εt是白噪声,则建模获得通过,否则需要重新进行定阶和参数估计。
第四,预测:对平稳化的时间序列进行预测。
三、混合模型
混合预测模型的建立思路为:先使用ARIMA模型预测,这样数据的线性规律由ARIMA模型描述,非线性规律包含在了预测误差中,然后用BP神经网络预测ARIMA模型的误差,预测非线性规律。最后用ARIMA的预测结果与BP神经网络的预测结果相加得到混合预测模型的预测值。这样可以同时考虑接待游客量历史数据中的线性趋势和非线性趋势,比单纯使用BP神经网络和ARIMA模型的精度高。
四、游客量预测的ARIMA模型建立过程
(一)接待游客量历史数据的平稳化
图2为陕西省1995~2004年接待入境旅游人次数据的时间序列趋势图和差分处理后的转换图。
图2中(a)为未经变量转换图,由图可知接待游客人数总的趋势是逐渐增加,但在2003年由于非典的原因,数据下降趋势剧烈,因此2003年属于非正常年份,用2002与2004年接待人数的平均值代替2003年数据,剔除非正常年份值的时间序列如图(b)所示。由图(b)可以看出序列的增长幅度不同,这说明该时间序列即存在上升趋势又存在方差不齐。因此,需要对其进行平稳化处理。图(c)、(d)为进行了一次差分和取自然对数后一次差分的转换图,由图(d)可以看出,原变量经过自然对数一次差分后已经基本平稳化,所以设定ARIMA模型参数d=1。
(二)ARIMA模型p和q的确定
利用ACF和PACF图对参数进行预判断(见图3),ACF图和PACF图数据都处于置信区间内。ARIMA模型p和q确定思路为:设定不同的p、q值,通过比较AIC(Akaike信息准则拟合优度)、SBC(Schwarz贝叶斯准则拟合优度),取SBC较小的模型。
从表1的模型指标对比可以看出,模型ARIMA(2,1,2)比较合适预测入境游人数时间序列。
(三)入境旅游人次ARIMA(2,1,2)预测模型的应用
利用ARIMA(2,1,2)模型对陕西入境旅游人次数据进行拟合。预测结果及误差见表2。
(四)BP神经网络预测ARIMA误差过程
由于ARIMA模型预测的误差只有1996~2004年,故BP人工神经网络的总样本量N=9。以1996~1999年、1997~2000年、…、2000~2003年ARIMA预测误差数据分组作为网络输入,2000、2001、…、2004年数据作为理想输出,组成样本数据对网络进行训练。计算前,先将数据归一化到[0.0620,0.7997]。
网络结构采用4-10-1的L-M算法BP神经网络,计算得到该网络的权重和阈值如下:
W1=Wi= wT2=0.02102.0015-0.8524-1.4150-1.8743-0.5396-1.7241-0.25141.29761.4484b1=8.4179-0.4008-6.6974-0.45950.56781.0919-2.54040.7586-1.22460.2890
b2=[-0.7113]
设定L-M算法BP神经网络的训练误差要求为10-7,经过9次训练,预测结果见表2。
根据表2可以看出,基于ARIMA和BP神经网络的组合预测模型预测值与实际值的偏差比较小。另外单纯用ARIMA模型预测偏差较大,其绝对最大偏差为2004年的-8.7711万人次,最小绝对偏差为2001年的3.0418万人次。
从表2中可以看出近几年陕西省入境游客人次将逐年增加,在2009年以后增长的速度放缓,平均年增长率为4.4%。2013年陕西省接待入境游客的规模将达到169.3万人次,是目前接待人数的两倍左右。
五、结论
用ARIMA模型预测陕西省入境游人数的线性规律,用BP神经网络预测入境游人数的非线性规律,形成组合预测模型,该模型同时包含线性和非线性规律,比单纯使用一种模型进行游客量预测的精度高,预测数据更合理、可靠。在2009年以后陕西省入境游客人次增长的速度放缓,平均年增长率为4.4%。表明近几年陕西省入境游客将持续稳定增长。由于旅游活动的影响因素众多,对旅游活动的预测往往很难做到绝对的准确,预测结果仍需等待实践的检验。
参考文献:
1、王磐岩,王玉洁.旅游规划中的旅游经济分析与预测问题[J].旅游学刊,2000(4).
2、武娇,刘新平.我国国际旅游外汇收入的时间序列预测模型[J].纺织高校基础科学学报,2001(1).
3、陈俊,陈兆雄,幸林.基于BP神经网络的云南国际旅游需求预测[J].昆明师范高等专科学校学报,2005(4).
(作者单位:吕扬,江西财经职业学院基础部,作者为中南财经政法大学在职硕士研究生;闫来英,九江学院旅游学院,作者为陕西师范大学旅游与环境学院在读硕士;雷可为,西安欧亚学院外国语学院旅游系,作者为陕西师范大学旅游与环境学院硕士)
注:“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。”