论文部分内容阅读
旅游产业是有着“无烟工业”之称的第三产业。旅游业属信息密集型产业,信息是其生存和运转的依托。但长期以来,旅游相关信息存在不对称性和复杂化等问题,各地旅游资源并没有得到充分开发。当今互联网飞速崛起,搜索引擎上汇聚了海量具有更高时效性的旅游搜索信息,结合网络搜索数据预测游客量是对传统游客量预测方法的改进。本文基于此,以热门旅游城市广州市为例,引入相关关键词的百度指数,尝试构建AL-S-AFSA-LSSVR组合模型,以期对城市月度游客量实现较高精度的预测。首先,通过技术取词法等方法构建网络搜索关键词初始词库,进而通过文本挖掘等方法拓展词库,最终收集到387个关键词。筛选掉未被百度指数收录的以及数据量过低的关键词,研究所用关键词库包含184个关键词,在百度指数中爬取各关键词的日搜索指数转化成月指数;其次,通过时差相关分析法,筛选出l(29)0且对应_lr?0.65的关键词共14个,利用自适应Lasso方法进一步筛选14个关键词,最后剩余6个变量;然后,由于旅游人数的季节性较强,本文同时引入2个季节相关变量,同游客量序列、6个关键词一起构造好变量集;最后,建立AFSA-LSSVR模型,将117组数据中前97组划分为训练集,后20组用来测试,利用训练好的模型预测测试集数据。结果显示预测结果具有较高精度,该模型MAE为12.64,MAPE为2.70%,NSE为0.9646,均比较理想。为了评价模型的预测精度,本文尝试改变模型各成分构造不同类型组合模型,在相同数据集上做预测,选取RSR、MAPE、RMSPE、NSE、MAE五个指标对各模型进行评价。最后通过对比发现,在该指标体系下,本文所构建的AL-S-AFSA-LSSVR组合模型预测效果最佳。最后进行了DM检验,发现在显著性水平?=0.05下,该模型预测精度确实优于大部分模型。因此,该模型有望用于实际工作中,为城市旅游的规划、管理及科学发展提供参考。