基于关键词网络搜索指数的城市游客量预测研究

来源 :兰州大学 | 被引量 : 0次 | 上传用户:beibeigou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
旅游产业是有着“无烟工业”之称的第三产业。旅游业属信息密集型产业,信息是其生存和运转的依托。但长期以来,旅游相关信息存在不对称性和复杂化等问题,各地旅游资源并没有得到充分开发。当今互联网飞速崛起,搜索引擎上汇聚了海量具有更高时效性的旅游搜索信息,结合网络搜索数据预测游客量是对传统游客量预测方法的改进。本文基于此,以热门旅游城市广州市为例,引入相关关键词的百度指数,尝试构建AL-S-AFSA-LSSVR组合模型,以期对城市月度游客量实现较高精度的预测。首先,通过技术取词法等方法构建网络搜索关键词初始词库,进而通过文本挖掘等方法拓展词库,最终收集到387个关键词。筛选掉未被百度指数收录的以及数据量过低的关键词,研究所用关键词库包含184个关键词,在百度指数中爬取各关键词的日搜索指数转化成月指数;其次,通过时差相关分析法,筛选出l(29)0且对应_lr?0.65的关键词共14个,利用自适应Lasso方法进一步筛选14个关键词,最后剩余6个变量;然后,由于旅游人数的季节性较强,本文同时引入2个季节相关变量,同游客量序列、6个关键词一起构造好变量集;最后,建立AFSA-LSSVR模型,将117组数据中前97组划分为训练集,后20组用来测试,利用训练好的模型预测测试集数据。结果显示预测结果具有较高精度,该模型MAE为12.64,MAPE为2.70%,NSE为0.9646,均比较理想。为了评价模型的预测精度,本文尝试改变模型各成分构造不同类型组合模型,在相同数据集上做预测,选取RSR、MAPE、RMSPE、NSE、MAE五个指标对各模型进行评价。最后通过对比发现,在该指标体系下,本文所构建的AL-S-AFSA-LSSVR组合模型预测效果最佳。最后进行了DM检验,发现在显著性水平?=0.05下,该模型预测精度确实优于大部分模型。因此,该模型有望用于实际工作中,为城市旅游的规划、管理及科学发展提供参考。
其他文献
2010年12月至2011年11月,对大亚湾海域的浮游植物群落结构及环境因子进行了周年调查;建立了赤潮藻类PCR-DGGE监测方法,并采用PCR-DGGE技术对大亚湾海域浮游植物DNA指纹和遗传多
介绍了谷物烘干机温度巡检单元的系统工作过程、性能、硬件构成、工作原理及系统软件.该文通过对谷物干燥机内谷物温度信号的巡回检测,根据系统硬件及现场实际需要,并根据温
根据连续函数的性质 ,对两个重要极限的应用作了进一步探讨 ,并给出其规律性 .对于处理“00 ”,“ 1∞”未定型的极限起到了重要的作用 .尤其对数列求极限 ,罗必塔法则失效 ,
新形势下努力构建社会主义和谐社会,亟需大力加强社会主义和谐文化建设。建设社会主义和谐文化是2006年以来国内学术理论界研究的重点和热点问题之一,主要围绕和谐文化的概念界