论文部分内容阅读
【摘要】本文运用OLS、主成分分析法和GWR,对苏州地域范围内酒店价格的空间异质性及其影响因素进行了探讨。研究发现:①酒店价格主要受周边配套设施、酒店自身条件、周边环境、长途交通条件和周边医疗条件的显著影响,其中周边配套设施、酒店自身条件、长途交通条件和周边医疗条件的影响程度在空间上存在异质性②酒店自身条件、长途交通条件对酒店价格的正向影响最大,周边医疗条件对酒店价格的负向影响最大。最后对全文做出了总结和探讨。
【关键词】酒店价格;GWR;空间异质性
价格竞争一直以来都是酒店之间的一种重要竞争方式。而对于旅游者来说,酒店作为旅游六要素之一,其价格始终备受旅游者关注。关于酒店价格的近期研究中,国内外的研究热点都比较集中于酒店客房的定价策略和方法、酒店价格对于顾客满意度的影响、影响酒店价格的因素等方面[1-3]。地理加权回归(GWR)模型由英国Newcastle大学的Brunsdon等[4]提出,是一种能有效揭示被观测者空间非平稳性的方法,其在与地理位置有关的学科中具有重要的应用价值。除了Brunsdon之外,近年来还有其它学者[5]也将研究结果与OLS方法进行比较,都证实了地理加权回归模型较优。虽然很早之前就有国内学者对酒店价格时空分异进行研究[6,7],但是运用GWR模型进行研究的非常少。本文采用GWR模型对苏州的酒店价格空间异质性进行研究,以促进酒店价格的科学化制定。
1、研究方法与变量选取
1.1模型与方法
经典的线性回归模型通常是由随机误差项εi和一套参数β0和βi组成,可以写成:
传统的回归模型是建立在最小二乘法基础上对参数进行估计,OLS则在定义了全局因变量yi和自变量x关系后,i通过最小误差平方和来得出方程参数的估计值[8]。虽然其对于空间平稳性数据的回归有较好的估计,但是对于空间非平稳性数据的回归估计却不太理想。因此这时候就需要引入GWR模型,其允许一些不平稳的数据直接被模拟。地理加权回归方法对传统回归模型进行了拓展,使得参数能够进行局部估计,其模型为:
式中:ui、vi是第i个样本点的地理坐标;βi是随着地理位置的变化而变化,每一个局部的βi都是用来估计它相邻的空间观测值。
1.2数据来源
本文苏州酒店房价数据来源于携程网,共获取了7月25日到7月31日共七天的苏州整个地域范围内的酒店信息,最后选取出3957家连续七天均获取到客房最低价数据的酒店,将其七天的价格平均值作为原始数据。同时从携程网获取了每家酒店至7月31日为止的评分、评价数和酒店设施情况。评分为空的酒店其评分以同价格段所有酒店的平均值为准(例如价格为158元的酒店评分为空,则以价格为101-200元所有酒店的评分平均值作为其评分)。同时对酒店所提供的设施和服务进行统计,每提供一样设施或服务其数量就加一。
苏州地区内的POI点数据均从百度地图获取,其中包括餐饮POI点88993个,地铁站POI点129个,公交车站POI点9557个,购物POI点13457个,商务POI点2486个,休闲服务POI点894个,普通景点(除A级景点以外的其它景点)POI点2515个,3A级景点POI点11个,4A级景点POI点19个,5A级景点POI点8个,综合医院POI点140个,银行(包括ATM机服务点)POI点5232个,车站(包括汽车站和火车站)POI点131个,高等院校POI点86个,共计14类POI点数据。由于百度地图API一个矩形范围内只能返回最多400个POI点的数据,所以将苏州市范围切成80*80个切片对每一类POI点进行爬取。结果显示没有一个切片的数据量达到400,因此获取的数据相对来说较为全面,基本没有遗漏。最后将所有酒店和POI点数据导入ARCGIS10.5中计算酒店周边1000米范围内各类POI点的数量。
1.3变量选取
由于不能将哑元数据导入GWR模型,经过统计发现酒店周边3A、4A和5A景区数量的数据为哑元数据,为了不影响模型最终结果,所以决定采用赋值法对这三个变量进行合并(一个3A级景点赋3分,4A级景点赋4分,5A级景点赋5分)。最终选取的所有自变量共16个,分别为:酒店评分、酒店评价数、酒店设施数、酒店类型、餐饮(“周边餐饮数”的简称,下同)、地铁、公交、购物、商务、休闲服务、普通景点、A级景点、医院、银行、车站、高校。
2、结果分析
2.1 OLS结果分析
注:***为0.001显著性水平;**为0.01显著性水平;*为0.05显著性水平,下同。
本文中OLS模型回归分析通过ARCGIS10.5中的普通最小二乘法工具实现,输出的结果如表1所示。由于回归结果中Koenker统计量的概率为0.000000(p<0.01),具有统计学上的显著性,即说明数据可能存在空间非稳定性,因此使用稳健概率列(Robust_Pr)来确定系数显著性。从表中可以看出自变量餐饮、购物、商务、休闲和银行的VIF值均大于5.0,说明模型的自变量之间存在较为严重的全局或局部多重共线性。
2.2主成分分析
由于自变量之间存在多重共线性,但是这些变量的显著性水平又较高,为了在消除自变量之间多重共线性的同时不遗漏重要的自变量,所以决定采用主成分分析方法。
将数据导入SPSS25.0软件中,选择因子分析中的主成分分析方法进行提取。得到的KMO和巴特利特检验结果KMO結果为0.838,且巴特利特球形度检验的显著性为0.000(p<0.01),说明现有变量适合进行因子分析。
得到的成分矩阵如表2所示。经过主成分分析,原有的16个自变量被降维成了5个新的主成分。根据表中各列的因子载荷可以看出,主成分1主要由餐饮、地铁、公交、购物、商务、休闲、普通景点和银行共8个变量构成,因此可以将其命名为“周边综合生活配套设施”(简称PT);主成分2主要由酒店评分、酒店评价数、酒店设施数和酒店类型共4个变量构成,因此可以将去命名为“酒店自身条件”(ZS);主成分3主要由A级景点这一变量构成,因此可以将其命名为“酒店周边环境”(HJ);主成分4主要由车站这一变量构成,因此可以将其命名为“长途交通条件”(JT);主成分5主要由医院数量这一变量构成,同时高校占的比重也较高,因此可以将其命名为“周边医疗条件”(YL)。 通过SPSS25.0将原有的16个自变量全部标准化,依照表2从上到下的顺序设经过Z标准化后的变量为X1,X2,…,X16。同时用每一列的因子载荷分别除以其相应的特征值的平方根(分别为5.927、1.853、1.408、1.185、1.017),得到的各主成分的表达式。
表2 成分矩阵
2.3 GWR结果分析
将上述所得5个新的变量导入GWR4.0软件中进行运算,得到的回归结果如表3所示,以及GWR模型的估计系数如表4所示。
从表3中可以看出,PT、ZS、JT和YL都是显著的,只有HJ是不显著的。结果说明PT、ZS、JT和YL都具有明显的空间不平稳性,其系数会随着空间位置的变化而发生显著变化;而HJ则不具有明显的空间不平稳性,随着空间位置的变化其系数并不会发生显著的变化。
表3 回归结果
从表3中可以看出,ZS、HJ和JT的系数平均值均为正数,其對酒店价格的影响多为正向影响,其中酒店自身条件平均来说对酒店价格的影响最大为58.89,其次为长途交通条件对酒店价格的影响为56.77,最后为酒店周边环境对酒店价格的影响为10.83,即酒店自身条件越好、长途交通条件越便捷,一般来说酒店的价格就越高;而酒店周边环境越好一般其周边同质化竞争也较为激烈,因此对酒店价格的影响程度不高。而PT和YL的系数平均值均为负数,其对酒店价格的影响则多为负向影响,其中医疗条件越好的区域其周边一般多为廉价快捷酒店方便病人家属入住,其价格普遍较低。
3、结论与不足
本文基于GWR模型,对苏州地域范围内酒店价格的空间异质性及其影响因素进行了探讨。研究发现:①酒店价格主要受周边配套设施、酒店自身条件、周边环境、长途交通条件和周边医疗条件的显著影响,其中周边配套设施、酒店自身条件、长途交通条件和周边医疗条件的影响程度在空间上存在异质性②酒店自身条件、长途交通条件对酒店价格的正向影响最大,周边医疗条件对酒店价格的负向影响最大。
酒店价格的形成是多种因素在一定区域范围内共同作用的结果,除了本文中提到的影响因素之外,一定还有其它重要因素会对酒店价格产生影响。酒店的地价、房租和建设成本是否会对酒店价格产生影响,这些都是酒店经营者自己私下的交易行为我们暂时不得而知。我们曾尝试将区域范围内的平均地价作为自变量代入模型中,但考虑到现实中酒店建设的复杂情况,总觉得有失偏颇,因此将其舍弃。每一个酒店经营者对于所经营酒店的价格期望和其所选择的定价策略到底是怎样的,会对酒店价格产生怎样的影响这一点也有待进一步研究。政府的税收制度、相关政策又会对酒店价格产生怎样的影响也有待进一步探讨。
参考文献:
[1]文蓉.需求导向定价法在酒店价格形成机制中的应用[J].价格月刊,2014(03):33-35.
[2]周李,张清源,朱其静,陆林.广交会对星级酒店房价影响的时空分异研究——以第117和118届广交会为例[J].地理科学,2017,37(09):1363-1373.
[3]Sameer Mathur, Prem Prakash Dewani. Influence of cultural heritage on hotel prices,occupancy and profit:Theory and evidence[J]. Tourism Economics, 2016 ,22(5): 1014-1032.
[4]Brunsdon C, Fotheringham A S, Charlton M. Some notes on parametric significance tests for geographically weighted regression[J]. Journal of Regional Science, 1999, 39(3): 497-524.
[5]吴玉鸣.中国省域旅游业弹性系数的空间异质性估计——基于地理加权回归模型的实证[J].旅游学刊,2013,28(2):35-43.
[6]熊伟,吴必虎.大型展会对高星级酒店房价影响的空间分析——以第100届广交会为例[J].旅游学刊,2008,23(2): 80-86.
[7]汤庆园,徐伟,艾福利.基于地理加权回归的上海市房价空间分异及其影响因子研究[J].经济地理201232(2)52-58.
作者简介:
张义杰(1995-)男,汉族,江苏淮安人,硕士研究生,旅游地理。
【关键词】酒店价格;GWR;空间异质性
价格竞争一直以来都是酒店之间的一种重要竞争方式。而对于旅游者来说,酒店作为旅游六要素之一,其价格始终备受旅游者关注。关于酒店价格的近期研究中,国内外的研究热点都比较集中于酒店客房的定价策略和方法、酒店价格对于顾客满意度的影响、影响酒店价格的因素等方面[1-3]。地理加权回归(GWR)模型由英国Newcastle大学的Brunsdon等[4]提出,是一种能有效揭示被观测者空间非平稳性的方法,其在与地理位置有关的学科中具有重要的应用价值。除了Brunsdon之外,近年来还有其它学者[5]也将研究结果与OLS方法进行比较,都证实了地理加权回归模型较优。虽然很早之前就有国内学者对酒店价格时空分异进行研究[6,7],但是运用GWR模型进行研究的非常少。本文采用GWR模型对苏州的酒店价格空间异质性进行研究,以促进酒店价格的科学化制定。
1、研究方法与变量选取
1.1模型与方法
经典的线性回归模型通常是由随机误差项εi和一套参数β0和βi组成,可以写成:
传统的回归模型是建立在最小二乘法基础上对参数进行估计,OLS则在定义了全局因变量yi和自变量x关系后,i通过最小误差平方和来得出方程参数的估计值[8]。虽然其对于空间平稳性数据的回归有较好的估计,但是对于空间非平稳性数据的回归估计却不太理想。因此这时候就需要引入GWR模型,其允许一些不平稳的数据直接被模拟。地理加权回归方法对传统回归模型进行了拓展,使得参数能够进行局部估计,其模型为:
式中:ui、vi是第i个样本点的地理坐标;βi是随着地理位置的变化而变化,每一个局部的βi都是用来估计它相邻的空间观测值。
1.2数据来源
本文苏州酒店房价数据来源于携程网,共获取了7月25日到7月31日共七天的苏州整个地域范围内的酒店信息,最后选取出3957家连续七天均获取到客房最低价数据的酒店,将其七天的价格平均值作为原始数据。同时从携程网获取了每家酒店至7月31日为止的评分、评价数和酒店设施情况。评分为空的酒店其评分以同价格段所有酒店的平均值为准(例如价格为158元的酒店评分为空,则以价格为101-200元所有酒店的评分平均值作为其评分)。同时对酒店所提供的设施和服务进行统计,每提供一样设施或服务其数量就加一。
苏州地区内的POI点数据均从百度地图获取,其中包括餐饮POI点88993个,地铁站POI点129个,公交车站POI点9557个,购物POI点13457个,商务POI点2486个,休闲服务POI点894个,普通景点(除A级景点以外的其它景点)POI点2515个,3A级景点POI点11个,4A级景点POI点19个,5A级景点POI点8个,综合医院POI点140个,银行(包括ATM机服务点)POI点5232个,车站(包括汽车站和火车站)POI点131个,高等院校POI点86个,共计14类POI点数据。由于百度地图API一个矩形范围内只能返回最多400个POI点的数据,所以将苏州市范围切成80*80个切片对每一类POI点进行爬取。结果显示没有一个切片的数据量达到400,因此获取的数据相对来说较为全面,基本没有遗漏。最后将所有酒店和POI点数据导入ARCGIS10.5中计算酒店周边1000米范围内各类POI点的数量。
1.3变量选取
由于不能将哑元数据导入GWR模型,经过统计发现酒店周边3A、4A和5A景区数量的数据为哑元数据,为了不影响模型最终结果,所以决定采用赋值法对这三个变量进行合并(一个3A级景点赋3分,4A级景点赋4分,5A级景点赋5分)。最终选取的所有自变量共16个,分别为:酒店评分、酒店评价数、酒店设施数、酒店类型、餐饮(“周边餐饮数”的简称,下同)、地铁、公交、购物、商务、休闲服务、普通景点、A级景点、医院、银行、车站、高校。
2、结果分析
2.1 OLS结果分析
注:***为0.001显著性水平;**为0.01显著性水平;*为0.05显著性水平,下同。
本文中OLS模型回归分析通过ARCGIS10.5中的普通最小二乘法工具实现,输出的结果如表1所示。由于回归结果中Koenker统计量的概率为0.000000(p<0.01),具有统计学上的显著性,即说明数据可能存在空间非稳定性,因此使用稳健概率列(Robust_Pr)来确定系数显著性。从表中可以看出自变量餐饮、购物、商务、休闲和银行的VIF值均大于5.0,说明模型的自变量之间存在较为严重的全局或局部多重共线性。
2.2主成分分析
由于自变量之间存在多重共线性,但是这些变量的显著性水平又较高,为了在消除自变量之间多重共线性的同时不遗漏重要的自变量,所以决定采用主成分分析方法。
将数据导入SPSS25.0软件中,选择因子分析中的主成分分析方法进行提取。得到的KMO和巴特利特检验结果KMO結果为0.838,且巴特利特球形度检验的显著性为0.000(p<0.01),说明现有变量适合进行因子分析。
得到的成分矩阵如表2所示。经过主成分分析,原有的16个自变量被降维成了5个新的主成分。根据表中各列的因子载荷可以看出,主成分1主要由餐饮、地铁、公交、购物、商务、休闲、普通景点和银行共8个变量构成,因此可以将其命名为“周边综合生活配套设施”(简称PT);主成分2主要由酒店评分、酒店评价数、酒店设施数和酒店类型共4个变量构成,因此可以将去命名为“酒店自身条件”(ZS);主成分3主要由A级景点这一变量构成,因此可以将其命名为“酒店周边环境”(HJ);主成分4主要由车站这一变量构成,因此可以将其命名为“长途交通条件”(JT);主成分5主要由医院数量这一变量构成,同时高校占的比重也较高,因此可以将其命名为“周边医疗条件”(YL)。 通过SPSS25.0将原有的16个自变量全部标准化,依照表2从上到下的顺序设经过Z标准化后的变量为X1,X2,…,X16。同时用每一列的因子载荷分别除以其相应的特征值的平方根(分别为5.927、1.853、1.408、1.185、1.017),得到的各主成分的表达式。
表2 成分矩阵
2.3 GWR结果分析
将上述所得5个新的变量导入GWR4.0软件中进行运算,得到的回归结果如表3所示,以及GWR模型的估计系数如表4所示。
从表3中可以看出,PT、ZS、JT和YL都是显著的,只有HJ是不显著的。结果说明PT、ZS、JT和YL都具有明显的空间不平稳性,其系数会随着空间位置的变化而发生显著变化;而HJ则不具有明显的空间不平稳性,随着空间位置的变化其系数并不会发生显著的变化。
表3 回归结果
从表3中可以看出,ZS、HJ和JT的系数平均值均为正数,其對酒店价格的影响多为正向影响,其中酒店自身条件平均来说对酒店价格的影响最大为58.89,其次为长途交通条件对酒店价格的影响为56.77,最后为酒店周边环境对酒店价格的影响为10.83,即酒店自身条件越好、长途交通条件越便捷,一般来说酒店的价格就越高;而酒店周边环境越好一般其周边同质化竞争也较为激烈,因此对酒店价格的影响程度不高。而PT和YL的系数平均值均为负数,其对酒店价格的影响则多为负向影响,其中医疗条件越好的区域其周边一般多为廉价快捷酒店方便病人家属入住,其价格普遍较低。
3、结论与不足
本文基于GWR模型,对苏州地域范围内酒店价格的空间异质性及其影响因素进行了探讨。研究发现:①酒店价格主要受周边配套设施、酒店自身条件、周边环境、长途交通条件和周边医疗条件的显著影响,其中周边配套设施、酒店自身条件、长途交通条件和周边医疗条件的影响程度在空间上存在异质性②酒店自身条件、长途交通条件对酒店价格的正向影响最大,周边医疗条件对酒店价格的负向影响最大。
酒店价格的形成是多种因素在一定区域范围内共同作用的结果,除了本文中提到的影响因素之外,一定还有其它重要因素会对酒店价格产生影响。酒店的地价、房租和建设成本是否会对酒店价格产生影响,这些都是酒店经营者自己私下的交易行为我们暂时不得而知。我们曾尝试将区域范围内的平均地价作为自变量代入模型中,但考虑到现实中酒店建设的复杂情况,总觉得有失偏颇,因此将其舍弃。每一个酒店经营者对于所经营酒店的价格期望和其所选择的定价策略到底是怎样的,会对酒店价格产生怎样的影响这一点也有待进一步研究。政府的税收制度、相关政策又会对酒店价格产生怎样的影响也有待进一步探讨。
参考文献:
[1]文蓉.需求导向定价法在酒店价格形成机制中的应用[J].价格月刊,2014(03):33-35.
[2]周李,张清源,朱其静,陆林.广交会对星级酒店房价影响的时空分异研究——以第117和118届广交会为例[J].地理科学,2017,37(09):1363-1373.
[3]Sameer Mathur, Prem Prakash Dewani. Influence of cultural heritage on hotel prices,occupancy and profit:Theory and evidence[J]. Tourism Economics, 2016 ,22(5): 1014-1032.
[4]Brunsdon C, Fotheringham A S, Charlton M. Some notes on parametric significance tests for geographically weighted regression[J]. Journal of Regional Science, 1999, 39(3): 497-524.
[5]吴玉鸣.中国省域旅游业弹性系数的空间异质性估计——基于地理加权回归模型的实证[J].旅游学刊,2013,28(2):35-43.
[6]熊伟,吴必虎.大型展会对高星级酒店房价影响的空间分析——以第100届广交会为例[J].旅游学刊,2008,23(2): 80-86.
[7]汤庆园,徐伟,艾福利.基于地理加权回归的上海市房价空间分异及其影响因子研究[J].经济地理201232(2)52-58.
作者简介:
张义杰(1995-)男,汉族,江苏淮安人,硕士研究生,旅游地理。