论文部分内容阅读
摘 要:本文针对"拍照赚钱"的任务定价问题,采用逐步回归的方法从4个影响指标中挑选出影响显著的指标来建立回归模型。分析出任务与会员之间的距离以及会员的位置对任务定价的回归模型影响显著,发现任务位置越偏僻、会员与任务之间的距离越大从而导致任务定价越高。因此在对任务定价时,首先要考虑任务的位置,任务位置越偏,则任务定价越高;其次考虑会员与任务的距离,任务与会员距离越大,任务定价也会相应提高。
关键词:逐步回归分析 最小二乘法
0 引言
“拍照赚钱”是众包形式下移动互联网的一种自助式服务模式。这种基于移动互联网的自助式劳务众包平台,为企业提供各种商业检查和信息搜集,相比传统的市场调查方式可以大大节省调查成本,而且有效地保证了调查数据真实性,缩短了调查的周期。因此APP成为该平台运行的核心,而APP中的任务定价又是其核心要素。如果定价不合理,有的任务就会无人问津,而导致商品检查的失败。因此制定合理的定价方案具有重要意义。
1 模型的建立与求解
本文设计新的任务定价方案,并和原方案进行比较。即需要对原方案进行优化,我们分为以下几个步骤进行求解。
由于影响因变量的因素可能很多,且个别因素对因变量的影响很小,那么误差平方和不会由于包含这些因素而减少,相反会因为因素的增加可能使误差变得更大,影响了整体的稳定性。故针对此问题本文采用逐步回归的方法从诸多影响因素中挑选出影响显著的因素来建立回归模型[1]。
1.1模型的建立
对于多元线性回归模型 y=av+b ,在满足模型经典假设下可利用最小二乘估计法估计参数, 参数估计量为 ,经典假设是“没有完全的多重共线性”, 但在现实经济问题分析中, 解释变量间不可能完全线性无关。如果解释变量v1,v2,v3…vi 之间存在线性相关关系, 则必有 ,从而 不存在,参数的最小二乘估计量不唯一,即最小二乘估计法失效, 此时模型存在多重共线性[2]。
逐步回归分析法不仅可以对多重共线性进行检验, 同时也是处理多重共线性问题的一种有效方法。采用逐步加入法来做分析。
STEP1:根据经济学规律或者相关主观经验分析,选出可能相关的自变量,设为v1,v2,v3…vi
STEP2:用每一個自变量分别对被解释变量y建立回归模型, 得到i个回归模型
STEP3: STEP1进行参数估计, 并进行检验, 选择通过检验的模型中残差平方和最小的模型作为首选模型; 或选取拟和优度最大的回归方程作为首选模型。
STEP4:在首选模型中逐个增加其他解释变量, 重新进行线性回归。若新增加的解释提高了回归方程的拟和优度,且回归方程中其他参数统计值仍然显著, 就在模型中保留该解释变量;若新增加的解释变量没有提高回归方程的拟和优度, 就不在模型中保留该解释变量; 若新增加的解释变量提高了回归方程的拟和优度, 但回归方程中某些参数的数值或高了回归方程的拟和优度, 但回归方程中某些参数的数值或符号等受到显著影响, 说明模型中存在多重共线性。步骤为:
①对上述i- 1个模型分别进行最小二乘估计, 得到每个模型的拟和优度和参数的 t 检验统计量;
②将v1,v2,v3…vi分别带入STEP2, 建立模型, 得到:
③进行多重共线性分析, 如果加入新变量的模型中的系数数值甚至符号发生了重大变化, 以至结果无法接受, 则极可能存在多重共线性, 新变量不能引入模型;
④在多重共线性的模型或多重共线性不显著的模型中,选择对R2 进行提高最显著的那个模型, 进行下一步骤;
⑤建立F 统计量:
,其中 n为样本数,Q(j) 表示模型包括j 个变量时的残差平方和,给定显著水平,查表得到Fa ;
⑥如果Fj>Fa ,则加入新变量,否则新变量不能加入;
⑦重复步骤①到⑥, 直到建立满意的模型为止;
1.2模型的求解:
假设任务定价关于4个指标之间的函数关系为:y=a1v1+a2v2+a3v3+a4v4+b
其中ai 为待估参数,b为常量。用最小二乘法进行估计得:
,参数v1、v2、v3、v4 对应的p 值为0.46、0.47、0.008、0.097。对模型进行white 异方差检验得p=0.891 ,原假设H0 模型是同方差,接受原条件,即不存在异方差。序列相关性检验,DW=d=1.85 ,du=1.83 ,满足du 虽然F0.05(,)= 运用最小二乘法逐一求对各解释变量的回归估计方程[3],结果如表1所示
显著水平取0.05时,查得F(1,29) =4.18。
由于自变量v4 的 ,且参数估计的P 值偏大,说明v4对y 的回归模型不显著,表明会员信誉值与任务定价并无很大的联系。
关于自变量v2 的回归显著性并不高,但对于变量v1 可以继续进入下一步回归,选取各方面检验结果达到较佳的v1为第一入选变量,去掉v4 对y的影响,做第二次回归。
显著水平取0.05时,查表F0.05(2,28)=3.34,F0.05(1,28)=4.20 ,从表9中可以看出,随着变量的逐个加入,变量y 方程的改进基本不变。由于F1=42.1、F2=51.2 ,且都大于F0.05(1,18)=4.41 ,说明模型整体上是显著的,对模型进行white 异方检验得p=0.87,认为模型不存在方差;对模型进行序列相关性检验,由于,DW=d=2.02,du=1.67 ,满足du 参考文献:
[1] 司守奎,《数学建模算法与应用》[M],北京:国防工业出版社,2011.8.
[2]贺江舟,龚明福,范君华,孙红专,张利莉. 逐步回归及通径分析在主成分分析中的应用[J]. 新疆农业科学,2010,47(03):431-437.
[3] 李松臣,张世英. 基于逐步回归法的人口出生率影响因素分析[J]. 统计与决策,2008,(04):7-9. [2017-09-17]. DOI:10.13546/j.cnki.tjyjc.2008.04.010
关键词:逐步回归分析 最小二乘法
0 引言
“拍照赚钱”是众包形式下移动互联网的一种自助式服务模式。这种基于移动互联网的自助式劳务众包平台,为企业提供各种商业检查和信息搜集,相比传统的市场调查方式可以大大节省调查成本,而且有效地保证了调查数据真实性,缩短了调查的周期。因此APP成为该平台运行的核心,而APP中的任务定价又是其核心要素。如果定价不合理,有的任务就会无人问津,而导致商品检查的失败。因此制定合理的定价方案具有重要意义。
1 模型的建立与求解
本文设计新的任务定价方案,并和原方案进行比较。即需要对原方案进行优化,我们分为以下几个步骤进行求解。
由于影响因变量的因素可能很多,且个别因素对因变量的影响很小,那么误差平方和不会由于包含这些因素而减少,相反会因为因素的增加可能使误差变得更大,影响了整体的稳定性。故针对此问题本文采用逐步回归的方法从诸多影响因素中挑选出影响显著的因素来建立回归模型[1]。
1.1模型的建立
对于多元线性回归模型 y=av+b ,在满足模型经典假设下可利用最小二乘估计法估计参数, 参数估计量为 ,经典假设是“没有完全的多重共线性”, 但在现实经济问题分析中, 解释变量间不可能完全线性无关。如果解释变量v1,v2,v3…vi 之间存在线性相关关系, 则必有 ,从而 不存在,参数的最小二乘估计量不唯一,即最小二乘估计法失效, 此时模型存在多重共线性[2]。
逐步回归分析法不仅可以对多重共线性进行检验, 同时也是处理多重共线性问题的一种有效方法。采用逐步加入法来做分析。
STEP1:根据经济学规律或者相关主观经验分析,选出可能相关的自变量,设为v1,v2,v3…vi
STEP2:用每一個自变量分别对被解释变量y建立回归模型, 得到i个回归模型
STEP3: STEP1进行参数估计, 并进行检验, 选择通过检验的模型中残差平方和最小的模型作为首选模型; 或选取拟和优度最大的回归方程作为首选模型。
STEP4:在首选模型中逐个增加其他解释变量, 重新进行线性回归。若新增加的解释提高了回归方程的拟和优度,且回归方程中其他参数统计值仍然显著, 就在模型中保留该解释变量;若新增加的解释变量没有提高回归方程的拟和优度, 就不在模型中保留该解释变量; 若新增加的解释变量提高了回归方程的拟和优度, 但回归方程中某些参数的数值或高了回归方程的拟和优度, 但回归方程中某些参数的数值或符号等受到显著影响, 说明模型中存在多重共线性。步骤为:
①对上述i- 1个模型分别进行最小二乘估计, 得到每个模型的拟和优度和参数的 t 检验统计量;
②将v1,v2,v3…vi分别带入STEP2, 建立模型, 得到:
③进行多重共线性分析, 如果加入新变量的模型中的系数数值甚至符号发生了重大变化, 以至结果无法接受, 则极可能存在多重共线性, 新变量不能引入模型;
④在多重共线性的模型或多重共线性不显著的模型中,选择对R2 进行提高最显著的那个模型, 进行下一步骤;
⑤建立F 统计量:
,其中 n为样本数,Q(j) 表示模型包括j 个变量时的残差平方和,给定显著水平,查表得到Fa ;
⑥如果Fj>Fa ,则加入新变量,否则新变量不能加入;
⑦重复步骤①到⑥, 直到建立满意的模型为止;
1.2模型的求解:
假设任务定价关于4个指标之间的函数关系为:y=a1v1+a2v2+a3v3+a4v4+b
其中ai 为待估参数,b为常量。用最小二乘法进行估计得:
,参数v1、v2、v3、v4 对应的p 值为0.46、0.47、0.008、0.097。对模型进行white 异方差检验得p=0.891 ,原假设H0 模型是同方差,接受原条件,即不存在异方差。序列相关性检验,DW=d=1.85 ,du=1.83 ,满足du
显著水平取0.05时,查得F(1,29) =4.18。
由于自变量v4 的 ,且参数估计的P 值偏大,说明v4对y 的回归模型不显著,表明会员信誉值与任务定价并无很大的联系。
关于自变量v2 的回归显著性并不高,但对于变量v1 可以继续进入下一步回归,选取各方面检验结果达到较佳的v1为第一入选变量,去掉v4 对y的影响,做第二次回归。
显著水平取0.05时,查表F0.05(2,28)=3.34,F0.05(1,28)=4.20 ,从表9中可以看出,随着变量的逐个加入,变量y 方程的改进基本不变。由于F1=42.1、F2=51.2 ,且都大于F0.05(1,18)=4.41 ,说明模型整体上是显著的,对模型进行white 异方检验得p=0.87,认为模型不存在方差;对模型进行序列相关性检验,由于,DW=d=2.02,du=1.67 ,满足du
[1] 司守奎,《数学建模算法与应用》[M],北京:国防工业出版社,2011.8.
[2]贺江舟,龚明福,范君华,孙红专,张利莉. 逐步回归及通径分析在主成分分析中的应用[J]. 新疆农业科学,2010,47(03):431-437.
[3] 李松臣,张世英. 基于逐步回归法的人口出生率影响因素分析[J]. 统计与决策,2008,(04):7-9. [2017-09-17]. DOI:10.13546/j.cnki.tjyjc.2008.04.010