论文部分内容阅读
摘 要:本文要求我们根据数据研究已有"拍照赚钱"任务的定价规律,设计新的定价方案,并探讨在打包发布方式下任务的定价规律,最后根据研究结果对新项目给出定价方案。本文主要采用了V4插值法、回归分析、优化模型和Q型聚类法等研究方法进行分析。
针对问题一,要研究已有任务的定价规律,首先对已知的数据运用V4插值法可以发现任务定价与位置的关系。然后对这两个相关因素进行处理,得到一般定价规律。最后对其进行误差分析和改进,得到在94.89%的拟合度下,定价与任务密度、会员密度和二者的交互项成线性关系。对于任务未完成的原因,根据地区与地区间的整体差异分析可知,任务未完成的原因是该任务附近会员的信誉率较低或者是该任务的定价较低。
针对问题二,对于会员来说,其完成任务的成本跟任务距离、任务密度和信誉度有一定的关系,在认为已完成任务的定价就是会员的成本值的条件下进行仿真,求出比较适合的参数值。其次,以最低的定价总和作为目标函数,以满足每一项任务都能被完成作为约束条件,建立以最低的外包费用完成所有任务时的任务定价模型。在计算过程中由于整体数据较多,因此分区进行优化,分别求出平均密度和任务完成率,并与原方案进行对比,可以得出任务完成率大幅度提高,但平均定价也相对有所提高,以深圳区为例,任务完成率提高了60%,平均定价增加了5。
针对问题三,可以将打包发布看作把位置相近的任务点作为一个任务进行发布。同样分地区进行考虑,首先,可以通过聚类分析对每个区域位置大致相近的任务进行分类,找到每一类的重心位置作为此类任务的等价位置。同时还应考虑任务的数目,改进原有模型。最后根据结果分析平均定价和任务完成度,与问题二结果进行对比,发现打包发布任务时,与单个任务相比任务的平均定价明显减少,但是任务的完成率却下降了,以深圳市为例,定价降低了17,任务的完成率降低了43%。
关键词:任务定价 V4插值法 回归分析 优化模型 Q型聚类法
1.模型假设
1.假设会员、任务都是无差别的,任务只可能被完成或者不被完成;
2.假设会员完成任务需要一个固定成本,即一个任务的利润必须大于会员的固定成本会员才会选择完成;
3.假设一种定价与一个任务周围的任务数和会员数的平均值相对应。即一种定价对应任务数目和会员数目的一个范围。
2.模型建立与求解
2.1 问题一
2.1.1 模型建立
根据附件中的经度和纬度可以计算出每两个任务之间的距离以及每个会员和任务的距离,得出对于每一个任务点的任务密度和会员密度。过程如下:
(1)根据经纬度可以计算出A和B两点间的距离为
运用MATLAB求解得到模型的回归系数估计值及其置信区间、检验统计变量,结果显示R2=0.9060 ,即因变量(定价)的 可由模型确定,F 值远远超出F 检验的临界值,p 远小于置信水平α ,因此回归模型从整体来看是可用的。
2.1.2 分析任务未完成的原因
根据经纬度数据和任务完成程度,在Google Earth上可以看出具体位置的具体任务数量和完成情况,在整个任务地区,根据任务的完成情况大致可以将其分为三部分,在每个地区任务完成情况呈现不同的情况,东莞地区完成率基本达到100%,深圳区完成率较低。任务的完成率和信誉度、任务定价有很大关系。从地区来看,会员的信誉度越高,任务定价越高,任务被完成的概率就越大。因此可以认为,任务未完成的原因是该任务附近会员的信誉率较低或者是该任务的定价较低。
2.2问题二
2.2.1模型建立
对于每一个会员来说,和任务相距越远,该会员完成任务的成本就越高。由问题一可知,任务完成与会员的信誉率有关,而原方案并未考虑信誉率,因此可以在原有基础上加上信誉率的分析。因此可以得到(5)式来研究用户成本的构成。
2.2.2模型求解
由于整个地区的数据较大,运用LINGO软件求解较为困难,所以可以分区进行分析。根据问题一,在东莞、佛山和深圳区域任务特征比较明显,因此可按照这三个地区分别进行定价优化。
首先对整个地区根据图8的大致分区按照经纬度进行分区,并对附件一和附件二数据进行筛选,得到每个区域的任务和会员数据,按上述方法仿真得到不同区域的成本参数,见表1。
分析模型的建立过程,可以发现在计算會员做任务的成本时,模型直接按照会员和任务的距离进行分析,并未考虑会员的可接受距离。通过分析,可以认为会员完成任务可以接受的距离为1500m,即当任务距离会员1500m时会员才会做任务,当超过1500m时,虽然定价比成本要大,但仍然会放弃任务。因此,在5.2.1的模型下,实际上任务完成率并不会达到100%。
在定价最优的情况下,筛选对于三个地区内有任务可做的会员,距离任务点距离大于1500m的会员个数,计算任务完成率,计算可知:东莞区域任务完成率为99.54%;佛山区域任务完成率为93.30%;深圳区域任务完成率为90.1%。
2.3问题三
2.3.1模型建立
实际情况下,对于每个会员来说,由于距离是个实际值,信誉度是定值,所有可以认为其与任务类的距离、信誉度和任务密度的关系和研究单个任务时是一样的,不同的是任务数量,变化的是总任务成本,因此可以根据任务数量对成本进行改进,成本计算公式见(7)式。
2.3.2模型求解
在每个地区,计算成本的参数λ,σ,γ和ε是固定不变的。对每一个区域,通过不断模拟,最终选择聚类数为30进行聚类时最为合适。在定价最优的情况下,筛选对于三个地区内有任务可做的会员,距离任务点距离大于1500m的会员个数,由任务类中的任务数量计算任务完成率,可以发现打包发布任务时,与单个任务相比任务的平均定价明显减少,但是任务的完成率却下降了。
参考文献:
[1]司守奎,孙兆亮.数学建模算法与应用[M].北京:国防工业出版社,2017;
[2]姜启源.数学模型[M].北京:高等教育出版社,1993;
[3]《运筹学教材编写组》.运筹学[M].北京:清华大学出版社,1990。
针对问题一,要研究已有任务的定价规律,首先对已知的数据运用V4插值法可以发现任务定价与位置的关系。然后对这两个相关因素进行处理,得到一般定价规律。最后对其进行误差分析和改进,得到在94.89%的拟合度下,定价与任务密度、会员密度和二者的交互项成线性关系。对于任务未完成的原因,根据地区与地区间的整体差异分析可知,任务未完成的原因是该任务附近会员的信誉率较低或者是该任务的定价较低。
针对问题二,对于会员来说,其完成任务的成本跟任务距离、任务密度和信誉度有一定的关系,在认为已完成任务的定价就是会员的成本值的条件下进行仿真,求出比较适合的参数值。其次,以最低的定价总和作为目标函数,以满足每一项任务都能被完成作为约束条件,建立以最低的外包费用完成所有任务时的任务定价模型。在计算过程中由于整体数据较多,因此分区进行优化,分别求出平均密度和任务完成率,并与原方案进行对比,可以得出任务完成率大幅度提高,但平均定价也相对有所提高,以深圳区为例,任务完成率提高了60%,平均定价增加了5。
针对问题三,可以将打包发布看作把位置相近的任务点作为一个任务进行发布。同样分地区进行考虑,首先,可以通过聚类分析对每个区域位置大致相近的任务进行分类,找到每一类的重心位置作为此类任务的等价位置。同时还应考虑任务的数目,改进原有模型。最后根据结果分析平均定价和任务完成度,与问题二结果进行对比,发现打包发布任务时,与单个任务相比任务的平均定价明显减少,但是任务的完成率却下降了,以深圳市为例,定价降低了17,任务的完成率降低了43%。
关键词:任务定价 V4插值法 回归分析 优化模型 Q型聚类法
1.模型假设
1.假设会员、任务都是无差别的,任务只可能被完成或者不被完成;
2.假设会员完成任务需要一个固定成本,即一个任务的利润必须大于会员的固定成本会员才会选择完成;
3.假设一种定价与一个任务周围的任务数和会员数的平均值相对应。即一种定价对应任务数目和会员数目的一个范围。
2.模型建立与求解
2.1 问题一
2.1.1 模型建立
根据附件中的经度和纬度可以计算出每两个任务之间的距离以及每个会员和任务的距离,得出对于每一个任务点的任务密度和会员密度。过程如下:
(1)根据经纬度可以计算出A和B两点间的距离为
运用MATLAB求解得到模型的回归系数估计值及其置信区间、检验统计变量,结果显示R2=0.9060 ,即因变量(定价)的 可由模型确定,F 值远远超出F 检验的临界值,p 远小于置信水平α ,因此回归模型从整体来看是可用的。
2.1.2 分析任务未完成的原因
根据经纬度数据和任务完成程度,在Google Earth上可以看出具体位置的具体任务数量和完成情况,在整个任务地区,根据任务的完成情况大致可以将其分为三部分,在每个地区任务完成情况呈现不同的情况,东莞地区完成率基本达到100%,深圳区完成率较低。任务的完成率和信誉度、任务定价有很大关系。从地区来看,会员的信誉度越高,任务定价越高,任务被完成的概率就越大。因此可以认为,任务未完成的原因是该任务附近会员的信誉率较低或者是该任务的定价较低。
2.2问题二
2.2.1模型建立
对于每一个会员来说,和任务相距越远,该会员完成任务的成本就越高。由问题一可知,任务完成与会员的信誉率有关,而原方案并未考虑信誉率,因此可以在原有基础上加上信誉率的分析。因此可以得到(5)式来研究用户成本的构成。
2.2.2模型求解
由于整个地区的数据较大,运用LINGO软件求解较为困难,所以可以分区进行分析。根据问题一,在东莞、佛山和深圳区域任务特征比较明显,因此可按照这三个地区分别进行定价优化。
首先对整个地区根据图8的大致分区按照经纬度进行分区,并对附件一和附件二数据进行筛选,得到每个区域的任务和会员数据,按上述方法仿真得到不同区域的成本参数,见表1。
分析模型的建立过程,可以发现在计算會员做任务的成本时,模型直接按照会员和任务的距离进行分析,并未考虑会员的可接受距离。通过分析,可以认为会员完成任务可以接受的距离为1500m,即当任务距离会员1500m时会员才会做任务,当超过1500m时,虽然定价比成本要大,但仍然会放弃任务。因此,在5.2.1的模型下,实际上任务完成率并不会达到100%。
在定价最优的情况下,筛选对于三个地区内有任务可做的会员,距离任务点距离大于1500m的会员个数,计算任务完成率,计算可知:东莞区域任务完成率为99.54%;佛山区域任务完成率为93.30%;深圳区域任务完成率为90.1%。
2.3问题三
2.3.1模型建立
实际情况下,对于每个会员来说,由于距离是个实际值,信誉度是定值,所有可以认为其与任务类的距离、信誉度和任务密度的关系和研究单个任务时是一样的,不同的是任务数量,变化的是总任务成本,因此可以根据任务数量对成本进行改进,成本计算公式见(7)式。
2.3.2模型求解
在每个地区,计算成本的参数λ,σ,γ和ε是固定不变的。对每一个区域,通过不断模拟,最终选择聚类数为30进行聚类时最为合适。在定价最优的情况下,筛选对于三个地区内有任务可做的会员,距离任务点距离大于1500m的会员个数,由任务类中的任务数量计算任务完成率,可以发现打包发布任务时,与单个任务相比任务的平均定价明显减少,但是任务的完成率却下降了。
参考文献:
[1]司守奎,孙兆亮.数学建模算法与应用[M].北京:国防工业出版社,2017;
[2]姜启源.数学模型[M].北京:高等教育出版社,1993;
[3]《运筹学教材编写组》.运筹学[M].北京:清华大学出版社,1990。