论文部分内容阅读
二十一世纪以来的中国,无论是经济较为发达的沿海地区,还是尚具有巨大经济潜力的中西部地区,政府公共服务支出相较二十世纪80年代均出现了大幅增长。但同时,需要认识的是,不同区域之间与不同时间段,政府主体在公共服务支出上不尽相同,其增长速度快慢也存在较大差异。从公共服务支出的内部构成上看,中国不同地区的教育类支出、医疗卫生支出、社会保障支出和文化设施支出占总公共服务支出的比重也各不相同。然而,从相关统计数据的分析中可知,由于政府个体之间存在时间序列和空间序列的高度相关性,所以,需要从公共治理视角重新审视我国政府公共服务支出问题。
早在经济学创立之初,亚当·斯密、休谟等学者均讨论过关于演化思想应用的思维模式问题,继而在德国历史学派和马克思主义经济学中又进行了更为深刻的探讨[1]。如今,演化经济学的发展在达尔文主义思潮的推动下一度成为主流经济学的分析框架。
同样的,演化机制具有其自身的优劣评价依据——演化稳定性。齐宝库(2010)[2]认为,进化稳定策略(evolutionarily stable strategy,ESS)表示一个种群抵抗变异策略侵入的一种稳定策略。由于演化博弈论并没有完全地应用演化理念,因而,其自身存在一定的理论缺陷。本文为了与演化稳定策略有所区别,提出了演化稳定性评价概念。演化稳定性评价是指在一定范式之下,演化所达到的稳定状态。同时,演化稳定评价也是依托于现实范式之下的评价方法,其范式的迁移将会拓宽对稳定状态的要求。此外,演化稳定性也可以表达为个体适应度的最大化,同样可以替代效用最大化的概念。与效用最大化概念相比,演化稳定性具有更容易计算和观察的属性。二者的不同点主要体现在,演化稳定性评价着力于对物种生存与否的认定,而效用最大化着力于物种愉悦与否的评价。根据马斯洛需求层次理论,生存性问题应当也必须是最优先讨论的问题。因此,演化稳定性,即个体适应度最大化也应当优先于效用最大化来讨论。个体稳定策略和集体稳定策略同样存在悖论,这一悖论形式与效用最大化理论的悖论形式是一致的,即个体适应度的最大化无法推导出集体适应度的最大化。因此,稳定策略依旧是一种个体最优与集体最优间来回平衡的策略形式。
此前學者们对于政府行为的探究,尤其是公共财政支出状况影响因素的研究多着眼于外因式的影响因素,例如:地区GDP、基尼系数、人口等外在因素,往往忽视了政府内在的影响因素[3-7]。演化政府行为正是为了弥补这一容易被忽视的因素而导致的分析缺陷,所提出来的一个政府内在影响因素。就公共治理角度而言,内因才是导致事物发生变化的根本原因,并且外因会通过传导机制作用到内因上。因此,演化政府行为的研究是合理且富有价值的。对于不同地区、不同时间阶段、不同政府个体之间学习能力的研究将会加强我们对政府行为的理解和预测。值得一提的是,演化政府行为的探究模式远比单纯地加入时间分析的动态分析更加符合现实状况。
一、演化政府行为中学习行为的构建与实现
在这一部分,首先构建演化政府行为模式——学习行为的行为仿真模型,然后产生相对应的正态分布随机数组并进行仿真运行,随后进行方检验和逻辑理论分析,以揭示演化政府行为模式——学习行为的客观性和科学性,最后,进一步论证演化动力在现实政府行为中的存在性问题。
(一)行为仿真模型的逻辑
本文的逻辑基础在于具备经济个体特性的政府同样具备演化个体的特征。将公共财政支出作为这一研究的对象,判断并检验政府行为中财政支出的演化动力是否真实存在。将外因(即地区GDP、人口因素、社会状况等指标)的多种表现形式耦合成内因(即演化动力)并进行系统表达。具体而言,就是通过行为仿真模拟设立演化与未演化的对照试验组,并进一步计算和比较演化组和未演化组各自的相关性系数,对本文所提出的理论进行检验。现实世界中,不同地区的政府在时空秩序下的财政支出呈现出较强的相关性,因此,相关性系数的加强将在一定意义上验证演化动力的存在性问题。
本文着重探讨演化动力中的“学习行为”。“学习行为”是不同演化政府个体之间为制定最终政策所进行一种行为,该行为以示范个体(model individual)的政策作为范例并以一定学习比率对之前政策进行调整,也可称之为后续调整行为。换言之,在已生成的未演化仿真组的基础上,进行一定比率的调整,以生成新的最终政策。学习行为在整个行为仿真模型表现为两个方向:一是纵向代与代之间的遗传性学习;二是横向区际之间的借鉴性学习。一般来说,广义上的学习行为在具体行为依据上存在两种不同的路径:在代际政府之间,下一届政府会趋向于模仿上一届政府。一方面,这样的学习借鉴有利于地区间政策的连贯性和稳定性;另一方面,由于所在地区的时序上差异较小,下一代政府利用上一代政府决策所做的决策准备可以辅助自己做出相应的决策。在不同区域之间,相邻政府也会存在相互模仿的行为。一方面,地区间成功或者失败的经验可以相互借鉴学习;另一方面,地区相邻度越高,决策对象的同一性也就越强。由于学习是按一定的比率实现的,每一个政府个体的学习能力大不一样,因此,政府个体的学习速率及效率的表现也是不尽相同的。
(二)行为仿真模型的构建
假设在不同时间、空间上存在诸多异质的政府个体,这些政府个体在决策上具有高度的独立性,这就需要区分决策制定行为的高度独立性和决策本身的高度独立性之间是否存在差别。一般来说,决策制定行为的高度独立性并不意味着决策本身的高度独立性。决策制定行为的高度独立性更多表现在学习比率的多元性,即学习比率是以随机正态分布的形式分布在[0,1]之间的,换言之,高度独立的决策行为可能会产生并非高度独立的政策结果。演化政府个体Gij表示其第i代、第j地的政府演化个体,其中,i、j均为正整数。演化政府个体作为一个抽象个体,在此处不考虑具体层面上政府公务人员的新旧比例、行政区划及其辖区的变动等微观因素。演化个体及其之后的算法化行为依托于个体属性,个体属性所代表的是公共财政支出的各个部分,以体现决策调整的方向性。这样,公共财政支出的组成部分就可以无限细分至n,即: 同样地,为了防止放射变换和计算量过大的问题,x*是X*在总体财政支出的比重,则可以得到:
根据对实际政府个体的观察可知,政府对于示范个体的学习在于其支出比重结构上进行比对和模仿,进而以自身所认可的较为合理的学习比率进行结构化趋同,而不是对单纯支出数量进行比对和模仿,因此,结构化趋同更符合现实生活中政府个体的学习行为。此外,还需要进一步认识的是,结构化趋同在算法上的好处是可以消除仿射变换所带来的弊端。
学习的观察路徑Gij到Gi(j-1)可以表示为:
学习行为也可以理解为对现有的与模范个体之间的差异的缩减,即同方向上范数的减少,即:
横向和纵向的学习强度是以学习比率(Kij)来体现的。学习比率Kij表示其第i代、第j代的政府演化个体的学习比率,i、j均为正整数。需要说明的是,在政府演化个体的学习上,存在时间序列上的纵向关系和空间序列上的横向关系,这也可以作为遗传和模仿的行为表征。因此,学习比率是具有一定向量形态的,即Kij(ki,kj) ,k1,k2随机正态分布于[0,1]。此外,学习行为还是一种后续调整行为,所谓后续调整是由于政府所做学习行为必然以学习前的决策作为学习调整的对象,从而产生学习后的新决策。
因此,Gij在进行横向学习,计算得到横向学习路径:
同样地,Gij在进行纵向学习,计算得到纵向学习路径:
政府所生成的最终的决策是由横向学习和总想学习一起决定的,最终的学习路径为:
(三)行为仿真模型的实现
本文利用matlab2014a对所构建的演化算法及其识别判断的行为仿真模型进行算法实现,以1000*1000(Gij)仿真个体、3类别属性值构建完成非越级性单次学习模型。
Step 1:以随机正态分布的形式生成Gij及其3类别属性值:
其中,xij1以μ=50,σ=503的正态分布随机产生;xij2受xij1影响,以μ=50-xij12,σ=503-xij16的正态分布随机产生,则,
Step 2:计算得到Gij-Gi(j-1)及Gij-G(i-1)j,并随机生成k1,k2。k1、k2分别以μ=12,σ=16的正态分布随机产生。
计算得到横向学习路径:
同样地,计算得到纵向学习路径:
计算最终的学习路径为:
得到经过学习行为修正过的新的仿真个体:G′ij(x′ij1,x′ij2,x′ij3),i,j∈[1,1000]。
Step 3:检验与分析
对新的仿真个体进行相关性检验并计算相关性矩阵方差以得到相关性强弱趋势的实验结果。
其中,xij1的相关性矩阵方差为0.447,x′ij1的相关性矩阵方差为0.467。换言之,修正后的仿真个体相关性有增强的趋势。
二、演化政府行为的拓展
(一)越级性学习
演化仿真模型的假定设立在仿真个体只针对相邻的前值进行相应的学习,也就是“非越级性学习”,然而,事实上仿真个体极有可能对前几代仿真个体进行了学习。因此,在更广泛的意义上,越级性学习更加符合现实社会的决策意图和学习路径。放宽非越级性学习假设,即不再局限于仅仅向上一个仿真个体学习,还可以向多个仿真个体进行学习,这将使得模型更加具有客观性和科学性。
(二)多次学习
如果演化仿真模型仅仅停留在单次学习行为的演化上,则与多次学习多次演化相背离。事实上,仿真个体是会根据最终决策所达成的效力而进行多次学习借鉴的,这会体现在多次模型运行中,进行多次的学习过程。
(三)学习比率的确定
对学习比率进行存储、选择更为精确的推断和构造,这将减少学习比率的随机性和不确定性,是有助于模型算法的优化的。
四、结论与启示
对于政府而言,演化政府行为并不仅仅包括学习或者遗传,还有其他演化行为模式。就公共治理角度而言,政府之间具备相互竞争的动机,也因此逐渐具备了相互抗争的能力。竞争的目的是在增大自身适应度的同时,减少竞争对手的适应度。竞争将导致同一时间序列中禀赋资源的重新分配。合作是政府之间同样为了自身发展,而采取的取之长处的一种行为,合作的前提是要具备合作的动机,合作的目的在于增加同一群体的集体适应度,同样地将会促成禀赋的重新分配。因此,在同一组的行为系统之中,同一个体针对不同个体、以及针对同一个体的不同时间都可能产生这两种行为模式。
政府之间的变异是根据自身辖区的具体情况所进行的有意识的政策差异,变异是学习的相反作用力,表述为“逆学习”的过程。在更宽泛的演化框架下,政府同样具备两种较为极端的情况,一是适应度由正值转化为零的情况,即死亡;二是适应度由零转化为正值的情况,也就是新生。
本文的分析主要是集中与演化政府行为对个体群的分析,随着研究的深入,这一分析模式将会迁移到更加一般的行为个体上,尽管需要更加全面的数据作为支撑,但这样也会使政府行为的分析模式更加客观与准确。
基金项目:重庆市技术预见与制度创新项目“重庆市全面深化改革成效评估模型研究”(项目编号:CSTC2019JSYJ-ZDXWTA0038)。
参考文献:
[1]韦森.语言的经济学与经济学的语言[J].东岳论丛,2009(11):5-29.
[2]齐宝库,蔚筱促,郭亮亮.基于演化博弈理论的绿色采购政府激励模型构建与应用[J].沈阳建筑大学学报(自然科学版),2010(4):813-816.
[3]王焕祥.中国地方政府创新与竞争的行为制度及其演化研究[M].北京:光明日报出版社,2009.
[4]茆翠红,钱钢,胡伟伟.创新行为系统中政府与企业的演化博弈及稳态分析[J].科技管理研究,2008,188(10):16-17,20.
[5]任碧云,罗安邦.金融集聚区建设中中央与地方政府行为的演化博弈研究[J].经济问题,2014(7):66-40.
[6]刘苗苗,杜建国.低碳经济背景下政府与企业行为演化分析[J].商业时代,2014(3):30-32.
[7]陆立军,于斌斌.传统产业与战略性新兴产业的融合演化及政府行为:理论与实证[J].中国软科学,2012(5):28-39.
作者:马文斌,重庆师范大学经济与管理学院教授,硕士生导师
阮氏映,重庆师范大学经济与管理学院硕士研究生
杨莉华,重庆师范大学国际交流与合作处助理研究员
责任编辑:张 波
早在经济学创立之初,亚当·斯密、休谟等学者均讨论过关于演化思想应用的思维模式问题,继而在德国历史学派和马克思主义经济学中又进行了更为深刻的探讨[1]。如今,演化经济学的发展在达尔文主义思潮的推动下一度成为主流经济学的分析框架。
同样的,演化机制具有其自身的优劣评价依据——演化稳定性。齐宝库(2010)[2]认为,进化稳定策略(evolutionarily stable strategy,ESS)表示一个种群抵抗变异策略侵入的一种稳定策略。由于演化博弈论并没有完全地应用演化理念,因而,其自身存在一定的理论缺陷。本文为了与演化稳定策略有所区别,提出了演化稳定性评价概念。演化稳定性评价是指在一定范式之下,演化所达到的稳定状态。同时,演化稳定评价也是依托于现实范式之下的评价方法,其范式的迁移将会拓宽对稳定状态的要求。此外,演化稳定性也可以表达为个体适应度的最大化,同样可以替代效用最大化的概念。与效用最大化概念相比,演化稳定性具有更容易计算和观察的属性。二者的不同点主要体现在,演化稳定性评价着力于对物种生存与否的认定,而效用最大化着力于物种愉悦与否的评价。根据马斯洛需求层次理论,生存性问题应当也必须是最优先讨论的问题。因此,演化稳定性,即个体适应度最大化也应当优先于效用最大化来讨论。个体稳定策略和集体稳定策略同样存在悖论,这一悖论形式与效用最大化理论的悖论形式是一致的,即个体适应度的最大化无法推导出集体适应度的最大化。因此,稳定策略依旧是一种个体最优与集体最优间来回平衡的策略形式。
此前學者们对于政府行为的探究,尤其是公共财政支出状况影响因素的研究多着眼于外因式的影响因素,例如:地区GDP、基尼系数、人口等外在因素,往往忽视了政府内在的影响因素[3-7]。演化政府行为正是为了弥补这一容易被忽视的因素而导致的分析缺陷,所提出来的一个政府内在影响因素。就公共治理角度而言,内因才是导致事物发生变化的根本原因,并且外因会通过传导机制作用到内因上。因此,演化政府行为的研究是合理且富有价值的。对于不同地区、不同时间阶段、不同政府个体之间学习能力的研究将会加强我们对政府行为的理解和预测。值得一提的是,演化政府行为的探究模式远比单纯地加入时间分析的动态分析更加符合现实状况。
一、演化政府行为中学习行为的构建与实现
在这一部分,首先构建演化政府行为模式——学习行为的行为仿真模型,然后产生相对应的正态分布随机数组并进行仿真运行,随后进行方检验和逻辑理论分析,以揭示演化政府行为模式——学习行为的客观性和科学性,最后,进一步论证演化动力在现实政府行为中的存在性问题。
(一)行为仿真模型的逻辑
本文的逻辑基础在于具备经济个体特性的政府同样具备演化个体的特征。将公共财政支出作为这一研究的对象,判断并检验政府行为中财政支出的演化动力是否真实存在。将外因(即地区GDP、人口因素、社会状况等指标)的多种表现形式耦合成内因(即演化动力)并进行系统表达。具体而言,就是通过行为仿真模拟设立演化与未演化的对照试验组,并进一步计算和比较演化组和未演化组各自的相关性系数,对本文所提出的理论进行检验。现实世界中,不同地区的政府在时空秩序下的财政支出呈现出较强的相关性,因此,相关性系数的加强将在一定意义上验证演化动力的存在性问题。
本文着重探讨演化动力中的“学习行为”。“学习行为”是不同演化政府个体之间为制定最终政策所进行一种行为,该行为以示范个体(model individual)的政策作为范例并以一定学习比率对之前政策进行调整,也可称之为后续调整行为。换言之,在已生成的未演化仿真组的基础上,进行一定比率的调整,以生成新的最终政策。学习行为在整个行为仿真模型表现为两个方向:一是纵向代与代之间的遗传性学习;二是横向区际之间的借鉴性学习。一般来说,广义上的学习行为在具体行为依据上存在两种不同的路径:在代际政府之间,下一届政府会趋向于模仿上一届政府。一方面,这样的学习借鉴有利于地区间政策的连贯性和稳定性;另一方面,由于所在地区的时序上差异较小,下一代政府利用上一代政府决策所做的决策准备可以辅助自己做出相应的决策。在不同区域之间,相邻政府也会存在相互模仿的行为。一方面,地区间成功或者失败的经验可以相互借鉴学习;另一方面,地区相邻度越高,决策对象的同一性也就越强。由于学习是按一定的比率实现的,每一个政府个体的学习能力大不一样,因此,政府个体的学习速率及效率的表现也是不尽相同的。
(二)行为仿真模型的构建
假设在不同时间、空间上存在诸多异质的政府个体,这些政府个体在决策上具有高度的独立性,这就需要区分决策制定行为的高度独立性和决策本身的高度独立性之间是否存在差别。一般来说,决策制定行为的高度独立性并不意味着决策本身的高度独立性。决策制定行为的高度独立性更多表现在学习比率的多元性,即学习比率是以随机正态分布的形式分布在[0,1]之间的,换言之,高度独立的决策行为可能会产生并非高度独立的政策结果。演化政府个体Gij表示其第i代、第j地的政府演化个体,其中,i、j均为正整数。演化政府个体作为一个抽象个体,在此处不考虑具体层面上政府公务人员的新旧比例、行政区划及其辖区的变动等微观因素。演化个体及其之后的算法化行为依托于个体属性,个体属性所代表的是公共财政支出的各个部分,以体现决策调整的方向性。这样,公共财政支出的组成部分就可以无限细分至n,即: 同样地,为了防止放射变换和计算量过大的问题,x*是X*在总体财政支出的比重,则可以得到:
根据对实际政府个体的观察可知,政府对于示范个体的学习在于其支出比重结构上进行比对和模仿,进而以自身所认可的较为合理的学习比率进行结构化趋同,而不是对单纯支出数量进行比对和模仿,因此,结构化趋同更符合现实生活中政府个体的学习行为。此外,还需要进一步认识的是,结构化趋同在算法上的好处是可以消除仿射变换所带来的弊端。
学习的观察路徑Gij到Gi(j-1)可以表示为:
学习行为也可以理解为对现有的与模范个体之间的差异的缩减,即同方向上范数的减少,即:
横向和纵向的学习强度是以学习比率(Kij)来体现的。学习比率Kij表示其第i代、第j代的政府演化个体的学习比率,i、j均为正整数。需要说明的是,在政府演化个体的学习上,存在时间序列上的纵向关系和空间序列上的横向关系,这也可以作为遗传和模仿的行为表征。因此,学习比率是具有一定向量形态的,即Kij(ki,kj) ,k1,k2随机正态分布于[0,1]。此外,学习行为还是一种后续调整行为,所谓后续调整是由于政府所做学习行为必然以学习前的决策作为学习调整的对象,从而产生学习后的新决策。
因此,Gij在进行横向学习,计算得到横向学习路径:
同样地,Gij在进行纵向学习,计算得到纵向学习路径:
政府所生成的最终的决策是由横向学习和总想学习一起决定的,最终的学习路径为:
(三)行为仿真模型的实现
本文利用matlab2014a对所构建的演化算法及其识别判断的行为仿真模型进行算法实现,以1000*1000(Gij)仿真个体、3类别属性值构建完成非越级性单次学习模型。
Step 1:以随机正态分布的形式生成Gij及其3类别属性值:
其中,xij1以μ=50,σ=503的正态分布随机产生;xij2受xij1影响,以μ=50-xij12,σ=503-xij16的正态分布随机产生,则,
Step 2:计算得到Gij-Gi(j-1)及Gij-G(i-1)j,并随机生成k1,k2。k1、k2分别以μ=12,σ=16的正态分布随机产生。
计算得到横向学习路径:
同样地,计算得到纵向学习路径:
计算最终的学习路径为:
得到经过学习行为修正过的新的仿真个体:G′ij(x′ij1,x′ij2,x′ij3),i,j∈[1,1000]。
Step 3:检验与分析
对新的仿真个体进行相关性检验并计算相关性矩阵方差以得到相关性强弱趋势的实验结果。
其中,xij1的相关性矩阵方差为0.447,x′ij1的相关性矩阵方差为0.467。换言之,修正后的仿真个体相关性有增强的趋势。
二、演化政府行为的拓展
(一)越级性学习
演化仿真模型的假定设立在仿真个体只针对相邻的前值进行相应的学习,也就是“非越级性学习”,然而,事实上仿真个体极有可能对前几代仿真个体进行了学习。因此,在更广泛的意义上,越级性学习更加符合现实社会的决策意图和学习路径。放宽非越级性学习假设,即不再局限于仅仅向上一个仿真个体学习,还可以向多个仿真个体进行学习,这将使得模型更加具有客观性和科学性。
(二)多次学习
如果演化仿真模型仅仅停留在单次学习行为的演化上,则与多次学习多次演化相背离。事实上,仿真个体是会根据最终决策所达成的效力而进行多次学习借鉴的,这会体现在多次模型运行中,进行多次的学习过程。
(三)学习比率的确定
对学习比率进行存储、选择更为精确的推断和构造,这将减少学习比率的随机性和不确定性,是有助于模型算法的优化的。
四、结论与启示
对于政府而言,演化政府行为并不仅仅包括学习或者遗传,还有其他演化行为模式。就公共治理角度而言,政府之间具备相互竞争的动机,也因此逐渐具备了相互抗争的能力。竞争的目的是在增大自身适应度的同时,减少竞争对手的适应度。竞争将导致同一时间序列中禀赋资源的重新分配。合作是政府之间同样为了自身发展,而采取的取之长处的一种行为,合作的前提是要具备合作的动机,合作的目的在于增加同一群体的集体适应度,同样地将会促成禀赋的重新分配。因此,在同一组的行为系统之中,同一个体针对不同个体、以及针对同一个体的不同时间都可能产生这两种行为模式。
政府之间的变异是根据自身辖区的具体情况所进行的有意识的政策差异,变异是学习的相反作用力,表述为“逆学习”的过程。在更宽泛的演化框架下,政府同样具备两种较为极端的情况,一是适应度由正值转化为零的情况,即死亡;二是适应度由零转化为正值的情况,也就是新生。
本文的分析主要是集中与演化政府行为对个体群的分析,随着研究的深入,这一分析模式将会迁移到更加一般的行为个体上,尽管需要更加全面的数据作为支撑,但这样也会使政府行为的分析模式更加客观与准确。
基金项目:重庆市技术预见与制度创新项目“重庆市全面深化改革成效评估模型研究”(项目编号:CSTC2019JSYJ-ZDXWTA0038)。
参考文献:
[1]韦森.语言的经济学与经济学的语言[J].东岳论丛,2009(11):5-29.
[2]齐宝库,蔚筱促,郭亮亮.基于演化博弈理论的绿色采购政府激励模型构建与应用[J].沈阳建筑大学学报(自然科学版),2010(4):813-816.
[3]王焕祥.中国地方政府创新与竞争的行为制度及其演化研究[M].北京:光明日报出版社,2009.
[4]茆翠红,钱钢,胡伟伟.创新行为系统中政府与企业的演化博弈及稳态分析[J].科技管理研究,2008,188(10):16-17,20.
[5]任碧云,罗安邦.金融集聚区建设中中央与地方政府行为的演化博弈研究[J].经济问题,2014(7):66-40.
[6]刘苗苗,杜建国.低碳经济背景下政府与企业行为演化分析[J].商业时代,2014(3):30-32.
[7]陆立军,于斌斌.传统产业与战略性新兴产业的融合演化及政府行为:理论与实证[J].中国软科学,2012(5):28-39.
作者:马文斌,重庆师范大学经济与管理学院教授,硕士生导师
阮氏映,重庆师范大学经济与管理学院硕士研究生
杨莉华,重庆师范大学国际交流与合作处助理研究员
责任编辑:张 波