论文部分内容阅读
摘 要:随着社会政策学科的蓬勃发展,作为衡量社会政策实践效果的政策评估愈益受到重视,并成为政策科学的主要研究议题之一。而这之中,不同的哲学取向是社会政策产生多种评估形式的基本原因。日渐多元的评估实践不仅丰富了社会政策的评估类型,而且以“倒逼”方式提升了政策的执行效力。复杂的政策环境、宏观政治结构等因素会影响社会政策的评估结果,但这一交互融合过程也会促使政策参与者开展政策学习与政策合作,最终推动政策的落实和政策科学的发展。
关键词:哲学基础;实践形式;政策科学
基金项目:国家社会科学基金项目“我国老年人非正式长期照护多主体合作发展路径研究”(18BSH170);青岛市社会科学规划研究项目“公共权力的失范风险与治理路径研究”(QDSKL1901305)。
[中图分类号] C934 [文章编号] 1673-0186(2020)006-0110-013
[文献标识码] A [DOI编码] 10.19631/j.cnki.css.2020.006.009
在各类风险不断凸显的当代社会,世界各国相继把社会建设作为现代化的一个基本内容予以推进执行,与之紧密相连的社会政策亦随之增多,可以说“政策型治理”已经成为提升国家治理能力的一个重要方式。但就政策实践而言,其也存在一定问题,各国的政策实践多偏重于政策制定而轻视政策评估,进而导致政策的执行效力难以达到预期。伴随新公共管理理念的兴起,如何以更有效的方式对社会政策开展评估,成为今后社会政策整体实施过程的一个关键环节。
与西方国家相比,中国现今的社会政策实践模式也有较大程度进步,主要表现有:一是从之前的应急性政策向常态化政策转变,这使得政策覆盖的目标对象得以扩展;二是从之前的单一性政策向综合性政策转变,这使得社会政策的受益范畴得以拓宽;三是从之前的整体性政策向专业化政策转变,这使得社会政策的受益群体得以精准对接。就总体而论,当代中国已经建立起了一个初具规模的社会政策体系。但也面临一个重要挑战,就是以何种方式实现对政策的有效评估。
一、社会政策评估的哲学基础
社會政策作为一种人为的社会干预“实验”,其介入都是基于一定的理论假设,即政策可以产生何种效果以及哪种因果机制可以“制造”预期的社会变革[1]。因此,建立稳固的因果关系成为社会政策评估中的一个难点[2],分析政策理论在多大程度上得到科学证据的支持便成为社会政策评估的基本内容,考察政策评估背后的哲学基础也就成为综合衡量社会政策成效的关键步骤。
历史地看,社会政策评估的哲学基础经历了一个转变过程,表现为评估主体由一元向多元转变、评估方法由实证量化向混合评估转变。而影响社会政策评估范式转换的主要原因在于制定、实施和评价政策所依据的哲学基础发生了改变。其间争论的核心问题基本是围绕社会政策评估的哲学基础展开,具体争论的焦点可以归结为几组概念。
(一)社会政策评估的概念之争
1.经济效益与社会效益
作为衡量社会政策在多大程度上实现了既定目标,效益一直是社会政策评估的基础概念,但使用经济效益还是社会效益则是政策评估哲学中一个平衡的难点。
西方国家广泛制定社会政策,与第二次世界大战后各国推行积极福利计划紧密相关;但其最初目的仍是将社会政策作为经济政策的补充,可以说此阶段的社会政策是一种带有很大应急色彩的“反应性福利计划”,对社会政策的评估主要取决于资金来源及其所依赖的政治经济结构。在这种政策条件下,社会政策评估的首要目标是衡量政策所产生的短期经济效益,其长期效益及其所衍生的社会效益往往不受重视。在经济效益评价框架下,社会政策评估基本可以被抽象为一种“成本—收益”分析,政策执行成本、资源使用效率、经济指标达成等成为政策评估的主要维度。
与之形成鲜明对比的事实是,秉持用“社会效益”对政策进行评估的理念在20世纪70年代出现。它兴起的原因可以概括为三个:其一,对社会政策的投入尽管在一定程度上缓和了“劳资矛盾”,为西方各国经济的持续发展提供了保护,但却没有在实质上降低经济的不平等程度;西方国家通过福利购买所获得的合法性与资本主义再生产之间的矛盾日趋激烈,这迫使各界重新反思经济增长的价值与局限,也倒逼了社会政策评估哲学的转向。其二,之前注重经济效益的社会政策评估范式,往往以短期的经济绩效来衡量社会政策的成效,长期效益由于不好测量等原因被忽视,导致社会政策的资金投入不足、连续性较差,政策的整体效益不显著。其三,伴随现代化进程的深入,民众的权利意识逐渐觉醒,一定程度上改变了社会政策的目标取向,使政策的各方认识到,“不应只视社会政策是为特殊人群而定,而应将社会政策视为是一个维护个人权利的政策谱系”[3],社会效益逐渐代替经济效益并成为社会政策评估的基本目标。
2.事实判断与价值判断
社会政策评估的哲学取向还受到事实判断与价值判断的双重约束。政治哲学、现象学和行为主义等众多学术流派,在整个20世纪围绕事实和价值之间的关系进行了激烈辩论。作为社会科学发展历程中长期存在的一个焦点议题,事实和价值这一对共生性学术词汇,催生出了不同的政策评估范式。
一般而言,理性主义者主张严格的事实与价值分离,并致力于生产非政治性的知识[4]。在这一理念下,政策评估植根于实证主义,借用自然科学等学科中的概念和方法,提供关于社会结构和社会发展的事实数据。这种政策分析要求对程序或项目的公正性判断必须以可靠的经验数据为基础,政策分析人员的任务是产出不受心理、文化和语言环境影响的信息。由于这类信息超越了历史和文化经验,因此在政治和道德层面具有一定的中立性。按照这种评估逻辑,合理的方法可以产生有关预期和实施政策绩效之间差异的相关信息,因此可以用来优化政策。这种以不偏不倚的方式提供有关政策的最准确的信息,要求政策评估方能根据有效、可靠的经验信息,对政策方案的改进进行持续评估[5],有助于在政策过程中实现理性决策。 但事实证明,在现实世界中遵循实证社会科学研究方法的要求比预期要困难得多。结果往往难以量化政策目标,尤其是在这些目标没有明确规定的情况下。理性主义方法的批评者认为关于社会和政治现象的政策干预是一项具有特定价值和规范的活动,而实证主义世界观及其方法则从根本上扭曲了事实与价值的分离。后实证主义者以及社会建构主义者将社会理解为一个有组织的意义世界,而不仅仅是一组要测量的物理实体。从这个逻辑出发,“事实”取决于一系列基本假设,这些假设赋予了生活世界以意义。但这些假设同时受到政治和权力的影响,基于这些假定的经验假设“倾向于具体化一个特定的现实”[6]。
3.定量方法与定性方法
社会政策评估在技术方法层面也出现了分化,定量和定性方法的差异性使用就是一个主要表征。定量方法一般被称为“实证的、假设的、演绎的、特殊的、客观的、面向结果的和自然科学的世界观”,而定性的方法则被称为“现象学、归纳、整体、主观、过程导向和社会人类学的世界观”。
20世纪50、60年代的社会政策评估,认为能够提供最佳决策的政策成果要采取非政治性、定量的评估,定量方法能够为政策实践提供坚实的、基础性的理想知识。这种技术方法否认了政策实践是“一种价值、信仰、政党执政和意识形态的活动”[7],定量研究成为政策评估的主导技术方法。依靠定量研究,可以建立起科学研究和政策实践之间的因果联系,进而使“政策制定者寻求以一种非政治化、科学化的方式‘理性地’管理经济和社会事务,从而使社会政策或多或少成为了社会技术学的一种实践”[8]。
继定量方法之后,定性方法在20世纪70年代开始迅速发展。与定量方法的理论假设不同,定性方法直接处理的是价值问题。正如一些理性主义的评价者所言,政策评估本质上是对一项政策或方案的价值的判断,因此政策评估有可能会超越经验科学的范畴;或者说,政策评估是在涉及多个行为者偏好的背景下进行的,而现有的基于定量方法所建构的因果模型没有能力处理这些问题。在定量方法不断受到批评后,定性方法愈益受到政策评估者的重视。与定量方法侧重政策结果的测量不同,定性方法能够描述和分析政策过程。因此评估研究人员认为,单靠定量方法是不够的,新的、混合的研究方法可以而且应该被广泛应用到社会政策评估之中。这改变了定量方法主导评估研究的局面,其他各种方法逐渐成为定量方法合理的替代品和补充,进而使评估研究从方法论的极权主义走向了多元化。
4.过程主义与结果主义
影响社会政策评估的第四对概念,主要涉及评估的内容层面,可以简单地概括为过程主义和结果主义。过程主义侧重政策过程评估,又被称之为形成性评估,以确定政策执行部门是否遵守了准则、政策执行是否得到适当管理或合同条款是否得到遵守,当然执行本身也是重要的结果。形成性评估发生在一个政策或项目刚开始之时,需要对政策过程是否有效做初步判断。可以说形成性评估不是处理“问题”,它不侧重于政策结果,而是判断政策过程是否有效。而结果主义侧重政策结果评估,也被称之为总结性评估。这种评估是对整个政策或政策执行结果的评价,政策的影响是评估的重点。大多数的政策都可以按一系列的類别,如目标、方法、实施和结果来处理。总结性评估可以对这些类别中的每一个进行审查,以查看政策的操作是否与政策目标一致。政策的影响通常是通过询问政策是否已经完成它所规定的目标来确定。但总结性评估也可能会考虑意想不到的政策结果。
形成性评估与总结性评估的区别是技术性的,涉及到评估的不同阶段。总结性评估侧重于政策结果,而形成性评估更倾向于将政策视为一项渐进的互动工作的一部分。而今的理性决策模式,评估回到了政策的形成和发展,所以从这个意义上说,几乎所有的评估都是形成性的[9]。
(二)社会政策评估的哲学范式
分析影响社会政策评估的概念可以发现,社会福利和社会政策中常见的、专业的概念与传统目标正在被解构,这对政策的执行和评估都带来了新的挑战。如果不仔细审查不同社会成员对日常概念的意义理解,必定会造成政策实践和政策评估之间的差距[10]。具体到科学研究和评估研究来看,评估研究和社会科学研究更多地是以概念性而非工具性的方式进行,以非系统和分散的形式接触决策者,进而“渗透”到政策领域,影响政策思考并为决策者提供服务[11]。基于对上述几组概念框架的分析,社会政策评估大致可以归纳为以下几种范式。
1.实证主义哲学范式
就社会政策评估的历史演进来看,实证主义评估范式尽管受到了批判,但仍然是政策评估的基本方式。实证主义哲学范式包含的理论要素主要有:其一,基于事实判断的因果假定。实证主义哲学范式的基本逻辑,主要是构建政策实践和政策结果之间的线性因果关系。在社会政策应对复杂经济和社会问题的背景下,要实现精确的和明确的因果归因几乎是不可能的,因此实证主义评估方法不得不接受因果推断的适度标准,以保持知识的“稳健性”来抵消因果推论的不确定性。其二,基于实验逻辑的假设检验。实证主义评估哲学的一个基本立足点,是认为社会政策本质上是一种人为的干预实验,它假设政策干预能够按照预期的最有效假定达到既定的政策效果。在这个实验框架下,“政策被视为是一种假设,是关于手段如何导致预期目标的假设”[12],而假设的结果可以通过实施该程序来进行实证检验,这个过程类似于经典的科学实验的“假设—干预—效果”逻辑[13]。其三,基于计算科学的技术支撑。社会政策和政策评估间的关系是复杂的,二者容易产生一定的紧张关系。这在很大程度上是由于社会政策的价值负载和研究的客观性之间的张力导致的。为了分析政策目的,政策工作者倾向于分析政策产品、过程和绩效。这种以经验为导向的技术手段,旨在实现预先设定的目标;而政策科学家作为社会工程师,其主要工作是计算实现政治机构确定的目标手段的成本和收益。因此,实证主义评估哲学的一个技术支撑便是计算科学的发展。
2.社会建构主义哲学范式 与实证主义哲学范式立足于事实判断的分析不同,社会建构主义哲学范式侧重价值判断,它对政策结果的测量持一种相对主义的观点,认为“社会现象的知识来自于相互竞争的框架之间的讨论”[14],因此建构主义哲学在认识论中制造了一种强烈的不确定性以及思维和意义的偶然性,这与传统的基于事实的决策观念有很大不同。
此外,与实证主义哲学假定研究者是理性人、持中立态度不同,社会建构主义哲学更强调人的主观性以及环境的影响,认为“我们对世界的理解是通过特定的思想和语言在特定的社会和政治环境中解释的。我们发现自己身处一个社会理论和分析不再能够以任何可信度为政治实践和道德决策提供保证的世界”[15]。换言之,在社会建构主义哲学看来,“社会世界的知识是建构的、文化的和历史的”[16]。从这一点出发,社会建构主义认为科学知识并不具有独立的客观性,这就使得知识的概念及其在政策制定中的作用变得更加复杂。就建构主义角度而言,政策发展是一种在解释和评估世界的多种框架条件下权衡信念、原则和行动的审议过程。政策学习涉及到对政策目标和假设提出质疑的认知模式或框架的社会条件、讨论和辩论过程。而以事实为基础的政策制定方式则是一个可以考虑的备选方案。
3.批判主义哲学范式
批判主义哲学范式主要受马克思主义及法兰克福学派的影响。经典马克思主义者对资本主义国家的福利建设及其相应的社会政策实践,起到了一个“倒逼”作用。以马克思主义观点来看,西方资本主义国家所施行的社会福利政策,其实是以一种福利购买方式降低无产阶级反抗的权宜之计,尽管能在一定程度上缓解资产阶级和无产阶级的冲突,但无法从根本上解决资本主义生产所固有的内在矛盾。继之而起的新马克思主义者,在继承传统马克思主义理论下,则倾向于分析现代资本主义国家的分配、压制或意识形态结构中进行的基本的统治结构的改变;而在具体规定上,新马克思主义者强调工业的民族化或资本的集体控制。他们认为扩大与改革社会政策是无关紧要的,因为这只不过是“资本主义霸权”的另类手段;为了解决矛盾,新马克思主义者所提供的策略是权力的下放及工人的参与[17]。
总体来看,批判主义哲学范式有几个特征:一是重视主客体的双向分析,这有别于以往其他范式的单一化分析取向,有助于从政策实施主体和客体的双重角度来评估政策的最终效果。二是重视结构性和历史性分析,有助于从宏观角度来开展政策研究,将政策实施的长期效应纳入了评估范畴。三是重视社会弱势群体利益,多以社会弱势群体的利益受损为出发点展开批判,重视工人、贫困等人群的利益及社会参与,这为此后混合评估、多元评估及政策的社会公正分析做了铺垫和开拓工作。
二、社会政策评估的基本类型
由于对社会政策评估基本概念的理解不同,进而形成了不同的社会政策评估哲学范式。而在不同的哲学框架下,社会政策评估又发展出不同的实践类型。
(一)政策成效评估
政策评估的核心问题是政策能否提供它应该交付的内容。最简单的有效性测量是通过考虑政策行动所做的工作指标,并将这些指标与目标指标进行比较。现有数据通常按投入、产出和结果分类,而决定一项政策是否有效,理论上应主要以成果而不是投入或產出为基础。但在实践中很难明确区分投入、产出和结果,因此评估方式在不同测量指标之间来回变动是相当常见的。
(二)业绩绩效评估
业绩计量是评估的一项例行活动,它使用成本较低且容易操作的措施来监测一个政策是否交付完成。绩效指标用于衡量政策或项目的进展情况。基准是一种标准,用于对照理想标准检查机构的业绩。这些主题相互重叠,因为采用业绩指标时通常考虑到某种标准,而且基准通常以业绩指标、实现目标的方式表示。
虽然基准可能与政策进程的任一部分,如投入、过程、产出或结果有关,但它们更多地被用来测量过程和产出,而不是结果。使用它们来获得结果的问题是,结果可能取决于一系列外部因素;当问题在基准机构控制范围内时,它们可以在影响方面有更多的表现。然而,使用基于结果的措施,试图通过判定结果来向评估机构进行支付的问题是,这为评估系统创造了奖励规则,进而可以操纵评估活动来满足指标的要求,因此也不是最佳做法。
(三)证据为本的评估
证据为本的政策评估在过去的二三十年间呈快速发展态势。尽管基于证据政策制定的背后理性主义假设,受到了社会建构主义和后现代主义的严峻挑战,但对政策评估者而言,在判定“什么有效”的知识基础上制定政策仍然具有现实意义[16]。其原因一方面与“福利国家”的福利支出过大有关,这迫使具有高福利体制的西方国家纷纷消减开支,企图以最小的福利投入获取最大的福利产出,而以证据为本的评估方式能够更为快速、更加直接地测量福利的投入和产出情况;另一方面,这种评估方式也与近年来西方盛行的新自由主义理念密切相关,使得众多西方国家在坚持维护个人基本权利的基础上,最大限度地减少政府干预,进而导致福利国家在福利领域的“退却”,也使得以证据为基础的政策制定重新抬头,同时表明通过运用理性知识实现社会进步的空间依然很大。
21世纪政策转型的一个重要表现,是从基于意见的决策转向以证据为基础并受到严格评估的决策。证据基础能够为政策决策过程的透明度和问责制提供支持[18],从设计新政策到对现行政策的评价和审查,都可以广泛地在政策制定的各个阶段使用证据。可以说,以证据为本的评估方式通常被认为是“科学”的。但也要看到问题的另一个层面,那就是以证据为本的政策制定,也会受到意识形态、政治目标及财政状况的限制。换言之,社会政策的目标常常受制于一定的社会情境,因而很难进行普遍化甚至是量化。这就造成有效的政策制定与执行的政策之间存在一定差距。加之证据往往是复杂多样的,评估所使用的“证据”经常被“简化”。因此很多学者认为,由于证据常常受到质疑,有时是模棱两可的,因此必须对证据的复杂性和模糊性进行考量[19]。此外,证据为本的政策评估方式还可能导致评估本质的偏离,使其注重目标的管理而不是高质量的评估和计划[20]。 (四)社会影响力评估
社会影响力评估是继众多评估方式后又一个具有转折意义的政策评估类型。社会影响力评估,其基本理念就是使政策制定者要考虑政策的“社会影响”。社会影响主要包括了个体、团体和社区在改变居民生活、工作、人际关系、组织方式的项目和活动中所产生的身体和情感体验。就其起源而言,社会影响力评估最初是作为环境影响评估的一部分来构思的,主要用于衡量国家规划和决策对环境和社区的影响。伴随各国对生态问题和社会问题的日益重视,加之受可持续发展理念的影响,社会影响力评估的应用范围得以拓展,方便政策制定者用来评估政策潜在的负面影响并提出缓解措施。
总体来看,社会影响力评估具有独特的评估优势:其一,社会影响力评估的针对性比较强,这主要源于社会影响力评估可以将“项目”或“政策”置于具体情境中来考察,因此这种评估方式能够适应不断变化的社会情境。其二,社会影响力评估采取整合的取向,可以识别各种相互关系,进而可以评估各类潜在的正面和负面效应,确保可以对政策执行风险进行管控。其三,社會影响力评估可以广泛使用各种数据,以求最大限度地挖掘数据的价值,全面呈现社会政策的实践效果[21]。其四,社会影响力评估还可用于前瞻性的政策和项目研究,以确保更好的决策和可持续发展。它的视野超越了物理环境,使人们看到了计划的变化对人们的生活、生计和景观意味着什么。因此,它修正了经常采用的技术官僚的环境影响评估方法。它不仅着眼于负面影响和预测风险,还包括提供增进人民福祉的备选方案。它采用参与性进程办法,为所有利益攸关方包括受影响社区的需要和关切提供政策参与空间[22]。
社会影响力评估努力评估任何项目或活动可能对社会产生的影响。从某种意义上说,它超越了单纯的产出评价,并评估了可能的社会结果。这尤其重要,因为大多数项目和活动都有成本、优势和非预期的副作用。相应地,它们对人群有不同的影响;有些人直接承担了费用,有些人直接受益于项目,还有一些人最终成为意外的利益受损者。因此,社会影响力评估旨在确定成本和效益是什么、可能的非预期效果是什么,谁会受益、谁将会损失。从这一角度来看,社会影响力评估包括许多其他评估,特别是经济影响评估、环境影响评估、健康影响评估以及对其他此类影响的评估。
(五)用户视角的评估
一般而言,社会政策评估的主要参与者是政策制定部门、专家学者等群体,社会政策的受众群体往往不被纳入进来。但随着近些年社会政策理念的变革,服务使用者也开始被吸纳进政策评估或项目评估的过程之中。这种评估方式改变了以往政治精英或知识精英占主导的评估模式,在一定程度上补充完善了社会政策评估维度。
用户视角的社会政策评估,涉及的评估层面比较多,其中有三个突出特征:一是服务用户是关键的涉众,他们对所遵循的策略、提供服务的条件以及服务的执行方式最为关注。这与以前对用户参与的考虑重叠,也使人们认识到评估可以作为赋予用户权力的一种手段。二是用户对提供服务比较关注,并对该过程有不同看法。而关注政策所述目标可以隐式地覆盖用户的关注点。这里存在潜在的危险,但不一定是真实的;用户希望服务工作,并且他们的关注点通常可以用服务的目标来表达。用户对服务的满意度、对质量和性能的看法以及交付体验是结果评估的一部分。许多公共服务部门将用户满意度的定量调查作为业绩的基本指标。这些调查在研究方面存在潜在问题。被某一机构征求意见的人不会做出中立的反应,而是有一种暗含的偏向于该机构提出这个问题。从数量上说,反馈问卷主要用于编制一系列指标,因此,各机构知道,随着时间的推移,它们是做得更好还是更糟。从质量上讲,它们更有价值;它们给出了另一种见解,并提供了关于所做的事情和其他方面的各种观点。三是服务操作的方式能够体现用户的特定洞察力。来自用户的投诉是重要的信息来源,对关键事件的密切检查使其能够识别出问题以及如何将其设置为正确。评论、投诉和问题可以用来汇总指标,但更有价值的是进行详细、密集、定性的审查,这有助于指出服务提供的问题。
三、社会政策评估的交互影响因素
社会政策评估所处的政治、经济和社会情境,不仅会在一定程度上左右社会政策评估的结果,还会对社会政策的治理成效以及社会政策科学的发展带来重大影响。
(一)宏观政治结构
社会政策评估作为多方社会力量共同参与的一个“集体事件”,结果如何受多种因素制约。总体来看,以往评估的注意力过于狭窄,政策评估的重点集中于评估的过程,涉及政策的设计、实施过程和评估报告。但想要提高评估的成效,还要考虑评估的政治环境。来自政治结构的压力能够影响评估单位和评估人员的独立性、可信度与职业道德。缺乏对政治关系的认识可能导致评估的失败,不能想当然地认为可以很容易地将评估纳入现有的政治机制之中,现有政策评估失败的很大一个原因,可以归结为评估专家和政治环境之间的配合问题上[23]。
政策评估受到的政治压力主要有三类:一是政府的总体制衡架构,即所谓跨部门政治的影响。因部门利益导致的分割运行和政策碎片化,可能导致评估的片面性和分散化。行政评估人员可能受到来自行政和机构政治的压力;如果他们提供了有关机构项目的有利证据,可能会遇到新的政治问题。更重要的是,跨部门政治推动了政府的政策发展,主导了评估议程,致使评估人员在必须报告政策“错误”时面临巨大压力。二是评估单位的官僚环境。这可能导致评估人员面临压力,从而被迫接受官僚机构规定的价值观,进而改变评估的客观结果。在官僚一级,对评估的影响主要涉及生产力和士气,但如果机构对评价结果不满意,就会影响到独立性。由于官僚环境优化了机构防御,因此助长了自我保护和秘密行为。官僚部门特别讨厌告密者,但他们也不赞成任何内部异议,尤其是无视机构传统或与过去的声明相矛盾的评价性结论。三是职业文化。这是因为职业文化有可能与评估文化发生冲突。在占主导地位的专业一级,评估方面的政治压力往往来自于竞争在机构内的地位,但它们通常表面上侧重于一种职业的方法、标准和价值观与另一种职业的方法、标准和价值观之间的差异。然而,由于主导的专业文化一般与官僚主义存在着亲密关系与合作,这意味着外部人员评估单位必须同时做出两方面的整合努力:适应官僚生活的束缚,同时在职业文化视野中面对评估的合法性问题。 應用研究学者常常把科学的政策建议理解为提供客观和一致的信息来支持政治决策,但其研究结果对政治决策或政策制定产生的影响往往未如预期。在复杂的政治、经济和社会环境中,科学并不是对治理的独立投入,而是治理不可分割的一部分[32]。从这个角度来看,广泛使用的“科学—政策”接口中的“差距应该被弥合”的比喻可能会产生误导。这些隐喻表明了对非常复杂和异质性的科学—政策关系的简化和技术性理解。为了提高对复杂关系的理解,科学—政策互动不应被概念化为两个相互独立的系统。相反,应将科学家和政治家之间的互动看作一个复杂的社会制度,双方的关系可以通过社会学习过程进行优化。这种科学政策系统可以被看作是一个交往平台,参与者可以交换信息、知识和观点,也可以被看作是参与者互动以追求他们的利益和行使权力的领域。两种交互模式都可以被认为是促进了学习过程。
参考文献
[1] Lub V. Polarisation, Radicalisation and Social Policy: Evaluating the Theories of Change[J]. Evidence & Policy, 2013(2) :165-183.
[2] Espen Bratberg, Astrid Grasdal, Alf Erling Risa. Evaluating Social Policy by Experimental and Nonexperimental Methods[J]. The Scandinavian Journal of Economics, 2002(1): 147-171.
[3] Symeonidou, Simoni. New Policies, Old ideas: the Question of Disability Assessment Systems and Social Policy [J]. Disability & Society, 2014(8): 1260-1274.
[4] Lynn Laurence E. A Place at the Table: Policy Analysis, Its Postpositive Critics, and the Future of Practice[J]. Journal of Policy Analysis & Management, 1999(3): 411-425.
[5] Rossi P., Freeman H., Lipsey M. Evaluation: A Systemic Approach (6th Ed.)[M]. Thousand Oaks, CA: Sage Publications, 1999:6.
[6] Fischer, F. Beyond Empiricism: Policy Inquiry in Postpositivist Perspective[J]. Policy Studies Journal, 1998(1): 129.
[7] Parsons, D. W. Public Policy: An Introduction to the Theory and Practice of Policy Analysis[M]. Edward Elgar, 1995:550.
[8] Thomas, A ,Schwandt.Evaluation as Practical Hermeneutics[J] .Evaluation, 1997(1): 69-83.
[9] Paul Spicker. Social Policy: Theory and Practice (Third Edition) [M]. Policy Press, 2014:412.
[10] Katarina Andersson, Hildur Kalman. Methodological Challenges in the Implementation and Evaluation of Social Welfare Policies[J]. International Journal of Social Research Methodology, 2012(1):69-80.
[11] Sanderson I. Evaluation, Policy Learning and Evidence-Based Policy Making[J]. Public Administration, 2002(1): 1-22.
[12] Martin Landau. The Proper Domain of Policy Analysis[J]. American Journal of Political Science, 1977(4): 423-427.
[13] Albaek E. Policy Evaluation: Design and Utilization [J]. Knowledge in Society, 1989(4): 6-19.
[14] Michael Moran, Martin Rein and Roberte Goodin. The Oxford Handbook of Public Policy[M]. Oxford University Press, 2006: 327.
[15] Barry Smart. Facing Modernity: Ambivalence, Reflexivity and Morality[M]. London: Sage Publications, 1999: 63. [16] Sanderson I. Evaluation, Policy Learning and Evidence-Based Policy Making[J]. Public Administration, 2002(1):1-22.
[17] Wilensky, H L. Political Legitimacy and Consensus: Missing Variables in the Assessment of Social Policy[J].Evaluating the Welfare State, 1983: 51-74.
[18] Edwards P.E-Social Science and Evidence-Based Policy Assessment: Challenges and Solutions[J]. Social Science Computer Review, 2009(4):553-568.
[19] Boaz A.& Pawson R. The Arduous Road from Evidence to Policy: Five Journeys Compared[J]. Journal of Social Policy, 2005(2):173-194.
[20] Diaz C, Drewery S. A Critical Assessment of Evidence-Based Policy and Practice in Social Work [J]. Journal of Evidence-Informed Social Work, 2016, 13(4):425-431.
[21] Parsons R, Everingham J A, Kemp D. Developing Social Impact Assessment Guidelines in a Pre-existing Policy Context [J]. Project Appraisal, 2019(2):114-123.
[22] Broeder L D, Vanclay F. Social Impact Assessment: An Opportunity for Health Issues in Public Policies and Private Investments[J]. European Journal of Public Health, 2012(1): 47.
[23] Chelimsky E. Integrating Evaluation Units into the Political Environment of Government: The Role of Evaluation Policy[J]. New Directions for Evaluation, 2009(123):51-66.
[24] Wildavsky A. Speaking the Truth to Power [M]. Boston: Little Brown and Co, 1979:6.
[25] Johansen E. Evaluation as Social Policy[J]. Review of Policy Research, 1986(1): 26-35.
[26] Meehan, E. J. Science, Values, and Policies. American? [J]. Behavioral Scientist, 1973(1): 53-100.
[27] Harold L. Wilensky. Political Legitimacy and Consensus: Missing Variables in the Assessment of Social Policy, In Evaluating the Welfare State, Shimon E.Spiro,Ephraim Yuchtman-Yaar[M]. Academic Press, 1983: 51-74.
[28] Greener I , Greve B . Introduction: Evidence and Evaluation in Social Policy [J]. Social Policy & Administration, 2013(4): 355-358.
[29] Saxe L. Policymakers. Use of Social Science Research: Technology Assessment in the U.S. Congress[J]. Science Communication, 1986(1): 59-78.
[30] Duignan P. Building Social Policy Evaluation Capacity[J]. Social Policy Journal of New Zealand, 2002, 19: 179-194.
[31] Majone G. Evidence, Argument and Persuasion in the Policy Process[M]. New Haven, Conn: Yale University Press, 1989:183. [32] Miller CA, Edwards PN Introduction: The Globalization of Climate Science and Climate Politics. In: Miller CA, Edwards PN(Eds) Changing the Atmosphere: Expert knowledge and Environmental Governance. MIT Press, Cambridge, 2001:1-30.
Philosophical Basis, Practical Forms and Interactive Factors of Social Policy Evaluation
Li Hairong Wang Lin
(School of Politics and Public Administration, Qingdao University,Qingdao,266061)
Abstract: With the vigorous development of social policy discipline, policy evaluation as a measure of the effect of social policy practice, has been paid more and more attention, and has become one of the main research topics of policy science. In this, different philosophic orientations are the basic reasons for various forms of social policy evaluation. The increasingly diversified evaluation practice not only enriches the types of social policy evaluation, but also improves the effectiveness of policy implementation in the way of “backward force”. Complex policy environment, macro political structure and other factors will affect the evaluation results of social policy, but this interactive integration process will also promote policy participants to carry out policy learning and policy cooperation, and ultimately promote the implementation of policy and the development of policy science.
Key Words: Philosophical basis; Forms of practice; Policy science
(责任编辑:丁忠兵)
作者简介:李海荣(1985—),男,汉族,山东泰安人,青岛大学政治与公共管理学院助理教授、硕士研究生导师,研究方向:社会政策;王琳(1994—),女,汉族,山东青島人,青岛大学政治与公共管理学院硕士研究生,研究方向:老龄政策。
关键词:哲学基础;实践形式;政策科学
基金项目:国家社会科学基金项目“我国老年人非正式长期照护多主体合作发展路径研究”(18BSH170);青岛市社会科学规划研究项目“公共权力的失范风险与治理路径研究”(QDSKL1901305)。
[中图分类号] C934 [文章编号] 1673-0186(2020)006-0110-013
[文献标识码] A [DOI编码] 10.19631/j.cnki.css.2020.006.009
在各类风险不断凸显的当代社会,世界各国相继把社会建设作为现代化的一个基本内容予以推进执行,与之紧密相连的社会政策亦随之增多,可以说“政策型治理”已经成为提升国家治理能力的一个重要方式。但就政策实践而言,其也存在一定问题,各国的政策实践多偏重于政策制定而轻视政策评估,进而导致政策的执行效力难以达到预期。伴随新公共管理理念的兴起,如何以更有效的方式对社会政策开展评估,成为今后社会政策整体实施过程的一个关键环节。
与西方国家相比,中国现今的社会政策实践模式也有较大程度进步,主要表现有:一是从之前的应急性政策向常态化政策转变,这使得政策覆盖的目标对象得以扩展;二是从之前的单一性政策向综合性政策转变,这使得社会政策的受益范畴得以拓宽;三是从之前的整体性政策向专业化政策转变,这使得社会政策的受益群体得以精准对接。就总体而论,当代中国已经建立起了一个初具规模的社会政策体系。但也面临一个重要挑战,就是以何种方式实现对政策的有效评估。
一、社会政策评估的哲学基础
社會政策作为一种人为的社会干预“实验”,其介入都是基于一定的理论假设,即政策可以产生何种效果以及哪种因果机制可以“制造”预期的社会变革[1]。因此,建立稳固的因果关系成为社会政策评估中的一个难点[2],分析政策理论在多大程度上得到科学证据的支持便成为社会政策评估的基本内容,考察政策评估背后的哲学基础也就成为综合衡量社会政策成效的关键步骤。
历史地看,社会政策评估的哲学基础经历了一个转变过程,表现为评估主体由一元向多元转变、评估方法由实证量化向混合评估转变。而影响社会政策评估范式转换的主要原因在于制定、实施和评价政策所依据的哲学基础发生了改变。其间争论的核心问题基本是围绕社会政策评估的哲学基础展开,具体争论的焦点可以归结为几组概念。
(一)社会政策评估的概念之争
1.经济效益与社会效益
作为衡量社会政策在多大程度上实现了既定目标,效益一直是社会政策评估的基础概念,但使用经济效益还是社会效益则是政策评估哲学中一个平衡的难点。
西方国家广泛制定社会政策,与第二次世界大战后各国推行积极福利计划紧密相关;但其最初目的仍是将社会政策作为经济政策的补充,可以说此阶段的社会政策是一种带有很大应急色彩的“反应性福利计划”,对社会政策的评估主要取决于资金来源及其所依赖的政治经济结构。在这种政策条件下,社会政策评估的首要目标是衡量政策所产生的短期经济效益,其长期效益及其所衍生的社会效益往往不受重视。在经济效益评价框架下,社会政策评估基本可以被抽象为一种“成本—收益”分析,政策执行成本、资源使用效率、经济指标达成等成为政策评估的主要维度。
与之形成鲜明对比的事实是,秉持用“社会效益”对政策进行评估的理念在20世纪70年代出现。它兴起的原因可以概括为三个:其一,对社会政策的投入尽管在一定程度上缓和了“劳资矛盾”,为西方各国经济的持续发展提供了保护,但却没有在实质上降低经济的不平等程度;西方国家通过福利购买所获得的合法性与资本主义再生产之间的矛盾日趋激烈,这迫使各界重新反思经济增长的价值与局限,也倒逼了社会政策评估哲学的转向。其二,之前注重经济效益的社会政策评估范式,往往以短期的经济绩效来衡量社会政策的成效,长期效益由于不好测量等原因被忽视,导致社会政策的资金投入不足、连续性较差,政策的整体效益不显著。其三,伴随现代化进程的深入,民众的权利意识逐渐觉醒,一定程度上改变了社会政策的目标取向,使政策的各方认识到,“不应只视社会政策是为特殊人群而定,而应将社会政策视为是一个维护个人权利的政策谱系”[3],社会效益逐渐代替经济效益并成为社会政策评估的基本目标。
2.事实判断与价值判断
社会政策评估的哲学取向还受到事实判断与价值判断的双重约束。政治哲学、现象学和行为主义等众多学术流派,在整个20世纪围绕事实和价值之间的关系进行了激烈辩论。作为社会科学发展历程中长期存在的一个焦点议题,事实和价值这一对共生性学术词汇,催生出了不同的政策评估范式。
一般而言,理性主义者主张严格的事实与价值分离,并致力于生产非政治性的知识[4]。在这一理念下,政策评估植根于实证主义,借用自然科学等学科中的概念和方法,提供关于社会结构和社会发展的事实数据。这种政策分析要求对程序或项目的公正性判断必须以可靠的经验数据为基础,政策分析人员的任务是产出不受心理、文化和语言环境影响的信息。由于这类信息超越了历史和文化经验,因此在政治和道德层面具有一定的中立性。按照这种评估逻辑,合理的方法可以产生有关预期和实施政策绩效之间差异的相关信息,因此可以用来优化政策。这种以不偏不倚的方式提供有关政策的最准确的信息,要求政策评估方能根据有效、可靠的经验信息,对政策方案的改进进行持续评估[5],有助于在政策过程中实现理性决策。 但事实证明,在现实世界中遵循实证社会科学研究方法的要求比预期要困难得多。结果往往难以量化政策目标,尤其是在这些目标没有明确规定的情况下。理性主义方法的批评者认为关于社会和政治现象的政策干预是一项具有特定价值和规范的活动,而实证主义世界观及其方法则从根本上扭曲了事实与价值的分离。后实证主义者以及社会建构主义者将社会理解为一个有组织的意义世界,而不仅仅是一组要测量的物理实体。从这个逻辑出发,“事实”取决于一系列基本假设,这些假设赋予了生活世界以意义。但这些假设同时受到政治和权力的影响,基于这些假定的经验假设“倾向于具体化一个特定的现实”[6]。
3.定量方法与定性方法
社会政策评估在技术方法层面也出现了分化,定量和定性方法的差异性使用就是一个主要表征。定量方法一般被称为“实证的、假设的、演绎的、特殊的、客观的、面向结果的和自然科学的世界观”,而定性的方法则被称为“现象学、归纳、整体、主观、过程导向和社会人类学的世界观”。
20世纪50、60年代的社会政策评估,认为能够提供最佳决策的政策成果要采取非政治性、定量的评估,定量方法能够为政策实践提供坚实的、基础性的理想知识。这种技术方法否认了政策实践是“一种价值、信仰、政党执政和意识形态的活动”[7],定量研究成为政策评估的主导技术方法。依靠定量研究,可以建立起科学研究和政策实践之间的因果联系,进而使“政策制定者寻求以一种非政治化、科学化的方式‘理性地’管理经济和社会事务,从而使社会政策或多或少成为了社会技术学的一种实践”[8]。
继定量方法之后,定性方法在20世纪70年代开始迅速发展。与定量方法的理论假设不同,定性方法直接处理的是价值问题。正如一些理性主义的评价者所言,政策评估本质上是对一项政策或方案的价值的判断,因此政策评估有可能会超越经验科学的范畴;或者说,政策评估是在涉及多个行为者偏好的背景下进行的,而现有的基于定量方法所建构的因果模型没有能力处理这些问题。在定量方法不断受到批评后,定性方法愈益受到政策评估者的重视。与定量方法侧重政策结果的测量不同,定性方法能够描述和分析政策过程。因此评估研究人员认为,单靠定量方法是不够的,新的、混合的研究方法可以而且应该被广泛应用到社会政策评估之中。这改变了定量方法主导评估研究的局面,其他各种方法逐渐成为定量方法合理的替代品和补充,进而使评估研究从方法论的极权主义走向了多元化。
4.过程主义与结果主义
影响社会政策评估的第四对概念,主要涉及评估的内容层面,可以简单地概括为过程主义和结果主义。过程主义侧重政策过程评估,又被称之为形成性评估,以确定政策执行部门是否遵守了准则、政策执行是否得到适当管理或合同条款是否得到遵守,当然执行本身也是重要的结果。形成性评估发生在一个政策或项目刚开始之时,需要对政策过程是否有效做初步判断。可以说形成性评估不是处理“问题”,它不侧重于政策结果,而是判断政策过程是否有效。而结果主义侧重政策结果评估,也被称之为总结性评估。这种评估是对整个政策或政策执行结果的评价,政策的影响是评估的重点。大多数的政策都可以按一系列的類别,如目标、方法、实施和结果来处理。总结性评估可以对这些类别中的每一个进行审查,以查看政策的操作是否与政策目标一致。政策的影响通常是通过询问政策是否已经完成它所规定的目标来确定。但总结性评估也可能会考虑意想不到的政策结果。
形成性评估与总结性评估的区别是技术性的,涉及到评估的不同阶段。总结性评估侧重于政策结果,而形成性评估更倾向于将政策视为一项渐进的互动工作的一部分。而今的理性决策模式,评估回到了政策的形成和发展,所以从这个意义上说,几乎所有的评估都是形成性的[9]。
(二)社会政策评估的哲学范式
分析影响社会政策评估的概念可以发现,社会福利和社会政策中常见的、专业的概念与传统目标正在被解构,这对政策的执行和评估都带来了新的挑战。如果不仔细审查不同社会成员对日常概念的意义理解,必定会造成政策实践和政策评估之间的差距[10]。具体到科学研究和评估研究来看,评估研究和社会科学研究更多地是以概念性而非工具性的方式进行,以非系统和分散的形式接触决策者,进而“渗透”到政策领域,影响政策思考并为决策者提供服务[11]。基于对上述几组概念框架的分析,社会政策评估大致可以归纳为以下几种范式。
1.实证主义哲学范式
就社会政策评估的历史演进来看,实证主义评估范式尽管受到了批判,但仍然是政策评估的基本方式。实证主义哲学范式包含的理论要素主要有:其一,基于事实判断的因果假定。实证主义哲学范式的基本逻辑,主要是构建政策实践和政策结果之间的线性因果关系。在社会政策应对复杂经济和社会问题的背景下,要实现精确的和明确的因果归因几乎是不可能的,因此实证主义评估方法不得不接受因果推断的适度标准,以保持知识的“稳健性”来抵消因果推论的不确定性。其二,基于实验逻辑的假设检验。实证主义评估哲学的一个基本立足点,是认为社会政策本质上是一种人为的干预实验,它假设政策干预能够按照预期的最有效假定达到既定的政策效果。在这个实验框架下,“政策被视为是一种假设,是关于手段如何导致预期目标的假设”[12],而假设的结果可以通过实施该程序来进行实证检验,这个过程类似于经典的科学实验的“假设—干预—效果”逻辑[13]。其三,基于计算科学的技术支撑。社会政策和政策评估间的关系是复杂的,二者容易产生一定的紧张关系。这在很大程度上是由于社会政策的价值负载和研究的客观性之间的张力导致的。为了分析政策目的,政策工作者倾向于分析政策产品、过程和绩效。这种以经验为导向的技术手段,旨在实现预先设定的目标;而政策科学家作为社会工程师,其主要工作是计算实现政治机构确定的目标手段的成本和收益。因此,实证主义评估哲学的一个技术支撑便是计算科学的发展。
2.社会建构主义哲学范式 与实证主义哲学范式立足于事实判断的分析不同,社会建构主义哲学范式侧重价值判断,它对政策结果的测量持一种相对主义的观点,认为“社会现象的知识来自于相互竞争的框架之间的讨论”[14],因此建构主义哲学在认识论中制造了一种强烈的不确定性以及思维和意义的偶然性,这与传统的基于事实的决策观念有很大不同。
此外,与实证主义哲学假定研究者是理性人、持中立态度不同,社会建构主义哲学更强调人的主观性以及环境的影响,认为“我们对世界的理解是通过特定的思想和语言在特定的社会和政治环境中解释的。我们发现自己身处一个社会理论和分析不再能够以任何可信度为政治实践和道德决策提供保证的世界”[15]。换言之,在社会建构主义哲学看来,“社会世界的知识是建构的、文化的和历史的”[16]。从这一点出发,社会建构主义认为科学知识并不具有独立的客观性,这就使得知识的概念及其在政策制定中的作用变得更加复杂。就建构主义角度而言,政策发展是一种在解释和评估世界的多种框架条件下权衡信念、原则和行动的审议过程。政策学习涉及到对政策目标和假设提出质疑的认知模式或框架的社会条件、讨论和辩论过程。而以事实为基础的政策制定方式则是一个可以考虑的备选方案。
3.批判主义哲学范式
批判主义哲学范式主要受马克思主义及法兰克福学派的影响。经典马克思主义者对资本主义国家的福利建设及其相应的社会政策实践,起到了一个“倒逼”作用。以马克思主义观点来看,西方资本主义国家所施行的社会福利政策,其实是以一种福利购买方式降低无产阶级反抗的权宜之计,尽管能在一定程度上缓解资产阶级和无产阶级的冲突,但无法从根本上解决资本主义生产所固有的内在矛盾。继之而起的新马克思主义者,在继承传统马克思主义理论下,则倾向于分析现代资本主义国家的分配、压制或意识形态结构中进行的基本的统治结构的改变;而在具体规定上,新马克思主义者强调工业的民族化或资本的集体控制。他们认为扩大与改革社会政策是无关紧要的,因为这只不过是“资本主义霸权”的另类手段;为了解决矛盾,新马克思主义者所提供的策略是权力的下放及工人的参与[17]。
总体来看,批判主义哲学范式有几个特征:一是重视主客体的双向分析,这有别于以往其他范式的单一化分析取向,有助于从政策实施主体和客体的双重角度来评估政策的最终效果。二是重视结构性和历史性分析,有助于从宏观角度来开展政策研究,将政策实施的长期效应纳入了评估范畴。三是重视社会弱势群体利益,多以社会弱势群体的利益受损为出发点展开批判,重视工人、贫困等人群的利益及社会参与,这为此后混合评估、多元评估及政策的社会公正分析做了铺垫和开拓工作。
二、社会政策评估的基本类型
由于对社会政策评估基本概念的理解不同,进而形成了不同的社会政策评估哲学范式。而在不同的哲学框架下,社会政策评估又发展出不同的实践类型。
(一)政策成效评估
政策评估的核心问题是政策能否提供它应该交付的内容。最简单的有效性测量是通过考虑政策行动所做的工作指标,并将这些指标与目标指标进行比较。现有数据通常按投入、产出和结果分类,而决定一项政策是否有效,理论上应主要以成果而不是投入或產出为基础。但在实践中很难明确区分投入、产出和结果,因此评估方式在不同测量指标之间来回变动是相当常见的。
(二)业绩绩效评估
业绩计量是评估的一项例行活动,它使用成本较低且容易操作的措施来监测一个政策是否交付完成。绩效指标用于衡量政策或项目的进展情况。基准是一种标准,用于对照理想标准检查机构的业绩。这些主题相互重叠,因为采用业绩指标时通常考虑到某种标准,而且基准通常以业绩指标、实现目标的方式表示。
虽然基准可能与政策进程的任一部分,如投入、过程、产出或结果有关,但它们更多地被用来测量过程和产出,而不是结果。使用它们来获得结果的问题是,结果可能取决于一系列外部因素;当问题在基准机构控制范围内时,它们可以在影响方面有更多的表现。然而,使用基于结果的措施,试图通过判定结果来向评估机构进行支付的问题是,这为评估系统创造了奖励规则,进而可以操纵评估活动来满足指标的要求,因此也不是最佳做法。
(三)证据为本的评估
证据为本的政策评估在过去的二三十年间呈快速发展态势。尽管基于证据政策制定的背后理性主义假设,受到了社会建构主义和后现代主义的严峻挑战,但对政策评估者而言,在判定“什么有效”的知识基础上制定政策仍然具有现实意义[16]。其原因一方面与“福利国家”的福利支出过大有关,这迫使具有高福利体制的西方国家纷纷消减开支,企图以最小的福利投入获取最大的福利产出,而以证据为本的评估方式能够更为快速、更加直接地测量福利的投入和产出情况;另一方面,这种评估方式也与近年来西方盛行的新自由主义理念密切相关,使得众多西方国家在坚持维护个人基本权利的基础上,最大限度地减少政府干预,进而导致福利国家在福利领域的“退却”,也使得以证据为基础的政策制定重新抬头,同时表明通过运用理性知识实现社会进步的空间依然很大。
21世纪政策转型的一个重要表现,是从基于意见的决策转向以证据为基础并受到严格评估的决策。证据基础能够为政策决策过程的透明度和问责制提供支持[18],从设计新政策到对现行政策的评价和审查,都可以广泛地在政策制定的各个阶段使用证据。可以说,以证据为本的评估方式通常被认为是“科学”的。但也要看到问题的另一个层面,那就是以证据为本的政策制定,也会受到意识形态、政治目标及财政状况的限制。换言之,社会政策的目标常常受制于一定的社会情境,因而很难进行普遍化甚至是量化。这就造成有效的政策制定与执行的政策之间存在一定差距。加之证据往往是复杂多样的,评估所使用的“证据”经常被“简化”。因此很多学者认为,由于证据常常受到质疑,有时是模棱两可的,因此必须对证据的复杂性和模糊性进行考量[19]。此外,证据为本的政策评估方式还可能导致评估本质的偏离,使其注重目标的管理而不是高质量的评估和计划[20]。 (四)社会影响力评估
社会影响力评估是继众多评估方式后又一个具有转折意义的政策评估类型。社会影响力评估,其基本理念就是使政策制定者要考虑政策的“社会影响”。社会影响主要包括了个体、团体和社区在改变居民生活、工作、人际关系、组织方式的项目和活动中所产生的身体和情感体验。就其起源而言,社会影响力评估最初是作为环境影响评估的一部分来构思的,主要用于衡量国家规划和决策对环境和社区的影响。伴随各国对生态问题和社会问题的日益重视,加之受可持续发展理念的影响,社会影响力评估的应用范围得以拓展,方便政策制定者用来评估政策潜在的负面影响并提出缓解措施。
总体来看,社会影响力评估具有独特的评估优势:其一,社会影响力评估的针对性比较强,这主要源于社会影响力评估可以将“项目”或“政策”置于具体情境中来考察,因此这种评估方式能够适应不断变化的社会情境。其二,社会影响力评估采取整合的取向,可以识别各种相互关系,进而可以评估各类潜在的正面和负面效应,确保可以对政策执行风险进行管控。其三,社會影响力评估可以广泛使用各种数据,以求最大限度地挖掘数据的价值,全面呈现社会政策的实践效果[21]。其四,社会影响力评估还可用于前瞻性的政策和项目研究,以确保更好的决策和可持续发展。它的视野超越了物理环境,使人们看到了计划的变化对人们的生活、生计和景观意味着什么。因此,它修正了经常采用的技术官僚的环境影响评估方法。它不仅着眼于负面影响和预测风险,还包括提供增进人民福祉的备选方案。它采用参与性进程办法,为所有利益攸关方包括受影响社区的需要和关切提供政策参与空间[22]。
社会影响力评估努力评估任何项目或活动可能对社会产生的影响。从某种意义上说,它超越了单纯的产出评价,并评估了可能的社会结果。这尤其重要,因为大多数项目和活动都有成本、优势和非预期的副作用。相应地,它们对人群有不同的影响;有些人直接承担了费用,有些人直接受益于项目,还有一些人最终成为意外的利益受损者。因此,社会影响力评估旨在确定成本和效益是什么、可能的非预期效果是什么,谁会受益、谁将会损失。从这一角度来看,社会影响力评估包括许多其他评估,特别是经济影响评估、环境影响评估、健康影响评估以及对其他此类影响的评估。
(五)用户视角的评估
一般而言,社会政策评估的主要参与者是政策制定部门、专家学者等群体,社会政策的受众群体往往不被纳入进来。但随着近些年社会政策理念的变革,服务使用者也开始被吸纳进政策评估或项目评估的过程之中。这种评估方式改变了以往政治精英或知识精英占主导的评估模式,在一定程度上补充完善了社会政策评估维度。
用户视角的社会政策评估,涉及的评估层面比较多,其中有三个突出特征:一是服务用户是关键的涉众,他们对所遵循的策略、提供服务的条件以及服务的执行方式最为关注。这与以前对用户参与的考虑重叠,也使人们认识到评估可以作为赋予用户权力的一种手段。二是用户对提供服务比较关注,并对该过程有不同看法。而关注政策所述目标可以隐式地覆盖用户的关注点。这里存在潜在的危险,但不一定是真实的;用户希望服务工作,并且他们的关注点通常可以用服务的目标来表达。用户对服务的满意度、对质量和性能的看法以及交付体验是结果评估的一部分。许多公共服务部门将用户满意度的定量调查作为业绩的基本指标。这些调查在研究方面存在潜在问题。被某一机构征求意见的人不会做出中立的反应,而是有一种暗含的偏向于该机构提出这个问题。从数量上说,反馈问卷主要用于编制一系列指标,因此,各机构知道,随着时间的推移,它们是做得更好还是更糟。从质量上讲,它们更有价值;它们给出了另一种见解,并提供了关于所做的事情和其他方面的各种观点。三是服务操作的方式能够体现用户的特定洞察力。来自用户的投诉是重要的信息来源,对关键事件的密切检查使其能够识别出问题以及如何将其设置为正确。评论、投诉和问题可以用来汇总指标,但更有价值的是进行详细、密集、定性的审查,这有助于指出服务提供的问题。
三、社会政策评估的交互影响因素
社会政策评估所处的政治、经济和社会情境,不仅会在一定程度上左右社会政策评估的结果,还会对社会政策的治理成效以及社会政策科学的发展带来重大影响。
(一)宏观政治结构
社会政策评估作为多方社会力量共同参与的一个“集体事件”,结果如何受多种因素制约。总体来看,以往评估的注意力过于狭窄,政策评估的重点集中于评估的过程,涉及政策的设计、实施过程和评估报告。但想要提高评估的成效,还要考虑评估的政治环境。来自政治结构的压力能够影响评估单位和评估人员的独立性、可信度与职业道德。缺乏对政治关系的认识可能导致评估的失败,不能想当然地认为可以很容易地将评估纳入现有的政治机制之中,现有政策评估失败的很大一个原因,可以归结为评估专家和政治环境之间的配合问题上[23]。
政策评估受到的政治压力主要有三类:一是政府的总体制衡架构,即所谓跨部门政治的影响。因部门利益导致的分割运行和政策碎片化,可能导致评估的片面性和分散化。行政评估人员可能受到来自行政和机构政治的压力;如果他们提供了有关机构项目的有利证据,可能会遇到新的政治问题。更重要的是,跨部门政治推动了政府的政策发展,主导了评估议程,致使评估人员在必须报告政策“错误”时面临巨大压力。二是评估单位的官僚环境。这可能导致评估人员面临压力,从而被迫接受官僚机构规定的价值观,进而改变评估的客观结果。在官僚一级,对评估的影响主要涉及生产力和士气,但如果机构对评价结果不满意,就会影响到独立性。由于官僚环境优化了机构防御,因此助长了自我保护和秘密行为。官僚部门特别讨厌告密者,但他们也不赞成任何内部异议,尤其是无视机构传统或与过去的声明相矛盾的评价性结论。三是职业文化。这是因为职业文化有可能与评估文化发生冲突。在占主导地位的专业一级,评估方面的政治压力往往来自于竞争在机构内的地位,但它们通常表面上侧重于一种职业的方法、标准和价值观与另一种职业的方法、标准和价值观之间的差异。然而,由于主导的专业文化一般与官僚主义存在着亲密关系与合作,这意味着外部人员评估单位必须同时做出两方面的整合努力:适应官僚生活的束缚,同时在职业文化视野中面对评估的合法性问题。 應用研究学者常常把科学的政策建议理解为提供客观和一致的信息来支持政治决策,但其研究结果对政治决策或政策制定产生的影响往往未如预期。在复杂的政治、经济和社会环境中,科学并不是对治理的独立投入,而是治理不可分割的一部分[32]。从这个角度来看,广泛使用的“科学—政策”接口中的“差距应该被弥合”的比喻可能会产生误导。这些隐喻表明了对非常复杂和异质性的科学—政策关系的简化和技术性理解。为了提高对复杂关系的理解,科学—政策互动不应被概念化为两个相互独立的系统。相反,应将科学家和政治家之间的互动看作一个复杂的社会制度,双方的关系可以通过社会学习过程进行优化。这种科学政策系统可以被看作是一个交往平台,参与者可以交换信息、知识和观点,也可以被看作是参与者互动以追求他们的利益和行使权力的领域。两种交互模式都可以被认为是促进了学习过程。
参考文献
[1] Lub V. Polarisation, Radicalisation and Social Policy: Evaluating the Theories of Change[J]. Evidence & Policy, 2013(2) :165-183.
[2] Espen Bratberg, Astrid Grasdal, Alf Erling Risa. Evaluating Social Policy by Experimental and Nonexperimental Methods[J]. The Scandinavian Journal of Economics, 2002(1): 147-171.
[3] Symeonidou, Simoni. New Policies, Old ideas: the Question of Disability Assessment Systems and Social Policy [J]. Disability & Society, 2014(8): 1260-1274.
[4] Lynn Laurence E. A Place at the Table: Policy Analysis, Its Postpositive Critics, and the Future of Practice[J]. Journal of Policy Analysis & Management, 1999(3): 411-425.
[5] Rossi P., Freeman H., Lipsey M. Evaluation: A Systemic Approach (6th Ed.)[M]. Thousand Oaks, CA: Sage Publications, 1999:6.
[6] Fischer, F. Beyond Empiricism: Policy Inquiry in Postpositivist Perspective[J]. Policy Studies Journal, 1998(1): 129.
[7] Parsons, D. W. Public Policy: An Introduction to the Theory and Practice of Policy Analysis[M]. Edward Elgar, 1995:550.
[8] Thomas, A ,Schwandt.Evaluation as Practical Hermeneutics[J] .Evaluation, 1997(1): 69-83.
[9] Paul Spicker. Social Policy: Theory and Practice (Third Edition) [M]. Policy Press, 2014:412.
[10] Katarina Andersson, Hildur Kalman. Methodological Challenges in the Implementation and Evaluation of Social Welfare Policies[J]. International Journal of Social Research Methodology, 2012(1):69-80.
[11] Sanderson I. Evaluation, Policy Learning and Evidence-Based Policy Making[J]. Public Administration, 2002(1): 1-22.
[12] Martin Landau. The Proper Domain of Policy Analysis[J]. American Journal of Political Science, 1977(4): 423-427.
[13] Albaek E. Policy Evaluation: Design and Utilization [J]. Knowledge in Society, 1989(4): 6-19.
[14] Michael Moran, Martin Rein and Roberte Goodin. The Oxford Handbook of Public Policy[M]. Oxford University Press, 2006: 327.
[15] Barry Smart. Facing Modernity: Ambivalence, Reflexivity and Morality[M]. London: Sage Publications, 1999: 63. [16] Sanderson I. Evaluation, Policy Learning and Evidence-Based Policy Making[J]. Public Administration, 2002(1):1-22.
[17] Wilensky, H L. Political Legitimacy and Consensus: Missing Variables in the Assessment of Social Policy[J].Evaluating the Welfare State, 1983: 51-74.
[18] Edwards P.E-Social Science and Evidence-Based Policy Assessment: Challenges and Solutions[J]. Social Science Computer Review, 2009(4):553-568.
[19] Boaz A.& Pawson R. The Arduous Road from Evidence to Policy: Five Journeys Compared[J]. Journal of Social Policy, 2005(2):173-194.
[20] Diaz C, Drewery S. A Critical Assessment of Evidence-Based Policy and Practice in Social Work [J]. Journal of Evidence-Informed Social Work, 2016, 13(4):425-431.
[21] Parsons R, Everingham J A, Kemp D. Developing Social Impact Assessment Guidelines in a Pre-existing Policy Context [J]. Project Appraisal, 2019(2):114-123.
[22] Broeder L D, Vanclay F. Social Impact Assessment: An Opportunity for Health Issues in Public Policies and Private Investments[J]. European Journal of Public Health, 2012(1): 47.
[23] Chelimsky E. Integrating Evaluation Units into the Political Environment of Government: The Role of Evaluation Policy[J]. New Directions for Evaluation, 2009(123):51-66.
[24] Wildavsky A. Speaking the Truth to Power [M]. Boston: Little Brown and Co, 1979:6.
[25] Johansen E. Evaluation as Social Policy[J]. Review of Policy Research, 1986(1): 26-35.
[26] Meehan, E. J. Science, Values, and Policies. American? [J]. Behavioral Scientist, 1973(1): 53-100.
[27] Harold L. Wilensky. Political Legitimacy and Consensus: Missing Variables in the Assessment of Social Policy, In Evaluating the Welfare State, Shimon E.Spiro,Ephraim Yuchtman-Yaar[M]. Academic Press, 1983: 51-74.
[28] Greener I , Greve B . Introduction: Evidence and Evaluation in Social Policy [J]. Social Policy & Administration, 2013(4): 355-358.
[29] Saxe L. Policymakers. Use of Social Science Research: Technology Assessment in the U.S. Congress[J]. Science Communication, 1986(1): 59-78.
[30] Duignan P. Building Social Policy Evaluation Capacity[J]. Social Policy Journal of New Zealand, 2002, 19: 179-194.
[31] Majone G. Evidence, Argument and Persuasion in the Policy Process[M]. New Haven, Conn: Yale University Press, 1989:183. [32] Miller CA, Edwards PN Introduction: The Globalization of Climate Science and Climate Politics. In: Miller CA, Edwards PN(Eds) Changing the Atmosphere: Expert knowledge and Environmental Governance. MIT Press, Cambridge, 2001:1-30.
Philosophical Basis, Practical Forms and Interactive Factors of Social Policy Evaluation
Li Hairong Wang Lin
(School of Politics and Public Administration, Qingdao University,Qingdao,266061)
Abstract: With the vigorous development of social policy discipline, policy evaluation as a measure of the effect of social policy practice, has been paid more and more attention, and has become one of the main research topics of policy science. In this, different philosophic orientations are the basic reasons for various forms of social policy evaluation. The increasingly diversified evaluation practice not only enriches the types of social policy evaluation, but also improves the effectiveness of policy implementation in the way of “backward force”. Complex policy environment, macro political structure and other factors will affect the evaluation results of social policy, but this interactive integration process will also promote policy participants to carry out policy learning and policy cooperation, and ultimately promote the implementation of policy and the development of policy science.
Key Words: Philosophical basis; Forms of practice; Policy science
(责任编辑:丁忠兵)
作者简介:李海荣(1985—),男,汉族,山东泰安人,青岛大学政治与公共管理学院助理教授、硕士研究生导师,研究方向:社会政策;王琳(1994—),女,汉族,山东青島人,青岛大学政治与公共管理学院硕士研究生,研究方向:老龄政策。