论文部分内容阅读
摘要:针对当前文科学术评价所暴露出来的种种问题和争论,笔者从学术评价标准、学术规范和学术环境、学术评价自身的规范性等三个方面提出了自己的看法和思考,认为应该坚持评价标准的学术性,建立“元评价”机制和规范评价操作,这是解决当前文科学术评价问题的根本途径。
关键词:人文社会科学;学术评价;学术规范;评价标准;元评价
近些年来,有关学术评价和学术规范的问题引起了国内人文学者的广泛关注和深入讨论。从历史沿革来看,我国科研评价历经了行政评价、同行评议、指标量化评价、科研计量综合评价四个阶段。总的趋势是,科研评价逐渐走向了客观化、定量化与综合化。“自上世纪80年代末开始,以论文数量等量化指标为要素的学术成果考核评价,在内地高等院校广泛推行。由于改变了此前高校教学、科研管理随意松散的状态,考核曾被视为大胆改革的先锋之举”。但随着量化评价考核方式在实践中的不断推广、强化,其固有缺陷也日益暴露出来,乃至形成系统性的负面效应。上世纪90年代末至今,学术界对量化评价考核逐渐形成了强烈、持久、并且系统的批判,几乎成为“千夫所指”。许多人主张恢复以同行评议为主的评价方式,以及实行“代表作”评价制度,但这些主张也并未得到普遍认同;人们普遍认为当前的量化考核是“过头了”,但并不认为应该完全放弃量化考核。一些人文学者极力主张,应恢复到以同行评议为主的传统评价方式上去;而与此同时,其他众多学者对同行评议自身公正性的怀疑也是不绝于耳,丝毫没有减少。科研评价,尤其是人文社会科学研究评价,陷入了进退两难的境地。
从1994年至今有关“学术评价”的研究文献来看。关于学术成果评价(包括学术评奖)的研究占了很大部分,其次是基金评审。对比上世纪90年代中及以前,与90年代末及以后,可以看到一个清晰的发展脉络:即从大力呼吁并采用客观、定量化的评价方式,转向对定量化评价越来越猛烈的批判。如今,定性与定量评价方法相结合,似乎已成为研究者的共识;但在具体操作层面上究竟应该怎样结合、通过什么程序和途径予以结合?对此的探讨却又很少,且远未达成一致。在研究过程中,笔者也发现一些问题值得深入思考和进一步研究。
1、学术自由的传统与“学术评价”的学术性
与“构建一套什么样的评价体系”“如何构建一套评价体系”这些人们普遍关心的问题相比,“为什么要构建一套评价体系”似乎更是一个提问之前的“元问题”。如果仅仅回答问题,而不回答“元问题”,就很有可能陷入盲目操作的“工具至上”主义思维当中。人文社会科学研究的最终目的是什么?搞学术评价的目的又是什么?是为了削弱学术研究的自主性,加强对学术研究活动的外部监督与控制;还是尊重学术研究的自主性,维护其固有的秩序与规范?
邢东田的一番话值得参考。“就学界实际来看,特别优秀者和特别差劲者都是少数甚至是极少数,绝大多数都属于平常之人,水平差不多。对于那些确实得到学界公认的有重大突破性的成果,当然应予以特殊奖励。即使有异议,也涉及面很小;如果确实名不副实,也容易得到纠正。但对于那些水平和工作努力程度差不多的平常之人,就没有必要拉大距离,分出档次。若是强行将这些人拉开档次,评出高低,由于缺乏明确的指标,越评越会出问题,其后果必然是人为增加矛盾,自找麻烦。不仅不能促进学术发展,反而会因‘窝里斗’影响科研工作。所以,在不得不进行级别划分(比如评职称)时,作为一种有效的激励方式,在绝大多数人中实行类似公务员晋升的‘年资制’,或许更符合实际。这样做的优点是,标准比较明确,易于操作,减少了不必要的矛盾。其中如有脱颖而出者,则特殊安排——特殊人才超常拔擢,平常之人论资排辈,既鼓励了人才脱颖而出,又稳定了科研队伍。”
发现大师、巨匠等非常规科学人才,似乎并不是常规的科学研究评价的任务。常规的科学研究评价。只需要不违背科学研究的固有规律,不要拔苗助长和急功近利,也不要人为抑制其自然发展,维护学术规范和固有学术秩序,保持健康的学术生态环境,大师、巨匠就是自然而然涌现出来的。科学技术部徐冠华部长提出的关于人才成长规律的“蘑菇理论”也很有见地。大师、巨匠的涌现,大多与天赋、时运有关,与适宜的社会环境、学术环境当然也大有关系;但总体上是“长”出来,而不是“评”出来的。
近现代以来,自然科学和工程技术发展迅猛,成为“科学”的潜台词;人文社会科学则有被边缘化的趋势。一方面是自然科学和工程技术对社会生产的作用越来越大,社会地位越来越高,社会对科学技术的人力、物力资源投入越来越多,对科学技术的社会控制也越来越强,呈现出“大科学”的态势。另一方面,人文社会科学的发展远远落后于科学技术的发展,仍然保留了一定的“小科学”特征。人们按照对“科学”,实际上是按照对“自然科学”的定义来裁量人文社会科学,出现了明显的不适应。
当然这不等于说,不能对人文社会科学施加外部的影响和控制,如基金项目资助等。人们可以对人文社会科学研究实施英国高等教育评鉴(RAE)式的外部评价。但是,将学术性的评价与非学术性的评价活动分开,坚持“学术评价”的学术性,并维护学术自由的传统——这似乎是一条底线。因为就算是RAE,也是委托各学科领域的同行专家对各大学的系科进行评议,本质上也是学术界的自我评价,只不过RAE将这种过程组织化、集中化和公开化了。
将学术性评价与非学术性评价分开,坚持“学术评价”的学术性,并维护学术自由、自主的传统,也就是在尊重人文社会科学研究的客观规律及其“小科学”特性,保护人文社会科学研究的“学术生态环境”。为了维护学术自由传统,可能会有一些效率上的损失,但为长远计,这是必需的。以生态环境为例,害虫固然可以全部杀死,但环境污染了,地上不长庄稼了,就更不划算。尤其在“大科学”态势和市场经济条件下,更有必要好好研究和尊重学术研究固有的发展规律,增强学术评价的学术性,维护学术自治与独立。否则,恐怕很难抑制目前的学术功利、学术浮躁、学术“通货膨胀”等现象。
2、人文社会科学学术规范及学术评价的环境
学术规范是学术评价有效性的基础。假如学术规范未能得到普遍遵循,那么人文社会科学研究及其评价的基本环境就受到了破坏,许多在正常情况下默认成立的假设前提将不再成立(如学术成果的发表标志着学术同行对研究工作质量的认可、竞争性项目申请是对高水平研究的筛选等);而即使具有“客观、公正”形式的定量化评价考核方式,也不能挽救学术评价的失效和学术的失范。
作为一种定量评价考核标准,SCI、核心期刊为什么会“水土不服”,遭到众多人文学者的反对?量化考评方法为什么会受到众多学者的批判?如果说,定量统计只停留在宏观层面,并不直接与研究资源的分配挂钩,也不与机构、个人的利益挂钩,那就肯定不会存在什么问题; 如果说,在微观上学术规范得到了普遍遵循,SCI、核心期刊充当了可靠的质量控制“门槛”,那么即使将它们用于微观学术评价之中,也不应该会有什么大的问题。遗憾的是,一方面是大量存在的学术失范行为,另一方面又试图借助外部的力量(学术界以外的因素,如行政力量)和看似“客观、公正”的量化评价考核办法来纠正,却并没有达到预想的目的。
郑永流说,“学术成果的生产者,如果他们没有项目,可以准确地说,不拥有任何生产资料,对人、财、物概无支配权。绝大多数人甚至连一张办公桌都没有,是精神生产的‘无产阶级’。当然,人文社会科学研究对自由的学术环境的依赖甚于有形的生产资料,一些传世之作并非‘资助’出来的。但既然国家和社会有能力投入,那就要使学术成果的生产者通过其职务自动拥有必要的生产资料,无需再行申请。由于这些部门对学术研究资源的垄断,跑‘部’前进一直是大学校长的必修课。”在德国,只要取得了教授头衔,的确是自动取得科研资助、助手配备等资源的;而副教授、助教等在科研课题中大多是充当教授的助手。但目前在世界上大多数国家,并没有采用德国的这种体制。笔者认为,这实际上表明了在世界上的大多数国家,微观的科学运行规范体系、科学分层体系基本处于失效状态。因此,才需要在教授等职务之上。又对项目资助等研究资源的获取另设很高的“门槛”——这种“门槛”从根本上说是表达了对学术规范、学术自主性的质疑,对科学家管理科学界内部事务能力的不信任。朱寿桐也表达了类似的看法,认为是学术规范得不到普遍遵循,才导致学术评价失去了明确的标准。进而导致行政主导学术评价和学术评价的非学术化倾向。
学术规范状况影响到学术评价的基础环境和评价的有效性;反过来说,学术评价制度和方法,也影响到学术规范的状况。“鸡生蛋”还是“蛋生鸡”,这两者之间的互动关系颇值得玩味。学术规范状况是一个无形的总体环境,短期内不是人力可以作为的领域;而改进学术评价的方法、制度,则是有形的,可以有所作为的。所以问题的关键还是要改善学术评价与管理体制,从而把握枢纽,牵一而动万。笔者认为,当前构建人文社会科学研究评价体系的原则,是要“正本清源”,回归“学术本位”;应该借助科学的评价体系,适当提高人文社会科学研究的从业门槛,按照纯粹“学术性”的要求(研究质量、水平)设立科学分层机制,避免“泥沙俱下”和“鱼目混珠”,扭转学术普遍失范的现象。在这方面,英国高等教育评鉴(RAE)的做法,及北大、清华的“代表作”评价办法,值得-思考与借鉴。
3、关于“元评价”
当前国内学术界对于人文社会科学研究评价本质与规律的认识,尚未达到系统、深入、完整的地步。主要表现在:评价理论与实践中的唯科学主义、“工具至上”主义思维甚嚣尘上,管理操作的观点主导了评价实践;对于评价主体、评价目的、评价标准认识不清,各种评价方法、指标任意套用,或者笼而统之搞“综合”的现象比较多;对于评价的复杂性、被评价方的主观能动性、各评价要素之间的互涉性、特定评价方法或指标可能造成的负面后果估计不足。
在人文社会科学研究评价的具体环境下,搞清楚评价的目的、目标,主体及其相应的需求是很重要的。对于评价是否科学、合理,具有决定性的作用。否则,即使是形式上再“公正”的评价方法和程序,也不可能是真正做到“公正”的。象把数量当水平(比发文数量评教授)、把投人当效益(科研项目和科研经费的多少)的做法,在某些特定环境下并非全无道理;然而在其他更多特定环境下,却是荒谬可笑、不合逻辑、经不起推敲的。所以应该仔细分析评价的目的、主体、需求、标准等要素,根据具体环境有针对性地设计评价指标、方法与程序,努力克服“工具至上”式的思维,避免不同类型评价方法、指标的任意搬用。
当前的功利与浮躁情绪,不仅表现在评价指标的数量化导向上,也反映在评价方法、指标本身的形成程序上。蒋国华曾经指出,早期的诸计量学量化指标主要是用于为了科学决策而开展的科学质量和科学发展趋势的研究,也就是宏观层面的应用;应用于科学家个人成就的评估,是后来的事。在科学计量学的理论研究方面,西方发达国家自始至终走在前列;而在实践运用科研计量评价方法方面,前东欧社会主义国家却更加积极、激进,西方发达国家则显得保守。至今为止,美国、英国仍然实行以同行评议为主的科学研究评价体制。笔者认为,西方发达国家这种“慢决策,快执行”的谨慎态度,值得我们学习。
谨慎的态度,要求有相应的“元评价”机制。对于一切量化评价方法、指标,以及同行评议的方法、程序,或者如数据库、网络等现代化技术手段,不管新的或旧的,应该持一种开放的、批判的态度。在不同的具体环境下,允许不同的评价方法、指标进行一定程度的试验,但在得到公认、发展成熟之前,使用应该谨慎。在不同的评价机构、评价方法、评价指标、评价标准、评价程序之间,应该存在一种开放、有序的竞争机制,最终让优异者在竞争中脱颖而出。这种开放的环境和态度,本身就是一种“元评价”机制。但与此同时,需要警惕“工具至上”思维和简单的“拿来主义”,认真区分研究性评价和实践性评价;注意实践性评价的要求,对于任何应用于大规模评价实践的评价指标体系、评价方法、评价程序等,一定要经过实验的反复检验,证明比较成熟、可靠才行。为此,建立类似评价行业协会等有形的“元评价”体系也是极有必要的,其作用就在于对于各类评价机构、评价专家、评价方法、评价程序等进行研究、管理、规范和认证,加强评价活动本身的规范性。
4、结语
笔者十分赞同朱寿桐的看法,即:坚持学术评价的“学术性”,用学术标准来衡量学术,这是解决当前文科学术评价问题的关键。而对于“评价”本身,也应该走出纯粹经验主义和工具主义的误区,逐渐建立“元评价”机制和体系,使“评价”从一种经验性的“操作”,走向规范和“科学”。
关键词:人文社会科学;学术评价;学术规范;评价标准;元评价
近些年来,有关学术评价和学术规范的问题引起了国内人文学者的广泛关注和深入讨论。从历史沿革来看,我国科研评价历经了行政评价、同行评议、指标量化评价、科研计量综合评价四个阶段。总的趋势是,科研评价逐渐走向了客观化、定量化与综合化。“自上世纪80年代末开始,以论文数量等量化指标为要素的学术成果考核评价,在内地高等院校广泛推行。由于改变了此前高校教学、科研管理随意松散的状态,考核曾被视为大胆改革的先锋之举”。但随着量化评价考核方式在实践中的不断推广、强化,其固有缺陷也日益暴露出来,乃至形成系统性的负面效应。上世纪90年代末至今,学术界对量化评价考核逐渐形成了强烈、持久、并且系统的批判,几乎成为“千夫所指”。许多人主张恢复以同行评议为主的评价方式,以及实行“代表作”评价制度,但这些主张也并未得到普遍认同;人们普遍认为当前的量化考核是“过头了”,但并不认为应该完全放弃量化考核。一些人文学者极力主张,应恢复到以同行评议为主的传统评价方式上去;而与此同时,其他众多学者对同行评议自身公正性的怀疑也是不绝于耳,丝毫没有减少。科研评价,尤其是人文社会科学研究评价,陷入了进退两难的境地。
从1994年至今有关“学术评价”的研究文献来看。关于学术成果评价(包括学术评奖)的研究占了很大部分,其次是基金评审。对比上世纪90年代中及以前,与90年代末及以后,可以看到一个清晰的发展脉络:即从大力呼吁并采用客观、定量化的评价方式,转向对定量化评价越来越猛烈的批判。如今,定性与定量评价方法相结合,似乎已成为研究者的共识;但在具体操作层面上究竟应该怎样结合、通过什么程序和途径予以结合?对此的探讨却又很少,且远未达成一致。在研究过程中,笔者也发现一些问题值得深入思考和进一步研究。
1、学术自由的传统与“学术评价”的学术性
与“构建一套什么样的评价体系”“如何构建一套评价体系”这些人们普遍关心的问题相比,“为什么要构建一套评价体系”似乎更是一个提问之前的“元问题”。如果仅仅回答问题,而不回答“元问题”,就很有可能陷入盲目操作的“工具至上”主义思维当中。人文社会科学研究的最终目的是什么?搞学术评价的目的又是什么?是为了削弱学术研究的自主性,加强对学术研究活动的外部监督与控制;还是尊重学术研究的自主性,维护其固有的秩序与规范?
邢东田的一番话值得参考。“就学界实际来看,特别优秀者和特别差劲者都是少数甚至是极少数,绝大多数都属于平常之人,水平差不多。对于那些确实得到学界公认的有重大突破性的成果,当然应予以特殊奖励。即使有异议,也涉及面很小;如果确实名不副实,也容易得到纠正。但对于那些水平和工作努力程度差不多的平常之人,就没有必要拉大距离,分出档次。若是强行将这些人拉开档次,评出高低,由于缺乏明确的指标,越评越会出问题,其后果必然是人为增加矛盾,自找麻烦。不仅不能促进学术发展,反而会因‘窝里斗’影响科研工作。所以,在不得不进行级别划分(比如评职称)时,作为一种有效的激励方式,在绝大多数人中实行类似公务员晋升的‘年资制’,或许更符合实际。这样做的优点是,标准比较明确,易于操作,减少了不必要的矛盾。其中如有脱颖而出者,则特殊安排——特殊人才超常拔擢,平常之人论资排辈,既鼓励了人才脱颖而出,又稳定了科研队伍。”
发现大师、巨匠等非常规科学人才,似乎并不是常规的科学研究评价的任务。常规的科学研究评价。只需要不违背科学研究的固有规律,不要拔苗助长和急功近利,也不要人为抑制其自然发展,维护学术规范和固有学术秩序,保持健康的学术生态环境,大师、巨匠就是自然而然涌现出来的。科学技术部徐冠华部长提出的关于人才成长规律的“蘑菇理论”也很有见地。大师、巨匠的涌现,大多与天赋、时运有关,与适宜的社会环境、学术环境当然也大有关系;但总体上是“长”出来,而不是“评”出来的。
近现代以来,自然科学和工程技术发展迅猛,成为“科学”的潜台词;人文社会科学则有被边缘化的趋势。一方面是自然科学和工程技术对社会生产的作用越来越大,社会地位越来越高,社会对科学技术的人力、物力资源投入越来越多,对科学技术的社会控制也越来越强,呈现出“大科学”的态势。另一方面,人文社会科学的发展远远落后于科学技术的发展,仍然保留了一定的“小科学”特征。人们按照对“科学”,实际上是按照对“自然科学”的定义来裁量人文社会科学,出现了明显的不适应。
当然这不等于说,不能对人文社会科学施加外部的影响和控制,如基金项目资助等。人们可以对人文社会科学研究实施英国高等教育评鉴(RAE)式的外部评价。但是,将学术性的评价与非学术性的评价活动分开,坚持“学术评价”的学术性,并维护学术自由的传统——这似乎是一条底线。因为就算是RAE,也是委托各学科领域的同行专家对各大学的系科进行评议,本质上也是学术界的自我评价,只不过RAE将这种过程组织化、集中化和公开化了。
将学术性评价与非学术性评价分开,坚持“学术评价”的学术性,并维护学术自由、自主的传统,也就是在尊重人文社会科学研究的客观规律及其“小科学”特性,保护人文社会科学研究的“学术生态环境”。为了维护学术自由传统,可能会有一些效率上的损失,但为长远计,这是必需的。以生态环境为例,害虫固然可以全部杀死,但环境污染了,地上不长庄稼了,就更不划算。尤其在“大科学”态势和市场经济条件下,更有必要好好研究和尊重学术研究固有的发展规律,增强学术评价的学术性,维护学术自治与独立。否则,恐怕很难抑制目前的学术功利、学术浮躁、学术“通货膨胀”等现象。
2、人文社会科学学术规范及学术评价的环境
学术规范是学术评价有效性的基础。假如学术规范未能得到普遍遵循,那么人文社会科学研究及其评价的基本环境就受到了破坏,许多在正常情况下默认成立的假设前提将不再成立(如学术成果的发表标志着学术同行对研究工作质量的认可、竞争性项目申请是对高水平研究的筛选等);而即使具有“客观、公正”形式的定量化评价考核方式,也不能挽救学术评价的失效和学术的失范。
作为一种定量评价考核标准,SCI、核心期刊为什么会“水土不服”,遭到众多人文学者的反对?量化考评方法为什么会受到众多学者的批判?如果说,定量统计只停留在宏观层面,并不直接与研究资源的分配挂钩,也不与机构、个人的利益挂钩,那就肯定不会存在什么问题; 如果说,在微观上学术规范得到了普遍遵循,SCI、核心期刊充当了可靠的质量控制“门槛”,那么即使将它们用于微观学术评价之中,也不应该会有什么大的问题。遗憾的是,一方面是大量存在的学术失范行为,另一方面又试图借助外部的力量(学术界以外的因素,如行政力量)和看似“客观、公正”的量化评价考核办法来纠正,却并没有达到预想的目的。
郑永流说,“学术成果的生产者,如果他们没有项目,可以准确地说,不拥有任何生产资料,对人、财、物概无支配权。绝大多数人甚至连一张办公桌都没有,是精神生产的‘无产阶级’。当然,人文社会科学研究对自由的学术环境的依赖甚于有形的生产资料,一些传世之作并非‘资助’出来的。但既然国家和社会有能力投入,那就要使学术成果的生产者通过其职务自动拥有必要的生产资料,无需再行申请。由于这些部门对学术研究资源的垄断,跑‘部’前进一直是大学校长的必修课。”在德国,只要取得了教授头衔,的确是自动取得科研资助、助手配备等资源的;而副教授、助教等在科研课题中大多是充当教授的助手。但目前在世界上大多数国家,并没有采用德国的这种体制。笔者认为,这实际上表明了在世界上的大多数国家,微观的科学运行规范体系、科学分层体系基本处于失效状态。因此,才需要在教授等职务之上。又对项目资助等研究资源的获取另设很高的“门槛”——这种“门槛”从根本上说是表达了对学术规范、学术自主性的质疑,对科学家管理科学界内部事务能力的不信任。朱寿桐也表达了类似的看法,认为是学术规范得不到普遍遵循,才导致学术评价失去了明确的标准。进而导致行政主导学术评价和学术评价的非学术化倾向。
学术规范状况影响到学术评价的基础环境和评价的有效性;反过来说,学术评价制度和方法,也影响到学术规范的状况。“鸡生蛋”还是“蛋生鸡”,这两者之间的互动关系颇值得玩味。学术规范状况是一个无形的总体环境,短期内不是人力可以作为的领域;而改进学术评价的方法、制度,则是有形的,可以有所作为的。所以问题的关键还是要改善学术评价与管理体制,从而把握枢纽,牵一而动万。笔者认为,当前构建人文社会科学研究评价体系的原则,是要“正本清源”,回归“学术本位”;应该借助科学的评价体系,适当提高人文社会科学研究的从业门槛,按照纯粹“学术性”的要求(研究质量、水平)设立科学分层机制,避免“泥沙俱下”和“鱼目混珠”,扭转学术普遍失范的现象。在这方面,英国高等教育评鉴(RAE)的做法,及北大、清华的“代表作”评价办法,值得-思考与借鉴。
3、关于“元评价”
当前国内学术界对于人文社会科学研究评价本质与规律的认识,尚未达到系统、深入、完整的地步。主要表现在:评价理论与实践中的唯科学主义、“工具至上”主义思维甚嚣尘上,管理操作的观点主导了评价实践;对于评价主体、评价目的、评价标准认识不清,各种评价方法、指标任意套用,或者笼而统之搞“综合”的现象比较多;对于评价的复杂性、被评价方的主观能动性、各评价要素之间的互涉性、特定评价方法或指标可能造成的负面后果估计不足。
在人文社会科学研究评价的具体环境下,搞清楚评价的目的、目标,主体及其相应的需求是很重要的。对于评价是否科学、合理,具有决定性的作用。否则,即使是形式上再“公正”的评价方法和程序,也不可能是真正做到“公正”的。象把数量当水平(比发文数量评教授)、把投人当效益(科研项目和科研经费的多少)的做法,在某些特定环境下并非全无道理;然而在其他更多特定环境下,却是荒谬可笑、不合逻辑、经不起推敲的。所以应该仔细分析评价的目的、主体、需求、标准等要素,根据具体环境有针对性地设计评价指标、方法与程序,努力克服“工具至上”式的思维,避免不同类型评价方法、指标的任意搬用。
当前的功利与浮躁情绪,不仅表现在评价指标的数量化导向上,也反映在评价方法、指标本身的形成程序上。蒋国华曾经指出,早期的诸计量学量化指标主要是用于为了科学决策而开展的科学质量和科学发展趋势的研究,也就是宏观层面的应用;应用于科学家个人成就的评估,是后来的事。在科学计量学的理论研究方面,西方发达国家自始至终走在前列;而在实践运用科研计量评价方法方面,前东欧社会主义国家却更加积极、激进,西方发达国家则显得保守。至今为止,美国、英国仍然实行以同行评议为主的科学研究评价体制。笔者认为,西方发达国家这种“慢决策,快执行”的谨慎态度,值得我们学习。
谨慎的态度,要求有相应的“元评价”机制。对于一切量化评价方法、指标,以及同行评议的方法、程序,或者如数据库、网络等现代化技术手段,不管新的或旧的,应该持一种开放的、批判的态度。在不同的具体环境下,允许不同的评价方法、指标进行一定程度的试验,但在得到公认、发展成熟之前,使用应该谨慎。在不同的评价机构、评价方法、评价指标、评价标准、评价程序之间,应该存在一种开放、有序的竞争机制,最终让优异者在竞争中脱颖而出。这种开放的环境和态度,本身就是一种“元评价”机制。但与此同时,需要警惕“工具至上”思维和简单的“拿来主义”,认真区分研究性评价和实践性评价;注意实践性评价的要求,对于任何应用于大规模评价实践的评价指标体系、评价方法、评价程序等,一定要经过实验的反复检验,证明比较成熟、可靠才行。为此,建立类似评价行业协会等有形的“元评价”体系也是极有必要的,其作用就在于对于各类评价机构、评价专家、评价方法、评价程序等进行研究、管理、规范和认证,加强评价活动本身的规范性。
4、结语
笔者十分赞同朱寿桐的看法,即:坚持学术评价的“学术性”,用学术标准来衡量学术,这是解决当前文科学术评价问题的关键。而对于“评价”本身,也应该走出纯粹经验主义和工具主义的误区,逐渐建立“元评价”机制和体系,使“评价”从一种经验性的“操作”,走向规范和“科学”。