论文部分内容阅读
【摘 要】员工绩效考评是现代企业人力资源管理工作科学化的基础与手段,员工绩效考评结果的质量关系到企业人力资源管理工作的科学性与公平性,也成为广大员工十分关心的工作。本文阐述了对员工绩效考评结果的质量进行检验的具体方法。
【关键词】员工绩效考评;可信度;有效度;误差
【Abstract】Personnel evaluation is the foundation and method of scientific human resources management in modern enterprise. The quality of its result has relation to scientificity and impartiality of human resources management, which becomes a major concern for all the employees. This paper expounds specific methods that test the quality of personnel evaluation result.
【Key words】Personnel Evaluation;Reliability;Availability;Error
員工绩效考评是现代企业管理的一项经常性工作,是现代企业人力资源管理工作科学化的基础与手段,员工绩效考评的结果是企业决定员工奖惩、晋升和劳动报酬发放的依据,涉及到员工的切身利益,也成为广大员工十分关心的工作。员工绩效考评结果的质量直接关系到企业人力资源管理工作的科学性与公平性,因此,加强对员工绩效考评结果的检验,提高员工绩效考评结果的质量是一项十分重要的工作。员工绩效考评结果质量检验的指标主要包括可信度、有效度、区分度、适合度、独立性等。
一、可信度
考评结果的准确性反映可信度的高低,对于这种准确性的检验可以运用再测信度分析、复本信度分析、一致性信度分析与考评者信度分析等方法。
(一)再考信度
假定在市场买了20公斤大米后感觉重量不够,到公平秤上再行称量,如果也是20公斤,那他就会觉得大米确实有20公斤,因为两次称得的结果完全一样,这说明此时变异程度为0。
考评结果以同样的考评工具、考评方式与考评对象再次考评获得结果的变异程度是对再考性度的具体反应。
而员工绩效考评则没那么简单,会涉及到许多因素,考评标准有时也无法准确定义,因此很难像商品重量那样以两次称得结果之差来反映其准确性。通常是把对个别考评结果的准确性检验置于群体考评结果的相互关系之中,转化为两次位置关系的一致性分析。当同一对象的考评结果以同样的考评方式再次获得后,其顺序位置关系变异较小时,则说明考评结果比较准确。
如果在技能考评中李某的分数是92,在全体被考者中排第二位,这到底准不准呢?我们再重复考评一次,结果李某的分数是87分,还是排第二名,而且其他被考的位置顺序变化很小,那么可以说第一次的技能考评结果是很可靠的。
对于这种位置关系一致性的比较,最为简单的方法是计算两次考评结果的积差相关系数。公式如下:
式中:N=两次考评结果数据配对总数;
x =被分析的考评结果(分数);
y =重复考评得到的考评结果(分数)。
r越接近1则说明考评结果(x)越准确可靠,越可信。
在对某次品德考评的分数的可靠性进行考评中,随机抽取了10个被考的分数,它们分别是:
73 71 80 84 76 77 78 68 74 75
重新考评后,10个被考的分数分别是:
83 75 81 90 82 88 87 84 80 86
先把这两组分数按照被考两两配对,计算方法如下:
代入公式得:
经统计检验,相关系数未达到显著水平,因此该次品德考评分数不太可靠。
(二)复本信度
考评给果相对另一种非常相同的考评的结果的变异程度。“非常相同”,指在考评内容、效度、要求、形式上都一样,可以说其中一个考评可以看作是另一个考评的近似复写或重复。因此复本信度是一种用等值系数(即两组考评结果的相关系数)表示的信度。
在对10个被考评对象的考评中,他们接受了一次技能水平的观察评定,名次分别是:
1 2 3 4 5 6 7 8 9 10
为了检验上述考评结果的可靠性又同时进行了另一次等值的技能观察评定,10个被考对象得到的对应名次分别是:
3 2 1 4 5 6 10 6 9 8
可以用下列等级相关公式求出等值系数:
式中:N=考评结果的总个数(被考人数);
D=对应同一个被考两次评定等级(名次)的差,一般以被检验的考评结果为被减数。在本例中10个被考的等级差分别为:
-2 0 2 0 0 0 -3 2 0 2
代入公式有:
经统计检验,相关系数达到显著水平,因此第一次所作的观察评定结果比较可靠。
(三)一致性信度
考评对象在考评项目分数间的一致性程度。如果被考在第一个项目上比其他人分数高,在第二个项目上又比其他人高,在第三个项目上也比其他人高……,相反另一个人在第一个项目上比其他人的分数低,在第二个项目上又比其他人的分数低,在第三个项目上也比其他人的分数低,那么,毫无疑问,我们会认为考评结果比较可靠。
对这种信度的分析,常用系数分析法。系数分析,实际上是通过克朗巴赫公式计算一致性系数。公式如下: 某组被考在评价中心考评过程中,分别接受了数种考评,统计结果如下表。
上述所有考评都是考评管理能力。共有6个项目,因此代入公式有:
经统计检验,达到显著水平以上,因此可以说该次评价中心所获得的考评结果是较可靠的。
(四)考评者信度
员工绩效考评结果的差异程度来自两个方面,一是被考本身,另一是考评者及其考评。这里是以后者作为依据,当考评者及其考评的无关差异越小,说明考评结果就越可靠。
评分者信度分析,一般采用肯德尔和谐系数公式计算出信息系数:
二、有效度
有效度,是指考评结果对所考评对象反映的真实程度。包括内容效度、关联效度和结构效度。
(一)内容效度
实际考评到的内容与我们所想考评内容的一致性程度。当实际所考评到的内容与我们事先所想考评的内容越趋于一致时,则说明考评结果的内容效度越高,考评结果就越有效。
内容效度的分析,可以从两个方面分析:(1)是否包括了所考评对象中的各种成分;(2)包括在考评范围内的行为样本的比例结构是否与工作分析的结果相一致。如果包含于员工绩效考评范围内的行为样本,没有遗漏任何重要的成分,所考对象中的每一种基本成分,都没有被忽略或过分地强调,则考评结果在内容上与所考对象是相一致的,考评结果具有很高的内容效度。
内容效度的分析主要是定性方法。一般地,采取专家比较判断法,由多位专家分析,评判是否有内容效度,再按照下列公式计算。
(二)结构效度
实际所考评的结果与我们所想考评对象的同构程度。这是人员考评中人们最为关心的一种效度,因为人员考评具有间接性。人们总是通过选取一些具体的行为考评来推断实际的对象水平。因此必然会出现“你所观察到的行为是否表明了被考者真实的水平呢?”等疑问,这是雇主、管理者与被考评者对考评结果有效性最为关心的问题。
结构效度,与检验人员对考评对象结构的理解有直接關系。如果李某认为忠诚这一素质是对本企业的忠诚,张某认为忠诚这一素质主要表现为实事求是的态度,那么当向其他企业说明本企业产品所存在的问题时,显然李某与张某会把它归类到不同的素质成分中并给予不同的评价。可见结构效度的检验分析是一种定性的主观判断,应把主观影响性控制在最低限度。
(三)关联效度
考察考评结果与某种标准结果的一致性程度,就要对关联效度进行分析,而关键在用来衡量考评有效性的参照标准即效标的选择。效标可以细分为观念效标与行为效标。选拔考评管理人员的观念效标是“优秀管理者”,对于什么是优秀管理者,可能智者见智、仁者见仁,众说纷纭,效度也就无法分析。我们必须把观念效标具体化与可操作化,可用专家对优秀管理人员评定的分数、群众的选票或产值利润指标等量化结果作为行为效标,进行效度分析。如果一个理想的观念效标,找不到合适的行为效标进行具体化与操作化,是毫无意义的。所以可以通过客观性存在的学术成就、特殊训练成绩、实际工作表现与成绩、团体特征、等级评定结果等行为作为效标选择基准。
三、项目分析
考评结果(分数)几乎都是由考评指标、考评项目、考评试题等项目得分综合而成的,项目质量的好坏直接影响到考评结果的真实性、正确性与准确性。效度与信度的分析,是直接对考评结果质量的考查,而项目分析,则是间接地对考评结果做微观性解剖。项目质量好,则对应的考评得分就有效正确,从而整个的考评结果也就正确与可靠。项目质量的考评通过适合度、区分度、独立性、选项质量等主要指标来不断完善。
(一)适合度
对于员工绩效考评来说,项目不仅仅是试题,更多的是一些咨询问题或观察评定点(指标),它们无难易之分,而只有是否适合之别。
适合度,特指被考者行为(包括回答与实际表现)符合项目考评标准的程度。当项目为试题时,被考者的行为是口头回答或选项回答,项目考评标准即正确答案,符合程度即难度;当项目为观察评定量表中的指标时,被考者的行为即为其实际表现行为,项目考评标准即量表中规定的评分标准,符合程度即指所有被考得分平均值与指标满分值之比。
P=适合度,P越接近1,说明项目越适合被考,P越接近0,说明项目越不适合被考。
例如,在管理素质考评中,指挥协调能力这项指标满分为10分,而7个被考者在面试中的平均得分是8,则该项指标的适合度为P=0.8
在业绩考评中,某单项考评指标有40人达标,其余10人未达标。那么该项指标的适合度为:
(二)区分度
项目把具有不同水平的考评对象区分开来的鉴别能力。
区分度在选择性考评中非常重要,区分度高的项目往往可以很明显地把素质优秀的人员与一般的人员区分开来。区分度分析与适合度一样,不同性质的项目会有不同的方法。对于二值计分的项目(要么满分要么零分),可以采取点双列相关系数公式来计算:
对非二值评分的项目,则可以采取积差相关公式,项目得分与总分的相关系数揭示项目区分度的大小。相关系数越大则说明项目区分度越高。
(三)独立性
在能力考评中,常常要求项目之间具有一定的独立性。独立性即非相关性。例如,有10个项目的测验,每个项目都是中等难度(p=q=0. 5),而且所有项目互相完全相关(r=1),那么在一个项目上答对的人在其他项目上也必然对,而在一个项目上答错的人则在其他项目上也必然错。这样测评结果只有两种可能,0分或10分(每题一分)。这种测验无法把中间水平的人区分开来。
项目的独立性分析,一般用项目间分数的相关系数来表示。当相关系数越大时,则说明独立性越小。
在某项测试中,A题与B题同时做对的人数有15个,同时做错的人有21个,做对B题而做错A题的人有26个,做对A题而做错B题的人有29个,试分析A题与B题的相互独立性。 1.列表。
2.计算系数。
3.进行相关性的显著性检验。
经统计检验表明,为非显著性相关。因此A题与B题具有较好的独立性。
(四)选项质量
在能力考评中大部分采用的项目,都是选择题形式,选择项中诱答题或正答题拟定得好坏直接决定着整个试题的质量及其分数的可信性。诱惑力实际还揭示了选项的区分力与试题的难度。如果某选择题中的大多数选项的诱惑力都很强,那么这个题就是一个比较难的试题了。
四、其他质量指标的检验
(一)客观性
考评结果的客观性由考评方法的客观性与考评者的客观性两方面构成。
考评方法的客观性指它对考评者主观影响的控制程度。一般来说,客观的考评方法对操作者的经验没有什么特别的要求,操作越简单,越容易把握,考評结果就越客观;同时考评的内容越单一则越准确。
考评者的客观性可以通过比较其考评结果与其他人的考评结果来分析。既可以用该考评者考评结果与其他人考评结果的平均数之差来反映这种客观性,也可以用他和其他人考评的平均结果之间的相关系数来表示。
(二)总体分布与水平
总体分布是指考评结果在各水平层次上的分布情况,其分布内容主要是统计各个分数段上的人数分布。包括最高分、最低分、偏态与峰态等情况。总体水平,一般指对考评结果集中量的分析,内容包括众数,平均数,重要指标上的得分情况等。
(三)区分性与差异性
考评、尤其选拔性考评,目的是通过考评把不同水平的被考者相互区分开来。考评结果的区分性则反映这种要求的满足程度。考评结果区分性一般通过其差异性的分析来表示,考评结果的差异性分析,包括两极差、四分差、平均差、方差、标准差、差异系数等指标内容,其中标准差、方差与差异系数比较常用。
(四)误差
误差是指通过考评结果的定性定量分析,判断考评结果是否受到心理效应的严重影响指标,以及单个考评结果的置信区间。
1.心理效应误差种类与分析。
(1)哈罗效应误差
哈罗效应又称晕轮效应,考评者往往会因为对被考者整体印象的好坏而影响他对每个指标的考评。如看到一个人相貌端庄、严肃,就容易产生此人责任感很强的看法。由哈罗效应引起的误差,叫哈罗效应误差。
上表考评结果比较可见,考评者A的考评结果明显受到哈罗效应的影响。
哈罗效应还表现为因对某个重要因素的印象好坏而对整体评价产生影响,所谓一好百好,一丑百丑,显然这是一种泛化影响。
(2)趋中心理误差。趋中心理误差,是指因为考评者既不愿把被考评得过好,也不愿评得过差而过于集中在中间分数段产生的误差。这种误差使有差异的被考得到相近的分数,缺乏区分性。
(3)宽大心理误差。宽大心理误差是指因考评者不坚持考评的标准要求,就高不就低地考评而产生的误差。这种误差表现为皆大欢喜、高分低能。
另一种负向宽大心理误差,则是过于严格,以一些脱离实际高标准去考评人或事,考评结果普遍较低。
(4)逻辑误差。逻辑误差指考评者不是实事求是地对每个对象独立地考评,而是依据其相关性特点进行逻辑上的推断。它与哈罗效应的区别在于后者是以印象为依据,而前者以逻辑关系为依据。控制这种误差的方法是以客观事实为依据,将特征上存在逻辑关系的指标间隔开,不要放在一起。
2.标准误与置信区间。标准误,指的是样本的变化性,是对考评结果误差的数值描述,是反映实得分数在真分数附近变异的一个指标。
真分数即反映被考者实水平的那个分数。由于考评误差存在的客观性,我们无法求得真分数,能做到的就是用实得分数去推测真分数。
推侧的方法是在所给定的可靠度要求下分析真分数与实得分数的差异范围。如果选择a=0.05或者说95%的可靠性水平要求,那么真分数与实得分数差异的范围大约在上下1.96个标准误差之间,这个区间我们把它称之为实得分数的置信区间。因为它表明了实得分数的可信度水平及范围。
标准误的计算公式如下:
式中:
=标准误;
x=考评结果;
=全体考评结果平均数;
N=考评结果总个数。
如果采取观察评定法,考评者考评了10名被试员工,其分数分别为96,72,46,93, 68, 93, 82, 91,95,67,假定在99%的把握水平上认为71分反映了所对应被考评员工真实水平,那么此时的可信区间应该如何确定。
(1)计算平均分数
(2)计算标准误
(3)求对应置信(系数)水平(99%)的t值
因为=10-1=9,=1-99%=0.01,查t分布表得:
(4)求出置信区间
这就是说,得71分的被考评员工,其真实水平大约是53.97分与88.03分中的某一个分数,如果从中抽出100个数大约有99个是对的。在实际工作中,由于员工绩效考评受主、客观因素的影响,员工绩效考评结果与实际情况不完全符合,所以有时应综合运用上述方法对考评工作质量进行具体分析,采取切实可行的纠偏措施,以提高员工绩效考评结果的准确性与公正性是一项十分重要的工作,也是现代企业人事管理中值得进一步研究的课题。
参考文献:
[1]萧鸣政,现代员工绩效考评技术及其应用,中国人民大学出版社,1997年.
[2](日)弥富贤之 著,王中楼等译,企业人事评价,陕西师范大学出版社2002年.
[3](美)G·小史密斯著,郭光炽等译,劳动量测定,机械工业出版社,2000年.
作者简介:
唐国银(1969—),男,安徽池州人,安徽财贸职业学院,副教授,研究生,研究方向:企业管理方向。
【关键词】员工绩效考评;可信度;有效度;误差
【Abstract】Personnel evaluation is the foundation and method of scientific human resources management in modern enterprise. The quality of its result has relation to scientificity and impartiality of human resources management, which becomes a major concern for all the employees. This paper expounds specific methods that test the quality of personnel evaluation result.
【Key words】Personnel Evaluation;Reliability;Availability;Error
員工绩效考评是现代企业管理的一项经常性工作,是现代企业人力资源管理工作科学化的基础与手段,员工绩效考评的结果是企业决定员工奖惩、晋升和劳动报酬发放的依据,涉及到员工的切身利益,也成为广大员工十分关心的工作。员工绩效考评结果的质量直接关系到企业人力资源管理工作的科学性与公平性,因此,加强对员工绩效考评结果的检验,提高员工绩效考评结果的质量是一项十分重要的工作。员工绩效考评结果质量检验的指标主要包括可信度、有效度、区分度、适合度、独立性等。
一、可信度
考评结果的准确性反映可信度的高低,对于这种准确性的检验可以运用再测信度分析、复本信度分析、一致性信度分析与考评者信度分析等方法。
(一)再考信度
假定在市场买了20公斤大米后感觉重量不够,到公平秤上再行称量,如果也是20公斤,那他就会觉得大米确实有20公斤,因为两次称得的结果完全一样,这说明此时变异程度为0。
考评结果以同样的考评工具、考评方式与考评对象再次考评获得结果的变异程度是对再考性度的具体反应。
而员工绩效考评则没那么简单,会涉及到许多因素,考评标准有时也无法准确定义,因此很难像商品重量那样以两次称得结果之差来反映其准确性。通常是把对个别考评结果的准确性检验置于群体考评结果的相互关系之中,转化为两次位置关系的一致性分析。当同一对象的考评结果以同样的考评方式再次获得后,其顺序位置关系变异较小时,则说明考评结果比较准确。
如果在技能考评中李某的分数是92,在全体被考者中排第二位,这到底准不准呢?我们再重复考评一次,结果李某的分数是87分,还是排第二名,而且其他被考的位置顺序变化很小,那么可以说第一次的技能考评结果是很可靠的。
对于这种位置关系一致性的比较,最为简单的方法是计算两次考评结果的积差相关系数。公式如下:
式中:N=两次考评结果数据配对总数;
x =被分析的考评结果(分数);
y =重复考评得到的考评结果(分数)。
r越接近1则说明考评结果(x)越准确可靠,越可信。
在对某次品德考评的分数的可靠性进行考评中,随机抽取了10个被考的分数,它们分别是:
73 71 80 84 76 77 78 68 74 75
重新考评后,10个被考的分数分别是:
83 75 81 90 82 88 87 84 80 86
先把这两组分数按照被考两两配对,计算方法如下:
代入公式得:
经统计检验,相关系数未达到显著水平,因此该次品德考评分数不太可靠。
(二)复本信度
考评给果相对另一种非常相同的考评的结果的变异程度。“非常相同”,指在考评内容、效度、要求、形式上都一样,可以说其中一个考评可以看作是另一个考评的近似复写或重复。因此复本信度是一种用等值系数(即两组考评结果的相关系数)表示的信度。
在对10个被考评对象的考评中,他们接受了一次技能水平的观察评定,名次分别是:
1 2 3 4 5 6 7 8 9 10
为了检验上述考评结果的可靠性又同时进行了另一次等值的技能观察评定,10个被考对象得到的对应名次分别是:
3 2 1 4 5 6 10 6 9 8
可以用下列等级相关公式求出等值系数:
式中:N=考评结果的总个数(被考人数);
D=对应同一个被考两次评定等级(名次)的差,一般以被检验的考评结果为被减数。在本例中10个被考的等级差分别为:
-2 0 2 0 0 0 -3 2 0 2
代入公式有:
经统计检验,相关系数达到显著水平,因此第一次所作的观察评定结果比较可靠。
(三)一致性信度
考评对象在考评项目分数间的一致性程度。如果被考在第一个项目上比其他人分数高,在第二个项目上又比其他人高,在第三个项目上也比其他人高……,相反另一个人在第一个项目上比其他人的分数低,在第二个项目上又比其他人的分数低,在第三个项目上也比其他人的分数低,那么,毫无疑问,我们会认为考评结果比较可靠。
对这种信度的分析,常用系数分析法。系数分析,实际上是通过克朗巴赫公式计算一致性系数。公式如下: 某组被考在评价中心考评过程中,分别接受了数种考评,统计结果如下表。
上述所有考评都是考评管理能力。共有6个项目,因此代入公式有:
经统计检验,达到显著水平以上,因此可以说该次评价中心所获得的考评结果是较可靠的。
(四)考评者信度
员工绩效考评结果的差异程度来自两个方面,一是被考本身,另一是考评者及其考评。这里是以后者作为依据,当考评者及其考评的无关差异越小,说明考评结果就越可靠。
评分者信度分析,一般采用肯德尔和谐系数公式计算出信息系数:
二、有效度
有效度,是指考评结果对所考评对象反映的真实程度。包括内容效度、关联效度和结构效度。
(一)内容效度
实际考评到的内容与我们所想考评内容的一致性程度。当实际所考评到的内容与我们事先所想考评的内容越趋于一致时,则说明考评结果的内容效度越高,考评结果就越有效。
内容效度的分析,可以从两个方面分析:(1)是否包括了所考评对象中的各种成分;(2)包括在考评范围内的行为样本的比例结构是否与工作分析的结果相一致。如果包含于员工绩效考评范围内的行为样本,没有遗漏任何重要的成分,所考对象中的每一种基本成分,都没有被忽略或过分地强调,则考评结果在内容上与所考对象是相一致的,考评结果具有很高的内容效度。
内容效度的分析主要是定性方法。一般地,采取专家比较判断法,由多位专家分析,评判是否有内容效度,再按照下列公式计算。
(二)结构效度
实际所考评的结果与我们所想考评对象的同构程度。这是人员考评中人们最为关心的一种效度,因为人员考评具有间接性。人们总是通过选取一些具体的行为考评来推断实际的对象水平。因此必然会出现“你所观察到的行为是否表明了被考者真实的水平呢?”等疑问,这是雇主、管理者与被考评者对考评结果有效性最为关心的问题。
结构效度,与检验人员对考评对象结构的理解有直接關系。如果李某认为忠诚这一素质是对本企业的忠诚,张某认为忠诚这一素质主要表现为实事求是的态度,那么当向其他企业说明本企业产品所存在的问题时,显然李某与张某会把它归类到不同的素质成分中并给予不同的评价。可见结构效度的检验分析是一种定性的主观判断,应把主观影响性控制在最低限度。
(三)关联效度
考察考评结果与某种标准结果的一致性程度,就要对关联效度进行分析,而关键在用来衡量考评有效性的参照标准即效标的选择。效标可以细分为观念效标与行为效标。选拔考评管理人员的观念效标是“优秀管理者”,对于什么是优秀管理者,可能智者见智、仁者见仁,众说纷纭,效度也就无法分析。我们必须把观念效标具体化与可操作化,可用专家对优秀管理人员评定的分数、群众的选票或产值利润指标等量化结果作为行为效标,进行效度分析。如果一个理想的观念效标,找不到合适的行为效标进行具体化与操作化,是毫无意义的。所以可以通过客观性存在的学术成就、特殊训练成绩、实际工作表现与成绩、团体特征、等级评定结果等行为作为效标选择基准。
三、项目分析
考评结果(分数)几乎都是由考评指标、考评项目、考评试题等项目得分综合而成的,项目质量的好坏直接影响到考评结果的真实性、正确性与准确性。效度与信度的分析,是直接对考评结果质量的考查,而项目分析,则是间接地对考评结果做微观性解剖。项目质量好,则对应的考评得分就有效正确,从而整个的考评结果也就正确与可靠。项目质量的考评通过适合度、区分度、独立性、选项质量等主要指标来不断完善。
(一)适合度
对于员工绩效考评来说,项目不仅仅是试题,更多的是一些咨询问题或观察评定点(指标),它们无难易之分,而只有是否适合之别。
适合度,特指被考者行为(包括回答与实际表现)符合项目考评标准的程度。当项目为试题时,被考者的行为是口头回答或选项回答,项目考评标准即正确答案,符合程度即难度;当项目为观察评定量表中的指标时,被考者的行为即为其实际表现行为,项目考评标准即量表中规定的评分标准,符合程度即指所有被考得分平均值与指标满分值之比。
P=适合度,P越接近1,说明项目越适合被考,P越接近0,说明项目越不适合被考。
例如,在管理素质考评中,指挥协调能力这项指标满分为10分,而7个被考者在面试中的平均得分是8,则该项指标的适合度为P=0.8
在业绩考评中,某单项考评指标有40人达标,其余10人未达标。那么该项指标的适合度为:
(二)区分度
项目把具有不同水平的考评对象区分开来的鉴别能力。
区分度在选择性考评中非常重要,区分度高的项目往往可以很明显地把素质优秀的人员与一般的人员区分开来。区分度分析与适合度一样,不同性质的项目会有不同的方法。对于二值计分的项目(要么满分要么零分),可以采取点双列相关系数公式来计算:
对非二值评分的项目,则可以采取积差相关公式,项目得分与总分的相关系数揭示项目区分度的大小。相关系数越大则说明项目区分度越高。
(三)独立性
在能力考评中,常常要求项目之间具有一定的独立性。独立性即非相关性。例如,有10个项目的测验,每个项目都是中等难度(p=q=0. 5),而且所有项目互相完全相关(r=1),那么在一个项目上答对的人在其他项目上也必然对,而在一个项目上答错的人则在其他项目上也必然错。这样测评结果只有两种可能,0分或10分(每题一分)。这种测验无法把中间水平的人区分开来。
项目的独立性分析,一般用项目间分数的相关系数来表示。当相关系数越大时,则说明独立性越小。
在某项测试中,A题与B题同时做对的人数有15个,同时做错的人有21个,做对B题而做错A题的人有26个,做对A题而做错B题的人有29个,试分析A题与B题的相互独立性。 1.列表。
2.计算系数。
3.进行相关性的显著性检验。
经统计检验表明,为非显著性相关。因此A题与B题具有较好的独立性。
(四)选项质量
在能力考评中大部分采用的项目,都是选择题形式,选择项中诱答题或正答题拟定得好坏直接决定着整个试题的质量及其分数的可信性。诱惑力实际还揭示了选项的区分力与试题的难度。如果某选择题中的大多数选项的诱惑力都很强,那么这个题就是一个比较难的试题了。
四、其他质量指标的检验
(一)客观性
考评结果的客观性由考评方法的客观性与考评者的客观性两方面构成。
考评方法的客观性指它对考评者主观影响的控制程度。一般来说,客观的考评方法对操作者的经验没有什么特别的要求,操作越简单,越容易把握,考評结果就越客观;同时考评的内容越单一则越准确。
考评者的客观性可以通过比较其考评结果与其他人的考评结果来分析。既可以用该考评者考评结果与其他人考评结果的平均数之差来反映这种客观性,也可以用他和其他人考评的平均结果之间的相关系数来表示。
(二)总体分布与水平
总体分布是指考评结果在各水平层次上的分布情况,其分布内容主要是统计各个分数段上的人数分布。包括最高分、最低分、偏态与峰态等情况。总体水平,一般指对考评结果集中量的分析,内容包括众数,平均数,重要指标上的得分情况等。
(三)区分性与差异性
考评、尤其选拔性考评,目的是通过考评把不同水平的被考者相互区分开来。考评结果的区分性则反映这种要求的满足程度。考评结果区分性一般通过其差异性的分析来表示,考评结果的差异性分析,包括两极差、四分差、平均差、方差、标准差、差异系数等指标内容,其中标准差、方差与差异系数比较常用。
(四)误差
误差是指通过考评结果的定性定量分析,判断考评结果是否受到心理效应的严重影响指标,以及单个考评结果的置信区间。
1.心理效应误差种类与分析。
(1)哈罗效应误差
哈罗效应又称晕轮效应,考评者往往会因为对被考者整体印象的好坏而影响他对每个指标的考评。如看到一个人相貌端庄、严肃,就容易产生此人责任感很强的看法。由哈罗效应引起的误差,叫哈罗效应误差。
上表考评结果比较可见,考评者A的考评结果明显受到哈罗效应的影响。
哈罗效应还表现为因对某个重要因素的印象好坏而对整体评价产生影响,所谓一好百好,一丑百丑,显然这是一种泛化影响。
(2)趋中心理误差。趋中心理误差,是指因为考评者既不愿把被考评得过好,也不愿评得过差而过于集中在中间分数段产生的误差。这种误差使有差异的被考得到相近的分数,缺乏区分性。
(3)宽大心理误差。宽大心理误差是指因考评者不坚持考评的标准要求,就高不就低地考评而产生的误差。这种误差表现为皆大欢喜、高分低能。
另一种负向宽大心理误差,则是过于严格,以一些脱离实际高标准去考评人或事,考评结果普遍较低。
(4)逻辑误差。逻辑误差指考评者不是实事求是地对每个对象独立地考评,而是依据其相关性特点进行逻辑上的推断。它与哈罗效应的区别在于后者是以印象为依据,而前者以逻辑关系为依据。控制这种误差的方法是以客观事实为依据,将特征上存在逻辑关系的指标间隔开,不要放在一起。
2.标准误与置信区间。标准误,指的是样本的变化性,是对考评结果误差的数值描述,是反映实得分数在真分数附近变异的一个指标。
真分数即反映被考者实水平的那个分数。由于考评误差存在的客观性,我们无法求得真分数,能做到的就是用实得分数去推测真分数。
推侧的方法是在所给定的可靠度要求下分析真分数与实得分数的差异范围。如果选择a=0.05或者说95%的可靠性水平要求,那么真分数与实得分数差异的范围大约在上下1.96个标准误差之间,这个区间我们把它称之为实得分数的置信区间。因为它表明了实得分数的可信度水平及范围。
标准误的计算公式如下:
式中:
=标准误;
x=考评结果;
=全体考评结果平均数;
N=考评结果总个数。
如果采取观察评定法,考评者考评了10名被试员工,其分数分别为96,72,46,93, 68, 93, 82, 91,95,67,假定在99%的把握水平上认为71分反映了所对应被考评员工真实水平,那么此时的可信区间应该如何确定。
(1)计算平均分数
(2)计算标准误
(3)求对应置信(系数)水平(99%)的t值
因为=10-1=9,=1-99%=0.01,查t分布表得:
(4)求出置信区间
这就是说,得71分的被考评员工,其真实水平大约是53.97分与88.03分中的某一个分数,如果从中抽出100个数大约有99个是对的。在实际工作中,由于员工绩效考评受主、客观因素的影响,员工绩效考评结果与实际情况不完全符合,所以有时应综合运用上述方法对考评工作质量进行具体分析,采取切实可行的纠偏措施,以提高员工绩效考评结果的准确性与公正性是一项十分重要的工作,也是现代企业人事管理中值得进一步研究的课题。
参考文献:
[1]萧鸣政,现代员工绩效考评技术及其应用,中国人民大学出版社,1997年.
[2](日)弥富贤之 著,王中楼等译,企业人事评价,陕西师范大学出版社2002年.
[3](美)G·小史密斯著,郭光炽等译,劳动量测定,机械工业出版社,2000年.
作者简介:
唐国银(1969—),男,安徽池州人,安徽财贸职业学院,副教授,研究生,研究方向:企业管理方向。