论文部分内容阅读
摘要:本文利用矩阵条件数诊断了教师综合素质评价指标的多重共线性,在此基础上建立了核主成分分析(KPCA)评价模型。与主成分分析(PCA)的对比结果表明,KPCA能够提取更少的成分反映原始指标的信息。
关键词:核主成分分析;综合素质;评价
中图分类号:G647 文献标识码:A 文章编号:1000-8136(2009)27-0005-02
教师综合素质评价是教育管理部门对教师进行全面公正客观考核的有效手段,在各级各类教育单位已经广为实施。为了加强学校教学工作管理,促进教师评价改革,适应新时代学校教育教学管理工作的需要,实现学校教育教学工作的规范化和科学化,提高教育教学质量,激励先进,鞭策后进,促进教师队伍素质的全面提高,使教育教学工作又好又快发展,建立一个比较公正客观的评价模型是非常必要的。目前用来进行教师综合素质评价的数学模型主要有:层次分析法[1]、模糊综合评判法[2]、主成分分析法[3]等。本文建立了教师综合素质评价的核主成分分析(Kernel Principal Component Analysis,简称KPCA)模型,为教师综合素质评价提供了一种新的方法。
1核主成分分析
核主成分分析是在确保系统原有数据信息量丢失最小的原则下,在各个变量相关关系研究的基础上,将多个变量的信息压缩为几个能反映原问题特征的综合变量指标,并据此特征信息指标对系统进行综合分析,可以有效地来处理变量间的非线性关系,为解决多指标的综合评价提供了一种很好的手段。[4]其基本思想是:通过一个非线性映射,将输入数据映射到一个特征空间,再在特征空间上进行线性主成分分析。
设有l为变量x1,x2,…,xl的n组观测数据:(xil,xi2,…,xil),i=1,2,…n,核主成分分析通过一个非线性函数φ(•)将样本x1,x2,…,xl映射到特征空间中。不妨假设特征空间中的样本Ф(x1),Ф(x2),…,Ф(xl)已标准化。为了在特征
空间中做主成分分析,计算协方差矩阵 ,求
出C的特征值λ≥0及相应的特征向量V∈F{0},满足λV=CV。由于特征值对应的非零特征向量都位于数据Ф(x1),Ф(x2),…,Ф(xl)的张集上,即V∈span{Ф(x1),…,Ф(xl)},所以存在一组系数α1,α 2,…,α l使得:
(1)
因此λV=CV等价于λ(Ф(xk)•V)=(Ф(xk)•CV),k=1,2,…,l。
由此得到:
,
k=1,2,…,l(2)
通过定义一个l×l的核矩阵 ,(2)式可写为Ka=lλa(3)
所以确定特征向量V而求取系数αi(i=1,…,M)的问题就仅依赖于特征值分解核矩阵K。
在F中归一化特征向量V,等价于λk(αk•αk)=1;而为
了放宽 的假设,这只需将核矩阵替换成 =K-IM K
-KIM+IM KIM,其中 。
最后提取主成分,采用下式计算Ф(x)在特征向量Vk上的投影
(4)
常用的核函数主要有径向基核函数K(x,y)=exp(-||x-y||2/2σ2)、多项式核函数K(x,y)=(x•y)d、Sigmoid核函数K(x,y)=tanh(γ(x•y)+θ)等,其中σ、d、γ、θ均为核参数。
核主成分分析的综合评价函数[5]为:
(5)
其中,r为提取的核主成分个数,ωk为第k个核主成分的贡献率。
核主成分分析的基本步骤[4]是:
step 1 将原始数据X标准化,记为X*;
step 2 将标准化后的数据矩阵X*进行核变换,记变换后的核矩阵为K;
step 3 按下式求矩阵K*:
K*=K-AK-KA+AKA
step 4 求矩阵K*/l的特征值λi和特征向量vi,i=1,2,…,l;
step 5 求出累计贡献率超过85 %的前n个主成分;
step 6 利用n个主成分对每个样本求出评价函数,进行综合评价。
2基于核主成分分析的教学质量评价
2.1样本数据
要对20名教师的业务素质进行综合评价。各位教师的综合素质评价指标值[3]如表1所示,其中,教学计划与备课X1,课堂讲授X2,考试成绩X3,辅导答疑教学改革X4,论文论著X5,科研项目X6,教书育人X7,获奖情况X8。
2.2多重共线性诊断
度量多重共线性严重程度的一个重要指标是方阵XTX的条
件数,即: 。
资助项目:湖北省教育厅科研项目(编号:Q20091809);武汉工业学院校项目(编号:08Y30)。
其中λmax(XTX),λmin(XTX)表示方阵XTX的最大、最小特征值。一般地,若k<100,则认为多重共线性程度很小;若100≤k≤1 000,则认为存在中等程度或较强的多重共线性;若k>1 000,则认为存在严重的多重共线性。
经计算,本问题的矩阵条件数k=11 063>1 000,可认为变量x1,x2,…,x8之间存在严重的多重共线性,可以利用核主成分对数据降维。
表1教师综合素质评价指标
教师
编号 教学情况 科研学术 工作态度
X1 X2 X3 X4 X5 X6 X7 X8
1 1 394 2 505 75 8 144 17 12 843 6
2 2 849 1 258 80 4 839 15 15 1 234 8
3 1 092 1 250 75 4 721 17 16 697 3
4 832 1 387 90 4 134 18 17 419 10
5 2 793 2 397 80 4 911 16 14 1 840 7
6 2 014 2 334 86 4 145 16 14 1 240 4
7 2 462 5 343 87 9 280 19 13 1 642 3
8 5 155 1 925 75 5 943 21 17 2 026 6
9 3 524 2 249 76 6 619 16 13 916 2
10 2 160 2 320 80 5 857 15 14 433 4
11 5 002 1 527 90 5 145 17 14 2 207 5
12 3 002 1 034 78 4 344 16 15 1 367 7
13 5 381 2 699 76 8 250 18 16 1 396 1
14 1 606 1 314 80 5 105 18 16 554 2
15 364 1 815 85 5 340 13 11 64 6
16 630 942 74 4 475 16 14 324 2
17 1 206 1 261 85 5 149 18 18 716 5
18 1 000 1 208 72 4 396 19 17 600 1
19 165 1 445 86 5 763 14 12 105 9
20 834 1 469 70 5 348 19 17 428 1
2.3利用核主成分分析提取变量的主成分
对样本数据进行核主成分分析,为便于比较,同时进行主成分分析。核主成分分析的核函数选择多项式核函数,即核函数为K(x,y)=(x•y)d。经试验,相应的核参数d=4。
表2KPCA和PCA前4个特征值及贡献率(%)
No 特征值 贡献率 / % 累计贡献率 / %
PCA KPCA PCA KPCA PCA KPCA
1 2.6 877 2.56e+32 33.5 958 80.034 33.5 958 80.034
2 2.1 909 5.47e+31 27.3 859 17.0 763 60.9 816 97.1 102
3 1.5 251 6.95e+30 19.0 643 2.1700 80.0 459 99.2 802
4 0.7 951 1.97e+30 9.9 389 0.6135 89.9 848 99.8 937
从表2可以看出,采用PCA的前4个主成分累积贡献率为89.9848 %,而采用KPCA方法前2个主成分累积贡献率就已经达到97.1102 %,因此KPCA获得了比PCA更好的降维效果。
由KPCA求出每位教师的综合得分以及排序如表3所示。为便于对比,表3同时给出了PCA综合得分和PCA综合排名。
表3教师综合素质评价排名
教师
编号 核主成分F1 核主成分F2 PCA
综合
得分 PCA
综合排名 KPCA
综合
得分 KPCA
综合
排名
分值 排
序 分值 排
序
1 -1.7 448 18 -0.3 703 9 -0.0 909 11 -1.4 597 18
2 1.1 309 12 -0.3 059 7 0.6 709 4 0.8 529 12
3 1.5 305 4 -0.7 725 14 -0.2 205 13 1.093 4
4 1.7 033 1 -0.8 348 17 0.6 761 3 1.2 206 1
5 0.7 709 13 -0.1 823 6 0.3 709 7 0.5 859 13
6 1.3 909 5 -0.6 197 11 0.4 099 6 1.0 074 6
7 -8.6 978 20 1.0 727 4 -0.8 702 17 -6.778 20
8 -1.0 866 17 1.9 564 2 -0.9 775 18 -0.5 355 16
9 -0.862 16 0.6 797 5 -0.2 417 14 -0.5 738 17
10 0.5 196 14 -0.3 997 10 0.2 331 9 0.3 476 14
11 -0.0 032 15 1.1 933 3 0.3 468 8 0.2 012 15
12 1.3 435 8 -0.3 695 8 0.4 437 5 1.0 121 5
13 -6.0 358 19 4.6 116 1 -1.1 702 20 -4.0 432 19
14 1.3 142 10 -0.6 595 12 -0.3 587 15 0.9 392 9
15 1.3 797 6 -0.8 983 19 1.2 881 2 0.9 508 8
16 1.6 959 2 -0.8 466 18 0.0 703 10 1.2 127 2
17 1.3 657 7 -0.7 277 13 -0.1 165 12 0.9 687 7
18 1.639 3 -0.8 027 16 -0.8 223 16 1.1 747 3
19 1.3 107 11 -0.9 215 20 1.354 1 0.8 916 11
20 1.3 356 9 -0.8 026 15 -0.9 952 19 0.9 319 10
3结束语
对教师综合素质评价的原始数据,运用矩阵条件数对各个变量进行了多重共线性诊断。用核主成分分析法建立了教师综合素质评价模型,消除了测评指标间相互关系的影响,提高了降维效果。与线性主成分的结果对比表明,核主成分分析不仅能够反应指标间的非线性关系,而且能够用更少的成分更多地反映原始指标的信息,从而减少了指标选择的工作量。
参考文献
1 刘 平.高校教师综合素质评价研究[J].管理工程学报,2002.16(10):115~118
2 唐晓静、张圣梅、徐小君.教师综合素质评价模型的研究[J].长春理工大学学报,2004.27(1):113~115
3 谢爱荣、田 盈.加权主成分分析法在教师素质考评中的应用[J].中国教育导刊,2007.6:49~51
4 李冬琴、王丽铮.核主成分分析方法在船型方案综合评价中的应用[J].船海工程,2007.36(2):1~3
5 Bernhard Scholkopf, Alexander Smola, Klaus-Robert Muller. Nonlinear component analysis as a kernel eigenvalue problem[J]. Neural Computation, 1998.10(5):1299~1319
Evaluation Model for Teachers’ Comprehensive Qualities
Based on Kernel Principal Component Analysis
Chen Gaobo
Abstract:In this paper, the matrix condition number is used to diagnosis the multi-collinearity among the index for evaluating Teachers’ Comprehensive Qualities, and a kernel principal component analysis(KPCA)evaluation model is build. Compared with principal component analysis(PCA), the results from KPCA show that KPCA can extract less components which reflect the original index information.
Key words:kernel Principal component Analysis; comprehensive qualities; evaluation
关键词:核主成分分析;综合素质;评价
中图分类号:G647 文献标识码:A 文章编号:1000-8136(2009)27-0005-02
教师综合素质评价是教育管理部门对教师进行全面公正客观考核的有效手段,在各级各类教育单位已经广为实施。为了加强学校教学工作管理,促进教师评价改革,适应新时代学校教育教学管理工作的需要,实现学校教育教学工作的规范化和科学化,提高教育教学质量,激励先进,鞭策后进,促进教师队伍素质的全面提高,使教育教学工作又好又快发展,建立一个比较公正客观的评价模型是非常必要的。目前用来进行教师综合素质评价的数学模型主要有:层次分析法[1]、模糊综合评判法[2]、主成分分析法[3]等。本文建立了教师综合素质评价的核主成分分析(Kernel Principal Component Analysis,简称KPCA)模型,为教师综合素质评价提供了一种新的方法。
1核主成分分析
核主成分分析是在确保系统原有数据信息量丢失最小的原则下,在各个变量相关关系研究的基础上,将多个变量的信息压缩为几个能反映原问题特征的综合变量指标,并据此特征信息指标对系统进行综合分析,可以有效地来处理变量间的非线性关系,为解决多指标的综合评价提供了一种很好的手段。[4]其基本思想是:通过一个非线性映射,将输入数据映射到一个特征空间,再在特征空间上进行线性主成分分析。
设有l为变量x1,x2,…,xl的n组观测数据:(xil,xi2,…,xil),i=1,2,…n,核主成分分析通过一个非线性函数φ(•)将样本x1,x2,…,xl映射到特征空间中。不妨假设特征空间中的样本Ф(x1),Ф(x2),…,Ф(xl)已标准化。为了在特征
空间中做主成分分析,计算协方差矩阵 ,求
出C的特征值λ≥0及相应的特征向量V∈F{0},满足λV=CV。由于特征值对应的非零特征向量都位于数据Ф(x1),Ф(x2),…,Ф(xl)的张集上,即V∈span{Ф(x1),…,Ф(xl)},所以存在一组系数α1,α 2,…,α l使得:
(1)
因此λV=CV等价于λ(Ф(xk)•V)=(Ф(xk)•CV),k=1,2,…,l。
由此得到:
,
k=1,2,…,l(2)
通过定义一个l×l的核矩阵 ,(2)式可写为Ka=lλa(3)
所以确定特征向量V而求取系数αi(i=1,…,M)的问题就仅依赖于特征值分解核矩阵K。
在F中归一化特征向量V,等价于λk(αk•αk)=1;而为
了放宽 的假设,这只需将核矩阵替换成 =K-IM K
-KIM+IM KIM,其中 。
最后提取主成分,采用下式计算Ф(x)在特征向量Vk上的投影
(4)
常用的核函数主要有径向基核函数K(x,y)=exp(-||x-y||2/2σ2)、多项式核函数K(x,y)=(x•y)d、Sigmoid核函数K(x,y)=tanh(γ(x•y)+θ)等,其中σ、d、γ、θ均为核参数。
核主成分分析的综合评价函数[5]为:
(5)
其中,r为提取的核主成分个数,ωk为第k个核主成分的贡献率。
核主成分分析的基本步骤[4]是:
step 1 将原始数据X标准化,记为X*;
step 2 将标准化后的数据矩阵X*进行核变换,记变换后的核矩阵为K;
step 3 按下式求矩阵K*:
K*=K-AK-KA+AKA
step 4 求矩阵K*/l的特征值λi和特征向量vi,i=1,2,…,l;
step 5 求出累计贡献率超过85 %的前n个主成分;
step 6 利用n个主成分对每个样本求出评价函数,进行综合评价。
2基于核主成分分析的教学质量评价
2.1样本数据
要对20名教师的业务素质进行综合评价。各位教师的综合素质评价指标值[3]如表1所示,其中,教学计划与备课X1,课堂讲授X2,考试成绩X3,辅导答疑教学改革X4,论文论著X5,科研项目X6,教书育人X7,获奖情况X8。
2.2多重共线性诊断
度量多重共线性严重程度的一个重要指标是方阵XTX的条
件数,即: 。
资助项目:湖北省教育厅科研项目(编号:Q20091809);武汉工业学院校项目(编号:08Y30)。
其中λmax(XTX),λmin(XTX)表示方阵XTX的最大、最小特征值。一般地,若k<100,则认为多重共线性程度很小;若100≤k≤1 000,则认为存在中等程度或较强的多重共线性;若k>1 000,则认为存在严重的多重共线性。
经计算,本问题的矩阵条件数k=11 063>1 000,可认为变量x1,x2,…,x8之间存在严重的多重共线性,可以利用核主成分对数据降维。
表1教师综合素质评价指标
教师
编号 教学情况 科研学术 工作态度
X1 X2 X3 X4 X5 X6 X7 X8
1 1 394 2 505 75 8 144 17 12 843 6
2 2 849 1 258 80 4 839 15 15 1 234 8
3 1 092 1 250 75 4 721 17 16 697 3
4 832 1 387 90 4 134 18 17 419 10
5 2 793 2 397 80 4 911 16 14 1 840 7
6 2 014 2 334 86 4 145 16 14 1 240 4
7 2 462 5 343 87 9 280 19 13 1 642 3
8 5 155 1 925 75 5 943 21 17 2 026 6
9 3 524 2 249 76 6 619 16 13 916 2
10 2 160 2 320 80 5 857 15 14 433 4
11 5 002 1 527 90 5 145 17 14 2 207 5
12 3 002 1 034 78 4 344 16 15 1 367 7
13 5 381 2 699 76 8 250 18 16 1 396 1
14 1 606 1 314 80 5 105 18 16 554 2
15 364 1 815 85 5 340 13 11 64 6
16 630 942 74 4 475 16 14 324 2
17 1 206 1 261 85 5 149 18 18 716 5
18 1 000 1 208 72 4 396 19 17 600 1
19 165 1 445 86 5 763 14 12 105 9
20 834 1 469 70 5 348 19 17 428 1
2.3利用核主成分分析提取变量的主成分
对样本数据进行核主成分分析,为便于比较,同时进行主成分分析。核主成分分析的核函数选择多项式核函数,即核函数为K(x,y)=(x•y)d。经试验,相应的核参数d=4。
表2KPCA和PCA前4个特征值及贡献率(%)
No 特征值 贡献率 / % 累计贡献率 / %
PCA KPCA PCA KPCA PCA KPCA
1 2.6 877 2.56e+32 33.5 958 80.034 33.5 958 80.034
2 2.1 909 5.47e+31 27.3 859 17.0 763 60.9 816 97.1 102
3 1.5 251 6.95e+30 19.0 643 2.1700 80.0 459 99.2 802
4 0.7 951 1.97e+30 9.9 389 0.6135 89.9 848 99.8 937
从表2可以看出,采用PCA的前4个主成分累积贡献率为89.9848 %,而采用KPCA方法前2个主成分累积贡献率就已经达到97.1102 %,因此KPCA获得了比PCA更好的降维效果。
由KPCA求出每位教师的综合得分以及排序如表3所示。为便于对比,表3同时给出了PCA综合得分和PCA综合排名。
表3教师综合素质评价排名
教师
编号 核主成分F1 核主成分F2 PCA
综合
得分 PCA
综合排名 KPCA
综合
得分 KPCA
综合
排名
分值 排
序 分值 排
序
1 -1.7 448 18 -0.3 703 9 -0.0 909 11 -1.4 597 18
2 1.1 309 12 -0.3 059 7 0.6 709 4 0.8 529 12
3 1.5 305 4 -0.7 725 14 -0.2 205 13 1.093 4
4 1.7 033 1 -0.8 348 17 0.6 761 3 1.2 206 1
5 0.7 709 13 -0.1 823 6 0.3 709 7 0.5 859 13
6 1.3 909 5 -0.6 197 11 0.4 099 6 1.0 074 6
7 -8.6 978 20 1.0 727 4 -0.8 702 17 -6.778 20
8 -1.0 866 17 1.9 564 2 -0.9 775 18 -0.5 355 16
9 -0.862 16 0.6 797 5 -0.2 417 14 -0.5 738 17
10 0.5 196 14 -0.3 997 10 0.2 331 9 0.3 476 14
11 -0.0 032 15 1.1 933 3 0.3 468 8 0.2 012 15
12 1.3 435 8 -0.3 695 8 0.4 437 5 1.0 121 5
13 -6.0 358 19 4.6 116 1 -1.1 702 20 -4.0 432 19
14 1.3 142 10 -0.6 595 12 -0.3 587 15 0.9 392 9
15 1.3 797 6 -0.8 983 19 1.2 881 2 0.9 508 8
16 1.6 959 2 -0.8 466 18 0.0 703 10 1.2 127 2
17 1.3 657 7 -0.7 277 13 -0.1 165 12 0.9 687 7
18 1.639 3 -0.8 027 16 -0.8 223 16 1.1 747 3
19 1.3 107 11 -0.9 215 20 1.354 1 0.8 916 11
20 1.3 356 9 -0.8 026 15 -0.9 952 19 0.9 319 10
3结束语
对教师综合素质评价的原始数据,运用矩阵条件数对各个变量进行了多重共线性诊断。用核主成分分析法建立了教师综合素质评价模型,消除了测评指标间相互关系的影响,提高了降维效果。与线性主成分的结果对比表明,核主成分分析不仅能够反应指标间的非线性关系,而且能够用更少的成分更多地反映原始指标的信息,从而减少了指标选择的工作量。
参考文献
1 刘 平.高校教师综合素质评价研究[J].管理工程学报,2002.16(10):115~118
2 唐晓静、张圣梅、徐小君.教师综合素质评价模型的研究[J].长春理工大学学报,2004.27(1):113~115
3 谢爱荣、田 盈.加权主成分分析法在教师素质考评中的应用[J].中国教育导刊,2007.6:49~51
4 李冬琴、王丽铮.核主成分分析方法在船型方案综合评价中的应用[J].船海工程,2007.36(2):1~3
5 Bernhard Scholkopf, Alexander Smola, Klaus-Robert Muller. Nonlinear component analysis as a kernel eigenvalue problem[J]. Neural Computation, 1998.10(5):1299~1319
Evaluation Model for Teachers’ Comprehensive Qualities
Based on Kernel Principal Component Analysis
Chen Gaobo
Abstract:In this paper, the matrix condition number is used to diagnosis the multi-collinearity among the index for evaluating Teachers’ Comprehensive Qualities, and a kernel principal component analysis(KPCA)evaluation model is build. Compared with principal component analysis(PCA), the results from KPCA show that KPCA can extract less components which reflect the original index information.
Key words:kernel Principal component Analysis; comprehensive qualities; evaluation