论文部分内容阅读
引言:现今统计软件众多,R软件、SPSS、Stata和Weka等均拥有大量用户。本文通过对比统计软件中R和SPSS,细致分析他们各自的特点、功能、适用对象,为用户对统计软件的选择提供帮助。
相对于SPSS,R软件起步较晚。SPSS是最早出现的统计分析软件,也是最早采用图形菜单驱动界面的统计软件;R软件诞生于1980年左右,采用编程语言,拥有简洁的命令窗口。SPSS操作容易,受到初学者的欢迎,通过交互界面,点击菜单即可完成对数据的分析;
R软件要求用户使用R语言,通过输入正确的命令来完成操作。相对于SPSS,R软件具有很强的灵活性,自定义的输入形式和开放的源代码让R软件风靡全球。
Wilcoxon符号秩检验属于两样本非参数检验的一种,SPSS和R软件均可实现其操作。下面分析R软件、SPSS用于Wilcoxon符号秩检验的不同。
案例:改制前后某厂八个车间竞争性的比较:
车间 1 2 3 4 5 6 7 8
改制前 37 72 57 44 43 64 55 65
改制后 40 73 59 43 51 67 61 74
问:改制前后竞争性有无显著差异。
(一)SPSS操作步骤:
1、建立变量2、输入数据3、分析-分参数检验-旧对话框-2个相关样本4、选择检验变量5、选择Wilcoxon检验方法6、确定。结果如下:
秩
N 秩均值 秩和
改制后 - 改制前 负秩 1a 1.50 1.50
正秩 7b 4.93 34.50
结 0c
总数 8
a. 改制后 < 改制前
b. 改制后 > 改制前
c. 改制后 = 改制前
检验统计量b
改制后 - 改制前
Z -2.316a
渐近显著性(双侧) .021
a. 基于负秩。
b. Wilcoxon 带符号秩检验
改制后—改制前:负秩个数为1,正秩个数为7;负秩的平均值和秩和均为1.5,正秩的平均值和秩和分别为4.93、34.5。Z统计量为-2.316,双侧检验的P值为0.021。选择5%的显著性水平,α=0.05,0.021<0.05拒绝原假设,认为八个车间改制前后有显著差异。
(二)R软件操作步骤
R软件可以选择左边、右边、双边检验以配合不同的检验类型,本题为配合SPSS选择了双边检验,双边检验在命令中可以省略。SPSS在旧对话框选项中选择2个相关样本检验,R软件的命令形式为paierd=true。Wilcoxon符号秩检验在R软件中可以用于检验两独立样本的情况,选择更具有多样性。
SPSS拥有中英双界面,输出结果也有中英两种格式,用户可以自由选择。SPSS操作简便,用户只要具备基本的统计知识即可用SPSS分析数据。便捷的菜单栏可以提供多种数据分析方式,用户无需花费大量时间记忆繁多的命令和过程。SPSS能够进行数据输入、编辑、统计分析、图形制作、报表等功能,提供了简单的描述统计及复杂的多因素分析方法,比如主成分分析、因子分析、聚类分析、参数检验、非参数检验等;能够读取多种数据格式,比如*.dbf、*.xls等,可以输出*.txt及html格式的文件。SPSS是制图方面的强手,由于缺少稳健和调查的方法,处理前沿的统计过程是其弱项。
同样是统计分析软件的R软件,有着区别于SPSS的独特之处。它拥有极简的界面,数据处理过程完全依赖R语言,只有输入正确的命令,R软件才能运算。所以R软件更适合高级用户,R软件用户需掌握大量的编程语言,否则无法运行R软件更不能领会R软件的魅力。R软件功能强大,拥有连贯完整的统计分析工具,数组运算工具,数据存储和处理系统,并可实现用户的自定义功能。它有成千(3500+)的扩展包,涉及金融、聚类、预测、最优化、高性能计算、自然语言处理等供用户使用。此外,R软件是一款免费的自由软件,它有WINDOWS、LINUX、MacOS和UNIX版本,都是可以免费下载和使用的。因此,R软件使得部分用户成为开发者,用户可以自己编写包进行使用和发布。
用户对于SPSS和R软件的使用,可以根据其需求及能力。当然,SPSS和R软件的结合使用能将数据处理的更加完美。
参考文献
[1]薛留根 《应用非参数统计》 科学出版社 2013.
[2]何晓群 《多元统计分析》 中国人民大学出版社 2012.
相对于SPSS,R软件起步较晚。SPSS是最早出现的统计分析软件,也是最早采用图形菜单驱动界面的统计软件;R软件诞生于1980年左右,采用编程语言,拥有简洁的命令窗口。SPSS操作容易,受到初学者的欢迎,通过交互界面,点击菜单即可完成对数据的分析;
R软件要求用户使用R语言,通过输入正确的命令来完成操作。相对于SPSS,R软件具有很强的灵活性,自定义的输入形式和开放的源代码让R软件风靡全球。
Wilcoxon符号秩检验属于两样本非参数检验的一种,SPSS和R软件均可实现其操作。下面分析R软件、SPSS用于Wilcoxon符号秩检验的不同。
案例:改制前后某厂八个车间竞争性的比较:
车间 1 2 3 4 5 6 7 8
改制前 37 72 57 44 43 64 55 65
改制后 40 73 59 43 51 67 61 74
问:改制前后竞争性有无显著差异。
(一)SPSS操作步骤:
1、建立变量2、输入数据3、分析-分参数检验-旧对话框-2个相关样本4、选择检验变量5、选择Wilcoxon检验方法6、确定。结果如下:
秩
N 秩均值 秩和
改制后 - 改制前 负秩 1a 1.50 1.50
正秩 7b 4.93 34.50
结 0c
总数 8
a. 改制后 < 改制前
b. 改制后 > 改制前
c. 改制后 = 改制前
检验统计量b
改制后 - 改制前
Z -2.316a
渐近显著性(双侧) .021
a. 基于负秩。
b. Wilcoxon 带符号秩检验
改制后—改制前:负秩个数为1,正秩个数为7;负秩的平均值和秩和均为1.5,正秩的平均值和秩和分别为4.93、34.5。Z统计量为-2.316,双侧检验的P值为0.021。选择5%的显著性水平,α=0.05,0.021<0.05拒绝原假设,认为八个车间改制前后有显著差异。
(二)R软件操作步骤
R软件可以选择左边、右边、双边检验以配合不同的检验类型,本题为配合SPSS选择了双边检验,双边检验在命令中可以省略。SPSS在旧对话框选项中选择2个相关样本检验,R软件的命令形式为paierd=true。Wilcoxon符号秩检验在R软件中可以用于检验两独立样本的情况,选择更具有多样性。
SPSS拥有中英双界面,输出结果也有中英两种格式,用户可以自由选择。SPSS操作简便,用户只要具备基本的统计知识即可用SPSS分析数据。便捷的菜单栏可以提供多种数据分析方式,用户无需花费大量时间记忆繁多的命令和过程。SPSS能够进行数据输入、编辑、统计分析、图形制作、报表等功能,提供了简单的描述统计及复杂的多因素分析方法,比如主成分分析、因子分析、聚类分析、参数检验、非参数检验等;能够读取多种数据格式,比如*.dbf、*.xls等,可以输出*.txt及html格式的文件。SPSS是制图方面的强手,由于缺少稳健和调查的方法,处理前沿的统计过程是其弱项。
同样是统计分析软件的R软件,有着区别于SPSS的独特之处。它拥有极简的界面,数据处理过程完全依赖R语言,只有输入正确的命令,R软件才能运算。所以R软件更适合高级用户,R软件用户需掌握大量的编程语言,否则无法运行R软件更不能领会R软件的魅力。R软件功能强大,拥有连贯完整的统计分析工具,数组运算工具,数据存储和处理系统,并可实现用户的自定义功能。它有成千(3500+)的扩展包,涉及金融、聚类、预测、最优化、高性能计算、自然语言处理等供用户使用。此外,R软件是一款免费的自由软件,它有WINDOWS、LINUX、MacOS和UNIX版本,都是可以免费下载和使用的。因此,R软件使得部分用户成为开发者,用户可以自己编写包进行使用和发布。
用户对于SPSS和R软件的使用,可以根据其需求及能力。当然,SPSS和R软件的结合使用能将数据处理的更加完美。
参考文献
[1]薛留根 《应用非参数统计》 科学出版社 2013.
[2]何晓群 《多元统计分析》 中国人民大学出版社 2012.