统计分析工具和R语言在科学研究中的应用比较

来源 :科技创新导报 | 被引量 : 0次 | 上传用户:maxzhk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:目前,计算机已经成为人们生活中必不可少的工具之一,最早使用计算机的学科就是统计学。随着计算机的应用,大量计算机分析工具和程序语言被开发出来,统计分析工具和程序语言在科学研究中的应用已经越来越广泛。文章通过比较常见统计分析工具与R语言在具体应用分析中的优点与缺点,希望能够为广大科研工作者学习和使用提供一些借鉴作用。
  关键词:统计分析 R语言 科学研究应用
  中图分类号:TP39 文献标识码:A 文章编号:1674-098X(2017)11(a)-0113-02
  在概念方面,统计是指数据收集、数据分析和由相应数据得出最终结论的一组原则和方法。在应用方面,统计可以为各个领域服务(包括科研领域),当然,统计与数据是密不可分的。因此,计算机必须用于服务统计学分析。随着“大数据”时代的到来,大规模数据分析使得早期的“理论统计”已经慢慢淡出了人们的视线。目前,计算机已经成了人们身边必不可少的工具之一,但最早使用计算机的学科就是统计。随着计算机的应用和普及,大量计算机分析工具和程序语言被开发出来,受到了科研工作者的青睐。
  1 統计分析工具的应用
  统计分析工具的开发使统计被更多的人所接受,在科研工作中亦是如此。多数科研人员选择相对简单的方式来做统计分析,得出相应的结论。例如功能富集分析,临床科研人员通常会选择DAVID工具来做功能或通路识别。只需输入分析数据,点击几下鼠标,设定简单的参数选项,就能得到相应的分析结果。由于操作简单、无需统计背景和结果输出方便等优点,统计工具在各类科学研究中颇受喜爱。统计工具的种类很多,有些是针对特定研究方向的分析工具,只处理具体的分析问题。其中,SPSS是一个很受欢迎的统计工具,它具有操作简易、功能齐全、结果输出完善等优点[1,2]。该统计工具可以对各种类型的数据进行常规的统计分析,对于不具备统计背景知识的科学研究人员是很好的选择。另外,Excel作为数据表格软件,也有一定的统计计算功能,包括图标统计和函数计算功能。但是,Excel的函数计算只能进行简单的运算,例如计算均值和标准差等功能,却不能进行较复杂的数据分析和计算。此外,还有一些具体应用方向的统计工具,例如Minitab、Statistica和Eviews等。科研人员也可以根据不同的分析问题,学习和应用这些工具来获得相应的统计结果。
  另外,在使用统计分析工具来进行运算时,不可以完全抛弃统计背景知识。例如,分析数据的整理、分析方法的选择、软件输出结果的理解都需要统计理论知识。这正是科研工作者需要慎重面对和特别注意的,同时,统计分析工具也存在一些问题。首先,分析工具无法得到计算过程的中间结果,因此无法在算法中插入其他分析过程。其次,统计软件得出的结果通常很多,而且,同样的分析方法下,不同的分析工具输出的结果可能还不一样,同样的结果内容也会存在差异。对于分析数据,如果选择统计工具适合该数据的选项全部输出,那么其中可能包含没有意义或相关性很低的结果。有些结果即使是相关领域专家也不能完全解释清楚。
  最后,基于统计分析工具,科研人员无法实现研究方法和计算的创新。目前,创新性是科学研究的立足之本,也正是现成统计软件使用过程中需要面对的缺陷。为了解决上述统计软件存在的问题,只有编程语言才能检验结果真实意义、优化分析流程和提高方法的创新性。
  2 R语言的应用
  在众多编程语言中,许多科学研究人员使用R语言进行各种统计分析。R语言是在20世纪80年代后期由AT&T实验室开发的,完全免费、资源公开的语言系统[3,4]。R语言可以在Unix、Window和Macintosh环境运行,具有内在的帮助系统、画图功能和强大的、容易学习的语法,以及许多内在统计函数。因此,R语言基本上可以满足所有方面科研工作的需求,是一门极容易学习的编程语言。不仅是生物信息学研究人员,临床医学研究人员也常常运用R语言来从事科学研究。拥有多年编程经验的Roger Peng教授曾指出,“R语言已经成为统计领域最具人气的语言选项”。此外,R语言具备可扩展能力且拥有丰富的功能选项,可以在原有的算法基础上,研究人员构建自己的工具及方法,从而实现数据分析与挖掘。目前,很多机器学习算法以R语言作为主要实现手段。
  同时,R语言也有一定缺点:它画图结果输出不如S-Plus,而且没有商业支持。另外,基于R语言无法开发Web类或者互联网应用程序。通常科研人员使用R语言处理分析任务,然后利用JavaScript等其它语言来完成最终结果的显示。
  3 比较分析
  以SPSS为代表比较统计分析工具与R语言在应用范围、适合领域、适合人员、扩展性、数据的处理、分析方法和灵活性等方面的差异性,结果如表1所示。
  4 结语
  总之,统计分析工具与R语言在处理分析数据时具有各自不同的优点与缺陷,统计分析工具简单便捷,R语言更具灵活性。因此,对于不同的科学研究任务,应该选择合适的工具或编程语言来实现统计分析。
  参考文献
  [1] 姜忠尉.统计分析软件SPSS的特点和应用分析[J].中国证券期货,2012(4):291.
  [2] 邓建红.医院统计中SPSS软件的应用分析[J].中国民族民间医药,2009,18(9):161-162.
  [3] 张哲,张豪.浅谈R语言在生物统计学教学中的应用[J]. 教育教学论坛,2013(27):54-55.
  [4] 奚宁.R语言在统计学教学中的运用[J].科技资讯,2012 (1):197.
其他文献
随着现代篮球的飞速发展,篮球运动逐渐成为人们生活中不可或缺的一项体育项目。由于其运动本身的特性与其在现实生活中的广泛性。使之在短短的百年多的时间里迅速风靡全球。然
摘 要:云计算展现出强大的服务能力和存储能力的同时,也不可避免带来了安全问题。可信计算能够从终端和平台的根源解决现有的安全问题。将可信计算中的远程证明机制引入云计算,通过面向云计算的基于属性证书的远程证明技术,提高在云计算下终端平台的可信性。  关键词:云计算 远程证明 属性证书 可信计算  中图分类号:TP393 文献标识码:A 文章编号:1674-098X(2017)06(c)-0161-02
水上飞机,顾名思义就是能在水面上起飞、降落和停泊的飞机。我对水上飞机的认识始于1978年,那年我当海员船去北美加拿大温哥华港进口小麦,几个不当班的船员结伴下船逛街,第一次走
摘 要:随着企业信息化建设的迅速发展,办公设备数量也随之快速增长。桌面终端作为企业网络中最基本的组成部分,也是管理中最薄弱的环节,涉及大量敏感或涉密数据。本文分析了电力企业桌面终端管理的现状和面临的挑战,对桌面终端管理在企业管理中的改进思路进行了论述,充分利用先进的管理方法和工具,改善服务流程和服务质量,实现桌面终端的精益化管理。  关键词:桌面终端管理 精益化管理 桌面安全管理  中图分类号:T
摘 要:由于我国工业化的进一步发展,让用电的需求量也与日俱增,在这样的背景下,使得电网的无功补偿工作必须要得到相应的提高,以便能够跟得上时代发展的脚步。而想要做好这方面的工作,那么就一定要安装无功补偿设备。那么下面我们就来具体地讨论一下这方面的问题。  关键词:低压无功补偿 智能 电力自动化补偿技术  中图分类号:TM714 文献标识码:A 文章编号:1674-098X(2017)11(b)-00
和善煤矿主斜井掘进到815m处时,开始出现陷落柱;掘进到875m处时,围岩特别破碎,遇水膨胀,造成右帮淋水处出现右肩窝冒落现象,冒落区高度5~6m左右,宽度5m左右,长度4m左右,给井筒施工带来