调查研究Excel抽样模板制作及其应用

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:haibolovemj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:在科学研究研究中,经常会遇到随机抽样的问题,利用专业的统计软件虽可很好的实现,但需要购买专业软件和具备专业知识人员来完成,对基层科研人员难以做到。Excel软件是一基础软件,内嵌许多函数,笔者利用Excel函数编制了单纯随机抽样模板,很好解决了随机抽样问题,为非统计专业人员提供了一种操作简单,易学易用方法。现介绍模板制作的了具体方法,并举例指出使用方法和注意问题,为今后进一步改进指出方向。
  关键词:抽样;Excel;总体;样本
  中图分类号:TP317 文献标识码:A 文章编号:1009-3044(2017)03-0091-02
  单纯随机抽样也称简单随机抽样,是最简单、最基本的抽样方法。从总体N个对象中,通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个对象被抽到的概率相等,则这样的抽样方法叫做简单随机抽样。常用的抽样形式利用抓阄、随机数字表,也可以利用统计软件来实现。但前者操作简单,但总体含量大,不太容易实现;而后者操作起来简单,但必须拥有专业统计软件及掌握相应操作技能。本人利用Excel编制了随机抽样模板,并在流行病学调查中得到应用。现介绍如下:
  1 简单随机抽样模板制作原理:
  1)对N条研究总体记录,从1到N编号;2)利用随机函数给对应标号赋给随机数字;3)对随机数从高到低排序生成相应的序号;4)根据需要样本的多少,从总体记录中从排序中由高到低的原则依次取出相应的记录。
  2 简单随机抽样模板的制作:
  本模板主要由三张工作表组成:分别定义为抽样表、总体表和样本表,下面按总体为1000条记录内,介绍每张表的编制方法和作用。
  1)抽样表,在A1写出“总体记录数”,A2空出备填总体记录个数;B2填编号,在B3填入函数“=IF((ROW(B3)-2)<=$A$2,(ROW(B3)-2)," ")”,把B3公式拷贝到B4到B1002,根据总体个数自动生成1000之内的编碼;在C2填随机数字,在C3单元格填入公式” =IF(B3<>" ",RAND()," ")” ,把C3公式拷贝到C4到C1002,实现在C3:C1002自动生成0-1间的随机数;在D2输入“随机数位次”,在D3填入公式“=IF(C3<>" ",RANK(C3,$C$3:$C$1002)," "),把D3公式拷贝到D4到D1002,实现对C3:C1002单元格的随机数自动排序,排序结果在D列显示;再在E2填编号,在E3填入函数“=IF((ROW(E3)-2)<=$A$2,(ROW(E3)-2)," ")”,便于看样本编码;在F2单元格键入“=IF(ISBLANK(总体!A1)," ",总体!A1)”,将此公式向右拖放至IV2,向下拖放致IV1002,能使F2:IV1002存放字段在250以内1000条记录。
  2)总体表:本表存放总体记录,要求第一行存放字段名称,从第二行开始放第一条记录,以便由抽样表调用数据。
  3)样本表编制:在在A1输入“样本记录数”;A2空出备填样本记录数; B2键入样本编号,B3键入公式“=IF((ROW(B3)-2)<=$A$2,MATCH(抽样表!E3,抽样表!$D$3:$D$1002,0)," "),把此公式向下拖至B1002,实现根据样本大小,抽出相应随机数大的记录编号;在C2键入编号排序,在C3录入公式” =IF(B3=" "," ",SMALL($B$3:$B$1002,ROW(B3)-2))” ,下拉至C1003,实现抽到样本编号由小到大排序;在D1键入样本,D2键入公式“=IF(ISBLANK(抽样表!F2)," ",抽样表!F2)”,向右拖至IT2,用来存放样本记录字段。D3键入“=IF(D$2=" "," ",IF(C3<>" ",OFFSET(抽样表!F$2,样本!$C3,0)," "))”,把公式向右和向下拖复制到D3:IT1002
  实现完整显示样本记录信息。
  3 实例
  例如 现要从住院号为2008001-2008030妊娠分娩数据30条记录中,利用简单随机抽取3条进行研究。如何实现。
  3.1 把总体原始数据复制到总体表1中。
  
  3.2 切换到抽样表,在A2键入30,即可见到如下表。
  表2 抽样表调用总体表数据及抽样赋值
  
  3.3 切换到样本表,在A2键入“3”,即得到如下样本信息。
  
  4 结束语
  1)本模板利用传统软件制作,操作简单,易学易用,特别适用于没用正版专业统计软件,抽样总体有不太大的情况使用。避免了利用抓阄等原始方法抽样,需要重新整理数据库的繁琐工作,在本单位科学研究中得到很好的应用。
  2)对于Excel操作不够熟练的人员,对模板中含公式和函数的单元格锁定和隐藏,只需把总体按要求放入总体sheet,在抽样sheet中填好总体数,样本sheet中填好样本量,即可得到所抽样本信息。
  3)本模板在相同的抽样比例多次抽样,不能得到相同的样本信息,也就是样本信息不可重现;同时抽到样本时,需要利用复制和选择性粘贴固定信息,这一值得今后改进的地方。
  参考文献:
  [1] 于传华. Excel统计分析与电脑实验[M]. 北京:电子工业出版社,2009: 60-61.
  [2] 李立明. 流行病学[M]. 7版.北京:人民卫生出版社,2007: 46-47.
  [3] 陈青山, 钟倩红, 林佩贤, 等. 在Excel中完成实验对象的随机化分组[J]. 中国卫生统计, 2009, 26(3): 296.
其他文献
依据辩证唯物主义观点,从人的思维机制与过程可以知道,在主体感知客体对象形成观念之后,观念就脱离客体对象而具有了相对独立性和客体存在性,而且具有内在性和自生成性.当主
摘要:随着互联网技术的发展,人类产生的数据量正在呈指数级增长,Hadoop作为大数据领域的常用工具,在现代生活中发挥着至关重要的作用。Hive是基于Hadoop的一个数据仓库工具,在做查询统计分析时最终翻译成Hadoop平台上的MapReduce程序运行,当数据量不断增大时,就会使得查询效率[5]下降。该文就此提出了一种Hive与Spark结合的方案,将Hive的查询作为Spark的任务提交到Sp
能源互联网是未来发展的趋势,能够实现电力资源在用户和能源系统中的双向流通.智能电表作为连接用户和能源系统的关键点,具有用户身份信息和大量有效的电力交易数据,而这些信
FC网络作为新型的高速通信技术,具有高速率、可靠性高等特点,是新一代综合化航空电子系统通信网络的首选。但同时,又由于其综合程度越来越高。网络规模越来越复杂,该文在介绍
摘要:基于.NET平台,应用Spread组件进行二次开发,结合数据库技术设计并实现了面向海上平台机械电气设备的数据共享平台。该数据共享平台实现了批量数据采集、数据协同共享和综合查询计算比选功能,有效解决了平台机械电气设备相关数据难以汇总、集成、共享和计算比选的问题。  关键词:海上平台;机械电气;批量采集;数据共享  中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)