论文部分内容阅读
在抽样调查中,总体参数的估计是农业、经济、医学和总体研究等领域普遍存在的一个问题。在现有的文献中,人们大多借助辅助变量的信息,利用比率、乘积以及回归等方法来估计总体的参数(均值和方差等)。其中比率估计法被广泛应用,可用于估算人均收入或支出、不同项目的支出比例、失业人口比例、性别比例、出生率、死亡率、单位面积产量和每公顷特定农作物肥料或杀虫剂使用率等等。本文的主要目的是提出用于估计不同场景下有限总体均值的比率型估计量的高效的一般(广义)的形式。由于辅助变量提供的补充信息能够提高总体参数的估计精度,学者们在这方面已经提出了若干估计量。但目前通过借助辅助变量的中位数和借助目标变量与辅助变量之间相关系数的估计方法的研究工作还是有限的。在这方面的工作中,Yadav等(2014)只提出了两种利用中位数的比率型估计量。Kadilar和Cingi(2006a)仅提出了四种使用相关系数的比率型估计量,因此很有必要拓展他们的工作,以便提出更灵活有效的估计形式。本文提出了一种基于辅助变量中位数的最优的一般形式的比率型估计,同时还给出了另一种基于已知相关系数的具有更为灵活形式的比率型估计。目前文献中大多数的估计量均借助辅助变量的一些常规度量来提高其估计效率,例如均值、标准差、变异系数、偏度系数和峰度系数等。而像四分位差、中距、四分位距、四分位数平均值、三均值和Hodge-Lehmann估计等非常规度量是否可以达到同样的效果,就需要有新的检验方法。为了解决这个问题,我们借助辅助变量的常规和非常规度量,提出了一族用于估计总体均值的最优估计量。Haq等(2017)基于“当目标变量与辅助变量之间存在足够相关性时,辅助变量的序也与目标变量相关”这一事实,提出了一种用于简单随机抽样的估计量。他们的结果说明排序后的辅助变量有可能会提高估计量的效率。推广他们的工作到分层随机抽样是一个重要课题,后者在规划调查中能提供更精确的估计。本文既对简单抽样又对分层随机抽样,提出了基于双辅助信息的新的改进估计量。我们还通过结合“Hartley-Ross型无偏估计”和“利用多个辅助变量的信息”这两个概念与想法探讨了一类用于估计总体均值的估计量。我们的想法是新颖的,因为我们将两者结合起来,而前人的工作都是分别处理它们。传统的估计方法往往基于“全部应答”和“个体的记录信息完全正确”这两个假设,但实际情况并非总是如此。综合考虑无应答和存在测量误差的情况,在简单随机抽样中,我们借助辅助变量的常规和非常规度量,提出了一种用于估计总体均值的最优广义估计形式,并且由它可以衍生出大量的估计量。本文给出了提出的所有估计量的偏差、均方误差和最小均方误差的数学表达式(一阶近似)。同时本文从农业、商业管理、人口统计学、经济学、教育学、工程学、工业学、医学科学、社会科学等多个领域,举例说明了所提出的估计量较于现有估计量的优势。此外,我们利用蒙特卡洛模拟研究方法对所提出的一般形式的估计量的性能进行了考察和比较。本文还对现有已知的著名的总体均值估计方法进行了全面的回顾和展望。理论和数值结果表明,在不同情况下,本文提出的所有估计量用于总体均值的估计都是更有效的。此外,本文提出的估计量的一般形式具有很强的灵活性,足以涵盖许多现有的常见估计量,因此本文提出的所有估计量都具有很强的应用价值。