论文部分内容阅读
Tian et al.(2007)引进了一个称之为隐藏敏感模型,来评定两个敏感的二值变量的关联性.然而,在实际问题中,有时候需要评定一个敏感的二值变量(例如,是否吸毒,性伴侣个数≤1或者>1,等等)和一个非敏感的二值变量(例如,健康状况是否良好,是否有宫颈癌,等等)之间的相关性.为了解决此问题,在本论文中,我们提出一个新的调查方案,称之为组合问卷设计/模型.此设计不需要任何随机装置.我们用EM算法导出了参数的极大似然估计,并且得到了参数的渐近的置信区间和boostrap置信区间.似然比方法被用来检验两个二值随机变量的关联性.我们也讨论了贝叶斯推断.用亚特兰大富颈癌数据来说明我们提出的方法.本文共分为七个部分:在第一节,简单介绍了两个二值变量之间两关联的背景,并提出了本文所提出之方案来研究一个敏感的二值变量和一个非敏感的二值变量之间相关联的意义;在第二节,不需要使用任何随机化装置,我们提出一个抽样调查方案,称为组合问卷设计(或模型),此设计由主问卷和副问卷构成;在第三节,我们导出了似然推断方法,包括用EM算法计算参数的极大似然估计,大样本置信区间和bootstrap置信区间.我们用似然比方法来检验两个二值变量的相关性;在第四节,当参数的先验信息存在时,我们讨论了参数的贝叶斯推断;在第五节,用亚特兰大宫颈癌数据来说明我们提出的方法;在第六节,我们给出了一个简短的讨论;在附录中,我们给出了分组Dirichlet密度的众数的计算公式和相应的产生随机矢量的方法.