论文部分内容阅读
【摘要】对数据的条件分布为泊松分布的敏感问题,本文提出一種不需要知道先验分布的广义贝叶斯方法,得到了表达式很简单的贝叶斯估计量.
【关键词】敏感问题;随机化回答技术;广义贝叶斯估计
【基金项目】北京师范大学珠海校区教师科研能力促进计划项目.
一、问题的提出
对于敏感问题,人们通常采用古典的随机化回答技术[1-2].为了利用一切可以利用的信息,Winkler和Franklin于1979年首次提出了贝叶斯方法(基于Warner模型)[3],1980年,Pitz对Simmons模型给出了贝叶斯分析[4],这些贝叶斯方法大都假定参数服从某种具体的先验分布,但先验分布需要根据经验和过去的历史资料确定.
本文指出,对数据的条件分布为泊松分布的敏感问题,不需要知道参数的先验分布即可算出具有敏感特征的人所占比例的贝叶斯估计量,而且其表达式很简单.
二、广义贝叶斯方法简介
贝叶斯学派认为在没有先验信息的场合可以采取广义先验分布,其一般定义如下:
则称π(θ)为θ的广义先验密度.
例如,在没有先验信息的情况下,人们对θ的任何可能取值既无偏爱,又同样程度的不了解,因此,很自然地把θ取值范围上的均匀分布取作θ的先验分布,这样当θ取值范围是无限区间时,先验概率密度函数不满足
因此,不是一个正常的先验分布,但由此算出的后验概率密度函数却满足通常的性质.
一般情况下,无信息先验分布不是唯一的,但它们对贝叶斯统计推断的结果影响很小,所以任何无信息先验分布都可以采用.当今无论在统计理论研究还是在应用研究中,采用无信息先验分布越来越多,连经典统计学者也认为无信息先验是“客观”的,可以接受的.
三、敏感问题中的广义贝叶斯方法
从推导过程可看出,我们不需要知道F(λ)具体是什么,即不需要知道λ的先验分布,只要将实验多进行几次,直接根据样本数据就可算出λ的贝叶斯估计量,此贝叶斯估计量表达式很简单.
四、结束语
长期以来,贝叶斯方法由于需要知道未知参数的先验分布而备受争议,本文提出一种不需要知道先验分布的广义贝叶斯估计方法,得到了稳健的贝叶斯估计量.不过,这种方法的使用要求受调查者重复同一实验,重复次数越多效果越好,极端情况是当重复次数为无穷大时,该估计值等于真值.但无休止的重复可能会遭到拒绝,只能适当次数地重复.
【参考文献】
[1]Warner S L.Randomized response:A survey technique for eliminating evasive answer bias[J].Journal of theAmerican Statistical Association,1965(309):63-69.
[2]Horvitz D.G.Shah,B.V.Simmons etc.The Unrelated Question Randomized Response Model[J].Proceedings of Social Stati.Sec.Amer.Statist.Assoc.1967,65-72
[3]Winkler R L,Franklin L A.Warners randomized response model:A Bayesian approach[J].Journal of the American Statistical Association,1979(365):207-214.
[4]Pitz,G.Bayesian analysis of randomized response models.Journal of Psychological Bulletin 87:209-212.
【关键词】敏感问题;随机化回答技术;广义贝叶斯估计
【基金项目】北京师范大学珠海校区教师科研能力促进计划项目.
一、问题的提出
对于敏感问题,人们通常采用古典的随机化回答技术[1-2].为了利用一切可以利用的信息,Winkler和Franklin于1979年首次提出了贝叶斯方法(基于Warner模型)[3],1980年,Pitz对Simmons模型给出了贝叶斯分析[4],这些贝叶斯方法大都假定参数服从某种具体的先验分布,但先验分布需要根据经验和过去的历史资料确定.
本文指出,对数据的条件分布为泊松分布的敏感问题,不需要知道参数的先验分布即可算出具有敏感特征的人所占比例的贝叶斯估计量,而且其表达式很简单.
二、广义贝叶斯方法简介
贝叶斯学派认为在没有先验信息的场合可以采取广义先验分布,其一般定义如下:
则称π(θ)为θ的广义先验密度.
例如,在没有先验信息的情况下,人们对θ的任何可能取值既无偏爱,又同样程度的不了解,因此,很自然地把θ取值范围上的均匀分布取作θ的先验分布,这样当θ取值范围是无限区间时,先验概率密度函数不满足
因此,不是一个正常的先验分布,但由此算出的后验概率密度函数却满足通常的性质.
一般情况下,无信息先验分布不是唯一的,但它们对贝叶斯统计推断的结果影响很小,所以任何无信息先验分布都可以采用.当今无论在统计理论研究还是在应用研究中,采用无信息先验分布越来越多,连经典统计学者也认为无信息先验是“客观”的,可以接受的.
三、敏感问题中的广义贝叶斯方法
从推导过程可看出,我们不需要知道F(λ)具体是什么,即不需要知道λ的先验分布,只要将实验多进行几次,直接根据样本数据就可算出λ的贝叶斯估计量,此贝叶斯估计量表达式很简单.
四、结束语
长期以来,贝叶斯方法由于需要知道未知参数的先验分布而备受争议,本文提出一种不需要知道先验分布的广义贝叶斯估计方法,得到了稳健的贝叶斯估计量.不过,这种方法的使用要求受调查者重复同一实验,重复次数越多效果越好,极端情况是当重复次数为无穷大时,该估计值等于真值.但无休止的重复可能会遭到拒绝,只能适当次数地重复.
【参考文献】
[1]Warner S L.Randomized response:A survey technique for eliminating evasive answer bias[J].Journal of theAmerican Statistical Association,1965(309):63-69.
[2]Horvitz D.G.Shah,B.V.Simmons etc.The Unrelated Question Randomized Response Model[J].Proceedings of Social Stati.Sec.Amer.Statist.Assoc.1967,65-72
[3]Winkler R L,Franklin L A.Warners randomized response model:A Bayesian approach[J].Journal of the American Statistical Association,1979(365):207-214.
[4]Pitz,G.Bayesian analysis of randomized response models.Journal of Psychological Bulletin 87:209-212.