论文部分内容阅读
概率密度估计,作为统计学的基础问题,一直以来得到广大学者的关注。数学家高斯提出了概率密度估计的参数估计方法。随着非参数估计的兴起,Parzen等数学家为概率密度估计提供了直方图估计、核密度估计以及最近邻估计等一系列非参数估计方法。这不仅丰富了概率密度估计问题的求解,同时也使概率密度估计问题得到了比较好地解决。随着计算机水平的发展,一维随机变量概率密度估计对机器学习、目标跟踪等新领域内复杂过程的描述显得无能为力。因此,对高维随机变量概率密度估计问题的研究变的十分重要。但已有的参数估计方法和非参数估计方法都无法有效地解决高维概率密度估计问题。本文将积分算子法运用于概率密度估计,有效解决了二维随机变量概率密度估计,而且为高维随机变量概率密度估计问题的进一步研究提供参考。由概率密度估计问题的定义可知概率密度估计问题可归结为概率分布函数的求导问题,在用数值方法求解过程中由于样本量的限制,经验分布函数与真实分布函数之间必定存在差异,而这些微小的误差可能会造成概率密度估计的巨大偏差。可见基于数值微分的概率密度估计问题是不适定的。通过对数值微分问题常用求解方法进行综合分析,发现积分算子方法运用积分算子将微分问题转化为积分方程问题。这种方法不受问题维度的限制,可以灵活地应用于一维以及多维的数值微分问题中。将积分算子法应用于一维概率密度估计问题中,借助Taylor展开式得出基于积分算子法的概率密度估计;考虑到概率密度函数的非负性以及正则性,对积分算子法的合理性进行了论证。在二维情况下,积分算子法通过对两个变量依次求偏导推出二阶混合偏导,即二维概率密度函数,且二维概率密度估计为真实概率密度函数的逼近。非负性和正则性的验证充分证实了积分方法在二维概率密度估计问题中的合理性。本文通过数值模拟对积分算子方法在概率密度估计问题中的可靠性进行了论证,并于传统的核密度估计进行了对比,基于积分方法的概率密度估计方法与核密度估计效果相当的结论。