论文部分内容阅读
具有连续属性的分类问题普遍存在,目前主要采用两种方法来处理连续属性:一种是将连续属性进行离散化;另一种是基于高斯函数或高斯核函数来估计属性密度.连续属性的离散化可能导致信息丢失、引入噪声和类对属性的变化不够敏感等问题,而高斯函数和高斯核函数在属性密度估计中各有优势与不足,但它们具有很强的互补性.该文依据Copula和贝叶斯网络理论,结合高斯Copula密度函数、引入平滑参数的高斯核函数和以分类准确性为标准的属性父结点贪婪选择,建立连续属性约束贝叶斯网络分类器,既可以避免连续属性离散化所带来的问题,又能够实