论文部分内容阅读
在要求可解释性的机器学习和统计应用中,变量选择对分类和回归任务十分重要.本文提出了一种基于Copula爛的变量选择方法,利用Copula爛值的阶次选择变量.本方法既是模型无关的又是参数无关的.在UCI心脏病数据的基础上进行了本方法与传统变量选择方法(包括距离相关、希尔伯特-施密特独立性准则、逐步选择、正则化广义线性模型和自适应LASSO)的对比实验.实验结果表明,基于Copula爛的方法能够更有效地选择‘正确\的变量,在不牺牲准确性性能的同时得到比传统方法更具可解释性的模型.