基于随机森林的变量重要性研究

来源 :统计与决策 | 被引量 : 0次 | 上传用户:whitesharke
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对变量进行重要性度量是变量选择的依据.变量选择在复杂数据的统计建模和解释预测中具有广泛的研究背景.基于随机森林算法,文章对回归问题中的最小深度、变量在根节点的分裂频次、置换重要性、节点纯度等变量重要性度量进行了原理阐述,并采用数值模拟研究了各种重要性度量的性能,为新方法的设计提供了基础.
其他文献
20世纪70年代以来,元话语因其多功能性得到学界的普遍关注和研究,英美学界运用“元话语”这一术语,德国学界多称“元交际”.两者表述不同,其实所指一致.从阐述德国学界关于元交际的理论探讨出发,探讨元交际/元话语作为言外行为标记的实质,并以习近平主席和默克尔总理的新年致辞为语料探究其元话语运用特征,得以发现:德汉语料在元话语运用上具有明显的共性,演讲者都较多运用了人际互动元话语,并较多使用了有助于人际互动、强调观点的读者介入标记、明确表达标记、自我标记和用于组织语篇、解释说明的过渡标记、注释说明标记这些子范畴
建构文化新业态互联网平台的主体责任是关乎国家治理互联网文化产业体系和治理能力现代化的重大命题.文化新业态互联网平台主体责任的提出,意味着互联网平台及其相关文化业态在角色功能、市场地位、管理方式、行业治理效果等方面均发生了重大变化.文化新业态互联网平台的主体责任应包括意识形态责任、经济责任、社会责任、创新责任、法律责任和道德责任.在推进主体责任建构与治理中,其呈现出包容审慎、整体化治理、聚焦音视频产业、关注个人信息过度收集以及重构互联网伦理等特征.破解文化新业态互联网平台的主体责任建构与治理的障碍,需要厘清
为研究我国不同区域数字经济分类规模、时空分异及产业驱动特征,文章在已有研究基础上,将数字经济核算来源细分为数字化赋能设备、数字化赋能服务、数字化交易、数字化媒体这四大类行业增加值,同时构建区域经济数字化驱动特征分析方法,分析了我国区域数字经济分类规模、时空分异与驱动特征.结果 表明:2012-2019年,我国数字经济行业增加值构成中,数字化赋能服务类占比第一,广东、北京、江苏相对占优;第二的为数字化赋能设备类,广东、江苏绝对占优;数字化交易类排第三,山东、广东、江苏、浙江占优;数字化媒体类位居第四,湖南、