基于信息论的连续属性离散化

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:akiheeca
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
使用信息论的方法进行连续属性的离散化.引入Hellinger偏差HD(Hellinger Divergence)作为每个区间对决策的信息量度量,从而定义切分点的信息熵,最终的离散化结果是使各区间的信息量尽可能平均.分析了HD度量在两种离散化方法中的作用,说明它在划分算法中运用比较理想,而在归并算法中则有局限.
其他文献
在研究分析传统低压无功补偿系统的优缺点及实际运行效果后,提出一种以P89C54为主体的新型动态无功补偿控制系统的设计方案.以无功缺额作为主判据,电压作为辅助判据,有效地克
基于网络机群这一新的并行环境和消息传递界面MPI给出了两种不带平方根的Cholesky并行分解算法,算法采用行卷帘存储方案和提前发送策略,从而减少了负载的不平衡,增加了计算通
三维工厂模型真实感图是工厂设计、施工中非常重要的资料之一,通过检查三维工厂真实感模型,设计人员可以及早、快速、直观发现三维工厂设计中的错误,提高设计单位图纸的设计质量
设计模式是解决某一问题方法在理论上的抽象,在软件设计中利用设计模式技术可以在架构上实现软件的重用,可以更加简单方便地复用成功的设计和体系结构.根据一种称为反应器的