论文部分内容阅读
对后继阶段的机器学习或数据挖掘过程而言,决策系统中连续属性值的离散化具有非常重要的意义.本文系统地研究了基于粗集理论的数据离散化方法:提出一种计算候选断点集合的算法;定义概念'选择概率'来合理、有效地度量和区分候选断点的相对重要性;最后基于这一概念提出一种确定结果断点子集的启发式算法.理论分析及仿真结果表明,算法的综合性能优于文献报道的同类算法.