论文部分内容阅读
现有的类间桥挖掘算法容易挖掘出伪类间桥,从而降低了挖掘的准确率。文中使用卡方检测方法定义项集重要性,有效地去掉频繁项集中支持度较大但相关性并不强的规则,以此找到真实感兴趣的"桥",而且算法的质量和效率不会受到影响。实验显示,本文算法能避免产生伪类间桥,有效地降低了统计推断中的第二类错误(存伪错误),使挖掘的准确率得到提高。