论文部分内容阅读
对软件度量元的选择问题是软件缺陷预测中的重要研究内容之一。文中通过采用互信息(MI)来计算度量元与度量元、度量元与目标类别之间的相关性,提出了信息损失最小准则,并将该准则作为Filter模型中消除冗余度量元的依据,然后结合现有的Wrapper模型来选择最终对分类有帮助的度量元集合。该方法既能减轻Wrapper模型高计算成本的负担,又能弥补单纯使用Filter模型对软件缺陷的预测能力相对较弱的缺点。实验表明:该方法在召回率、F-measure值上都有明显的提高,具有一定的有效性和实用性。