论文部分内容阅读
针对sIB算法互信息与精确度的相关性不稳定问题,提出一种优化算法CF-sIB。CF-sIB算法用IB失真度量方法来度量文本的特征项和类别的共现关系,进而提取sIB共现特征解并对其进行优化,从而得到精确度更高的聚类结果。实验表明,CF-sIB可以有效提高sIB算法的精确度,并且可以使算法的互信息与精确度的相关性保持稳定。