论文部分内容阅读
摘 要:随着科技的不断发展,数据压缩技术的不断成熟,海量信息特征的时代也随之到来。而这些信息样本之间很多是模糊近似关系,那么在这种类似场合中,我们可以用模糊等价关系(fuzzy equivalence relation)来进行聚类分析,度量信息样本的相似性程度,最终可用于判别分类。
关键词:信息特征;模糊等价关系;信息度量
以上阐述了模糊粗糙集模型中的一些信息度量方法[1,2],本文中也采用了其中的交互信息来逐一判断某一特征所携带的信息量以及特征与特征之间是否是冗余的,并分析其在最终的分类模型中的判别能力。
二、交互信息的应用
交互信息(mutual information)的应用范围非常广泛,涉及到机器学习中的特征选择(feature selection)、医学影像学(medical imaging)、统计力学(statistical mechanics)、宇宙学(cosmology)等众多领域。在很多应用范畴内,具有最大化的交互信息便可以提高隶属性,当然,这通常等同于最小化条件熵。
在机器学习范畴内,交互信息经常用来作为特征选择的一个准则。它可以被用来描述样本之间的相关性以及冗余性,从而可以用来选择出那些判别能力强而相互之间又不会出现冗余现象的特征。
交互信息還可以用来确定某一数据集中两个不同聚类之间的相似性。因此,相对于传统的兰德指数(Rand index)来说,交互信息具有更大的优势。
交互信息的应用极其广泛,除了上面列举的几个不同的领域,还有很多领域内均有涉及交互信息,在此就不会逐一介绍了。
参考文献
[1] Wang C,Qi Y,Shao M,et al. A Fitting Model for Feature Selection With Fuzzy Rough Sets[J]. IEEE Transactions on Fuzzy Systems,2017,25(4):741-753.
[2] Hu Q,Yu D. ENTROPIES OF FUZZY INDISCERNIBILITY RELATION AND ITS OPERATIONS[J]. International Journal of uncertainty,fuzziness and knowledge-based systems,2008,12(05):575-589.
关键词:信息特征;模糊等价关系;信息度量
以上阐述了模糊粗糙集模型中的一些信息度量方法[1,2],本文中也采用了其中的交互信息来逐一判断某一特征所携带的信息量以及特征与特征之间是否是冗余的,并分析其在最终的分类模型中的判别能力。
二、交互信息的应用
交互信息(mutual information)的应用范围非常广泛,涉及到机器学习中的特征选择(feature selection)、医学影像学(medical imaging)、统计力学(statistical mechanics)、宇宙学(cosmology)等众多领域。在很多应用范畴内,具有最大化的交互信息便可以提高隶属性,当然,这通常等同于最小化条件熵。
在机器学习范畴内,交互信息经常用来作为特征选择的一个准则。它可以被用来描述样本之间的相关性以及冗余性,从而可以用来选择出那些判别能力强而相互之间又不会出现冗余现象的特征。
交互信息還可以用来确定某一数据集中两个不同聚类之间的相似性。因此,相对于传统的兰德指数(Rand index)来说,交互信息具有更大的优势。
交互信息的应用极其广泛,除了上面列举的几个不同的领域,还有很多领域内均有涉及交互信息,在此就不会逐一介绍了。
参考文献
[1] Wang C,Qi Y,Shao M,et al. A Fitting Model for Feature Selection With Fuzzy Rough Sets[J]. IEEE Transactions on Fuzzy Systems,2017,25(4):741-753.
[2] Hu Q,Yu D. ENTROPIES OF FUZZY INDISCERNIBILITY RELATION AND ITS OPERATIONS[J]. International Journal of uncertainty,fuzziness and knowledge-based systems,2008,12(05):575-589.