文本聚类中的特征选择方法

来源 :吉首大学学报:自然科学版 | 被引量 : 0次 | 上传用户:kevin_dai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
介绍了3种用于文本聚类的特征选择方法:文档频度、单词权、单词熵.用一个中文文本语料库对这3种特征选择方法进行了比较实验,实验结果表明在文本聚类中单词权的特征选择方法具有最好的选择结果.
其他文献
一、制定汉字结构大小控制规范的必要性1.保持整副字体的统一性,即设计者认可的规范。汉字本身具有历史悠久、信息量大、易于识别、音图兼容等特点,同其他国家文字的差异很大,而
在提倡素质教育的今天,学校体育是素质教育的重要手段,为了促进体育教学的改革,提高学校体育工作在学校教育中的地位,突出学校体育在实施素质教育的作用,提示现阶段学校体育工作所