优化的互信息特征选择方法

来源 :湖南师范大学自然科学学报 | 被引量 : 0次 | 上传用户:linco87
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在文本分类中,互信息是一种被广泛应用的特征选择方法,但是该方法仅考虑了特征的文档频而没有考虑特征的词频,导致它经常倾向于选择出现频率较低的特征.为此,提出了一个新的文档频并把它引入到互信息方法中,从而获得了一种优化的互信息方法.该优化的互信息方法不但考虑了特征的文档频而且还考虑了特征出现的词频.实验结果表明该优化的互信息方法性能良好.
其他文献
目的: 建立HPLC法测定藿蓉补肾颗粒中淫羊藿苷的含量.方法:采用C18柱,乙腈-水(35∶65)为流动相,检测波长270 nm.结果:平均回收率为95.8%,RSD为0.89%.结论:该方法可有效地控制
本文以西南民族大学2003-2007年学科型人才引进为例,分析该校学科型人才引进的数量、层次和科研业绩,并根据调查结果提出民族高校学科型人才引进的对策:1.引进民族特色的学科
目的:建立乙肝颗粒剂的工艺质量评价标准.方法:采用双波长薄层扫描法对其中的大黄素进行含量测定.结果:大黄素在0.069~0.69 μg范围内线性关系良好,r=0.999 8,平均回收率为97.
胃食管反流病(gastro-esophageal reflux disease,GERD)是由于胃、十二指肠内容物反流入食道引起的症状或组织损害,常合并食管炎.本病在西方国家十分常见,且其患病率有逐年增