一种改进的文本分类特征选择算法

来源 :微电子学与计算机 | 被引量 : 0次 | 上传用户:jjjdddlll
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有的一种特征选择算法DPM(Discriminating Power Measure)[1],是通过计算每个特征在某一类别和剩余其他类别中的文档频,比较了特征对一个类别和对其他类别的贡献,提取出具有强类别区分能力的特征词.在研究此特征选择算法的基础上,提出了一种改进的特征选择算法,该算法同时考虑了每个特征的类别频次在计算特征类别区分能力方面的重要性.经实验验证,改进后的特征选择算法能够获得较好的分类效果.
其他文献
嵌入式实时操作系统(Real Time Operating System,RTOS)同通用操作系统有很大的联系,但区别也很明显.因此对RTOS的评价要从很多角度进行,对RTOS测评方法也多种多样.通过对实时嵌入式系统和基于μITRON4.0标准的操作系统TOPPERS/ASP等的研究,深入分析RTOS的执行流程和TOPPERS/ASP系统完备的日志系统功能,并采用TOPPERS/ASP完善的日志l
误报率和漏报率影响入侵检测系统检测结果的可信性.通过从理论上分析误报和漏报产生的原因,提出了多检测系统协同工作提高检测可信度的方法.多检测系统结果融合时采用推进贝叶斯
在天威特变公司,装配车间套焊组是变压器生产的关键班组,主要工序包括变压器的套包、插铁、焊线,现有员工49人,是以30岁以下年轻人为主的一个集体。装配车间套焊组以星级和谐精益
说到班组制度建设,首先浮现在班组长脑海中的一个疑问是:班组中的各项制度已经很多,堆砌成山,班组还需要进行制度建设吗?毫无疑问,即使企业已经制定了各种门类齐全的制度,但是
石油及天然气的主要成分是烃类碳氢化合物,具有易燃、易爆、易聚集静电、易中毒等特性,而油气储运过程是在特定的条件下进行,特别是输油管道,加热加压是管道运输的特点,故具
慈溪植棉历史悠久,1957年就提前达到《全国农业发展纲要》指标,曾受到周总理的表扬。《慈溪棉花》科教片映遍全国各棉区,曾有1300多位植棉能手分赴全国15个省市传授技术,对全
提出了一种针对混合信号SoC中ADC的动态参数与静态参数测试的内建自测试方案.由于动态参数和静态参数在同一个测试电路中都能够得到测试,因此能够更加全面准确地反映待测器件的
给出了一种能够实现多种散列函数的VLSI-IP模块设计,应用到一种网络安全处理器的认证模块设计中.在实现SHA-1和CHI安全散列函数运算的基础上,进而利用迭代技术实现散列消息鉴
提出了一种新的基于图像区域纹理混合矩特征的飞机识别算法.该算法基于一阶直方图的颜色矩特征和基于灰度共生矩阵提取区域图像相关性、角二阶矩、对比度、相关性、倒数差分矩特征,实现有效降维,并采用聚类分析方法对飞机图像进行识别,实验结果显示基于该特征提取的识别方法识别正确率达95%以上,通过对比试验说明,该算法有较好的识别性能.
总剂量辐照下,存储单元和MOS管阈值电压均会发生漂移,引起灵敏放大器性能退化.基于0.6μmSOI工艺,设计了一种用于SONOSEEPROM存储器中的高速、辐照加固的新型灵敏放大器.该电