基于改进互信息函数的文本分类方法研究

来源 :科技通报 | 被引量 : 0次 | 上传用户:shaomingfang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统文本特征提取时,选择特征函数可能不符合加权算法的需求,而在特征选取表现较差的互信息算法却在特征加权时有着较好效果,本文从向量旋转的角度出发,改进了互信息方法,在特征加权时加入词频信息和平衡因子,并且在实验中证明了改进的算法提高了互信息算法的召回率和精度,提高了算法的文本分类性能.
其他文献
为了解决电力隧道消防救援的难题,需要对消防机器人避障控制系统设计方法进行研究.采用当前机器人避障控制系统设计方法在电力隧道中对消防机器人进行控制时,存在响应性差和
从冗余函数、线性函数、自反函数、自双反函数四类特殊布尔函数的定义出发,讨论了检测含无关项特殊布尔函数的表格算法.该算法应用表格列出布尔函数1值最小项及无关项的二进
提出无刷双馈电机同步非线性控制模型仿真.首先,研究了无刷双馈电机的工作原理及电机运行方式;其次,针对非线性系统中四维系统动力性质,运用Lyapunov稳定理论以及自适应控制
提出一种基于模型预测控制的维也纳整流器.首先对维也纳整流器建模,然后提出相应的模型预测控制.为了解决维也纳整流器存在的中点不平衡问题,首先判断直流上侧电容电压和下侧
根据地质构造、震源机制和精定位方法对原平M4.2地震进行了分析研究.通过使用Snoke和CAP方法得到了原平M4.2地震的震源机制,结果显示本次地震为正断兼走滑活动.地震序列精定
二连盆地东缘林西地区上二叠统林西组发育巨厚层暗色泥岩,分布广泛,具有较好的油气资源潜力.以林西地区四条野外剖面的样品为研究对象,采用有机岩石学与有机地球化学的方法,
以桐庐阆里村石峦坞矿区DR1地热井为例,通过对DR1地热井周边的区域构造、断裂构造、岩石地层及水文地质特征等的综合分析,将DR1地热井位置选于区域复向斜构造内,即阆里背斜的
以食品中有机磷农药残留为目标,通过酶联免疫吸附分析法对其进行测定。将几类常见的蔬菜和水果作为实验样本,对采集的样品进行萃取处理。介绍了酶联免疫吸附分析法的基本原理