一种基于改进TF—IDF函数的文本分类方法

来源 :河南师范大学学报:自然科学版 | 被引量 : 0次 | 上传用户:ck2112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决传统TF—IDF函数由于忽略特征项之间的联系带来的诸多问题,对TF-IDF函数在文本分类中的应用进行了研究.结合信息论相关知识,找出了类间分布度和类内分布度表征特征项之间的潜在关系,进而提出改进的TF—IDF函数用于文本分类.实验表明,改进后的TF—IDF函数是有效可行的,而且较好的弥补了传统方法所丢失的特征项之间的关联信息,提高了文本分类的准确率.
其他文献
研究了基本培养基,IBA,活性炭和蔗糖对“金丰一号,,金银花生根的影响,结果表明:基本培养基为1/2MS时,生根效果较佳;IBA3mg·L^1-,时,试管苗生长较好,生根也快;从节约成本出发,蔗糖的浓
目的观察绝经前后妇女骨密度的变化与甲状旁腺激素、降钙素和1,25(OH)2D3及相关生化指标间的关系.方法采用X线骨密度仪测量骨密度,用放免法检测患者血中甲状旁腺激素、降钙素
提出了一种新的基于二代小波的消噪算法,可以有效地消除激光回波信号中的噪声.仿真结果表明,该算法可以有效地提高信噪比,降低激光回波信号中所含有的噪声,与传统小波去噪算法相比
对一种加氢转化的煤焦油采用气相色谱/质谱联用仪(GC/MS)技术,分析了此改质煤焦油中的化学组成,从而获得了一些有意义的数据.结果表明:从中鉴定出207种化合物,各类化合物的特征和分布
水稻OsRhoGDI2是通过酵母双杂交筛选到的小G蛋白Rho家族成员OsRacD互作蛋白的编码基因,为了研究OsRhoGDI2与OsRacD的相互作用及其在水稻发育中的功能联系,本研究基于序列比对
2000年4月至2008年11月对河南内乡宝天曼国家级自然保护区的两栖动物资源进行了调查,共发现11种,隶属于2目、5科、10属。区系组成以东洋界和广布种为主,各5种,分别占该区两栖
采用两种不同的势模型下J/ψ波函数,在微扰QCD框架下,计算了Bc→J/ψ形状因子,并对结果进行讨论.
我们对年老体弱及患有高血压、心脏病等不适应做腰椎牵引治疗的患者采用干扰电加超短波与单用干扰电治疗,现报道如下:1对象和方法1.1临床资料干扰电加超短波组50例,其中男36
通过煤质分析,挑选出了适合宁东甲醇厂德士古水煤浆(CWS)加压气化工艺的宁东地区原料煤———羊场湾矿,遴选出了适合羊场湾矿煤制水煤浆的木质素磺酸盐分散剂,同时考察了不同来
目的观察交叉性失语的康复效果.方法对5例右利手右侧病变引起失语的患者进行汉语失语成套测验中的口语流利性评定、西部失语评定,以及采用波士顿诊断性失语严重程度分级标准