文本分类中互信息特征选择方法的研究与算法改进机应用

来源 :计算机应用 | 被引量 : 0次 | 上传用户:jywaco
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在深入研究传统互信息特征选择方法的基础上,详细分析了该算法分类精确度不高的原因。针对传统互信息算法中的负相关现象以及倾向于选择低频特征词的问题,提出一种基于互信息的特征优化选择方法。该方法在综合考虑频度、集中度、分散度等因素的基础上,通过引入三个调整参数,有效地保证了负相关特征在文本分类中不可忽视的作用,并且提高了高频词汇的选择比重。实验表明,改进的方法可以有效地提高文本分类精度,并且具有更好的稳定性。
其他文献
针对现有的故障预测技术无法从整体上反映系统性能下降趋势等问题,提出一种基于健康度分析的故障预测方法。首先,在支持向量机回归算法基础上构造多输出支持向量机,以实现健康度的多步预测,并提出一种和声蚁群算法优化支持向量机参数,解决了蚁群算法易陷入局部最优的问题;然后,根据最优参数建立拟合监测数据和未来健康度下降过程非线性映射关系的和声蚁群算法-支持向量机(HSACA-SVM)故障预测模型;最后,通过某装
期刊
随着办公自动化在社会各个领域的普及,产生了大量电子文件,如何收集管理好电子文件,发挥电子档案的优势,给档案工作带了新的挑战,也是档案管理者面临的关键性问题,要加强档案
水电厂作为企业的一种类型,常常会面临着离退休方面的种种问题。在企业运行过程中不可避免的会忽视了对于这些离退休人员的关心与照顾。员工是企业的基础,更是企业的支柱,而
文章采用时域和离散傅里叶逆变换域级联两种降噪方式,通过降低导频信号的噪声,由此来提升变换域通信系统信道估计值的准确性.最终的仿真结果显示:这一方法在时域降噪环境下同
My father is a worker.He is tall and strong.He is very funny and he often tells stories after dinner.I like those stories very much.
伴随着经济全球化和高科技更新的加速,企业之间的竞争逐渐演变为知识管理竞争的新格局.采购作为现代化企业管理中重要的一环和供应价值链上的核心之一,愈来愈受到企业和企业
期刊
九届全国人大常委会第十二次会议审议通过了修订的《中华人民共和国会计法》,这部为社会各界广泛关注的法律,前后修改了26稿,先后经过九届人大常委会三次会议审议才正式通过,
期刊
高等学校档案管理是高校管理的重要组成部分,也是高等院校开展"数字化校园"的重要组成部分。21世纪是知识经济和信息技术的时代,高等院校档案信息化的建设,对促进高等院校的创