融合卡方统计和TF-IWF算法的特征提取和短文本分类方法

来源 :重庆理工大学学报:自然科学 | 被引量 : 0次 | 上传用户:zhangwang198
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种融合卡方统计和TF-IWF算法的短文本分类方法,通过卡方统计对训练数据集提取特征词,由TF-IWF算法赋予特征词权重,使用SVM分类器进行分类。实验结果表明:融合卡方统计和TF-IWF方法在文本分类准确率上提升3.1%,召回率提升5.2%,F1值提升3.7%。该方法扩大了特征词权重值的范围,使文本集的权值方差增大,一定程度上解决了短文本内容稀疏性的问题,从而提高短文本分类的性能。
其他文献
介绍了变温吸附除水技术在氯乙烯生产中的应用,对运行中出现的问题进行优化改进,并对运行做出归纳总结。
为了解决无人承载式车身在复杂工况下由于非线性耦合导致目标函数求解困难的问题,提出基于数据驱动和多目标遗传算法相协同的不确定性优化方法。数据集以车身各结构面的特征
为了提高智能汽车在恶劣天气下的环境感知能力,提出一种针对雾天环境下车辆和行人的检测方法。将AOD-Net去雾算法与SSD目标检测算法相结合,实现了城市交通雾天环境下的车辆和行人检测。利用去雾处理后的雾天图片和原始带雾图片分别进行目标检测模型训练,并在不同雾浓度等级的交通环境下进行车辆和行人检测,结果显示:AOD-Net与SSD网络相结合得到的检测mAP值可达75.8%,比SSD算法的m AP值高4
介绍了一种可燃、有毒气体在线监控及预警系统的工作原理、结构组成及应用范围,通过应用实现了企业管理目标。
通过水热法,在泡沫镍表面原位生长镍钴金属氢氧化物。所合成泡沫镍负载纳米草状钴氢氧化物在1mol/LKOH电解液中,电流密度为50、100、200mA/cm2时的析氧过电位分别为316、341
针对某型纯电动汽车进行轮毂电机参数匹配设计,建立整车参数化模型;以横摆角速度和质心侧偏角偏差作为控制目标,基于滑模控制理论及罚函数法,提出整车横摆稳定性控制和轮毂电
为解决网络应用加密传输中大部分分析加密流量的方法忽略通信维持的简化阶段的流量分类,并且网络中应用指纹有大量重复的问题,提出一种新型的加密流量分类方法。将报文长度作
目前,中国聚氯乙烯行业稳步发展,新技术不断应用,安全环保水平不断提高,生产经营取得了较好成绩。如何适应国家“碳达峰”、“碳中和”目标的要求,保持聚氯乙烯行业的高质量
为研究高速列车在脉动横风作用下的平稳运行问题,基于多刚体动力学及空气动力学理论,建立了高速列车八辆编组动力学模型及空间脉动横风载荷模型,并分别给予了模型验证。基于
针对在栅格地图中移动机器人规划路径问题,传统A~*算法容易忽略机器人实际大小,生成的路径存在与障碍物发生碰撞的可能性,提出一种拓展节点障碍物矩阵的方法。在设定机器人投影和每一个栅格大小比例关系的基础上,将每一个栅格拓展为n阶障碍物矩阵,针对栅格存在部分障碍物的情况对邻域搜索方式进行改进以提高生成路径的合理性。同时针对在复杂地形(如山地)条件下生成路径较陡峭的问题通过引入坡度信息改进代价函数计算方式