基于语义的文本特征加权分类算法

来源 :计算机应用研究 | 被引量 : 10次 | 上传用户:liongliong421
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类存在维数灾难、数据集噪声及特征词对分类贡献不同等问题,影响文本分类精度。为提高文本分类精度,在数据处理方面提出一种新方法。该方法首先对数据集进行去噪处理,结合特征提取算法和语义分析方法对数据实现降维,再利用词语语义相关度对文本特征向量中每个特征词赋予不同权重;并利用经过上述处理的文本数据学习分类器。实验结果表明,该文本处理方法能够有效提高文本分类精度。
其他文献
从样品制备、实验前准备、严格控制升温速度、正确掌握探针测试技术等方面论述了烟煤胶质层指数测定中应特别注意的问题,以获得准确、可靠、及有价值的结果。
针对现有数据复原汇聚算法的复原汇聚精度低和对网络噪声干扰的稳健性差等不足,提出了一种基于相似度的无线传感器网络数据复原汇聚算法。该算法在分布式数据汇聚模型的基础上,利用重心距离和相关系数来衡量各簇节点感知数据的受攻击程度,并把两者统一在加权系数中,通过加权运算提高了算法的数据复原汇聚精度。此外,利用相关系数对噪声干扰敏感的特点提高了算法对网络噪声干扰的稳健性。理论分析和仿真结果表明,新算法的性能优
提出了一种单目摄像头下定位人眼瞳孔的方法,分为人脸区域检测、人眼区域检测、瞳孔中心定位三个阶段。在人脸区域检测阶段,利用人脸的肤色和唇色在不同色度空间下的特性,结合区域增长的方法分割出人脸区域;在人眼区域检测阶段,利用定位出的人脸区域,根据先验知识缩小搜索区域,再结合遗传算法搜索眼部区域;最后利用圆的几何性质定位瞳孔中心。实验结果证明了本算法在复杂背景和头部偏转情况下的有效性。
针对传统源估计方案不易于扩展至大量传感器问题,首先提出了基于两层WSN的新迭代译码DJSCC方案,其具有低复杂性和高可扩展性。该方案使用每集群的两个sink节点提供差分空时分组编码(DSTBC),其易于扩展到大量传感器,适合间接源观测应用,还适用于时变观测精度模型。通过对BER性能上限的分析,建立了系统模型,并进行了系统仿真。仿真结果表明:a)与基本解码方案相比,该方案算法的BER系统性能提高了1
在分析带有时间窗车辆调度问题的基础上,建立了车辆调度问题的数学模型,并构造了不同时间窗的惩罚函数。设计了针对车辆调度问题基于自然数编码的遗传算法,并改进了传统的交
通过研究大规模汇聚路由器(ACR)网络结构特点和IPTV业务的组播组切换步骤,提出一种ACR下的先复制、后鉴权的频道快速切换方法,减小了频道切换时延,提升了用户体验。该方法通过各部分时延的相互覆盖,并行处理切换步骤,达到了缩短总时延的目的,形成频道快速切换。由仿真得到的各关键参数的分布图显示,与传统的频道切换方法相比,所述方法进一步减小了频道切换时延,得到了很好的效果,同时不需要增加任何额外带宽和
研究了从基因芯片中挖掘差异双聚类的算法。差异双聚类中的基因在不同类别的数据中表达水准不同,这样的差异双聚类可以有效地找出影响基因表达水平的关键实验因素以及对实验条件敏感的基因。传统的双聚类方法采取分别在两类基因数据中找出聚类,再进行比较以得到最终的差异双聚类,该策略的时间效率不高。为了快速地找出差异双聚类,提出一个全新的基于权值图的差异双聚类方法,该方法的主要创新之处在于直接在由两类数据构成的权值
为保证煤炭实验室检测数据结果的可靠性,可应用数理统计方法对标准样品的检测结果、仪器的运行状态及试验结果的可靠性进行相应的分析。
从仪器的微波干燥原理、微波干燥功率控制、硬件结构及工作流程等方面,介绍了一种采用单片机控制的微波干燥水分的测试仪。仪器采用大屏幕液晶显示,具有自动化程度高,测试速度快
近十年来,智能交通系统(ITS)和车载网络开始融合紧密,从而彻底改变了事件侦查和交通信息传送的方式。车辆碰撞协同预警系统是其中一个重要方向。根据预设的一系列车辆碰撞协同预警系统(CCWS)的参数,如前后两辆车之间的距离、司机的反应时间、相对速度和加速性能等,采用Copula模型对这些参数进行分析并得到车辆发生碰撞的条件概率,从而为其建立相互的联系,从全局的角度多方面对碰撞作出预测。最后的仿真验证了