基于位置的文本分类样本剪裁及加权方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:aaitata
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
k近邻方法是文本分类中广泛应用的方法,对其性能的优化具有现实需求。使用一种改进的聚类算法进行样本剪裁以提高训练样本的类别表示能力;根据样本的空间位置先后实现了基于类内和类间分布的样本加权;改善了k近邻算法中的大类别、高密度训练样本占优现象。实验结果表明,提出的改进文本加权方法提高了分类器的分类效率。
其他文献
在模拟电路演化领域,电路知识表示是首要解决的问题。网表编码操作简单,对于拓扑结构没有限制,但是网表编码会在种群初始化和遗传操作过程中产生大量的非法电路个体。为解决这一
LDA没有考虑到输入,在原始的输入空间上对每一个词进行主题标签,因保留非作用词,而影响了主题概率分布。针对这种情况提出了一种m RMR_LDA算法,预先使用m RMR特征选择算法将
随着城市现代化进程的不断加速,建立高效、完善的城市应急事件管理系统迫在眉睫。遍布城市各处的监控摄像头拍摄的监控视频是城市应急事件管理系统重要的数据来源,但在现阶段主要依赖人工识别,费时费力且效果不佳。提出一种面向城市应急管理的监控视频智能解析方法,利用计算机视觉库获取视频中监控对象的数量和位置,生成其运动轨迹并匹配预设的异常运动模板,从而构建应急事件的规范化情境模型用以分析和预警。以某大学校园开放
针对传统全速度差(FVD)模型缺乏考虑前车最优速度影响的局限性,提出了一种改进的全速度差(IFVD)模型。在IFVD模型中,除了考虑跟驰车自身的最优速度和前车的速度差外,还进一步分析
对现有Linux系统下Rootkit检测技术的原理进行分析,并提出了基于Kprobe的Rootkit检测技术。通过在关键路径下插入探测点,在内核底层收集Rootkit所要隐藏的对象信息,最后通过
伴随着信息化全面建设,越来越多的信息化系统运用于各行各业,为广大的人民群众和国家带来信息化时代的便捷性与优越性,但是同时随之产生一系列复杂的安全问题也亟待解决。因