基于小波分析的特征提取文本分类方法研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:alanyu97
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文提出了基于小波分析的文本特征提取方法,对传统TF-IDF向量空间模型下的特征向量进行了该文的小波变换、逆小波变换。使用KNN分类方法检验这两空间下的文本分类准确率。实验结果表明,该文的小波变换方法在减少了TF-IDF向量空间模型近一半的维度下在各种实验条件中都能和向量空间模型保持一致的分类准确率;该文的逆小波变换方法在大幅度降低TF-IDF向量空间模型维度的基础上,同实验中其他特征提取方法相比,在特定条件下有着卓越的特定文本类别分类优势,这也在一定程度上检验了压缩感知理论的正确合理性。
其他文献
河南省许平南高速公路有限责任公司是由河南投资集团有限公司全资控股的高速公路运营企业,许平南运营管理处作为许平南公司的二级管理机构具体负责许平南高速公路(许昌至平顶
期刊
针对现行高速公路运营管理中存在的问题,融合先进机器人和无损传感技术,创新提出了可用于高速公路监测预警的移动机器人,利用现有护栏作为机器人移动载体,可实现自动前行、倒
本文基于绿色环保视域下全钢爬架与铝模搭配施工设计研究,通过对铝膜设计优势分析,明确铝合金模板建筑设计的注意事项及铝合金模板搭配施工建筑设计优化;通过实验结果对比图,
新材料基地召开第二届“燕山杯”新材料大赛验收工作会2019年12月3日,北京石化新材料科技产业基地(以下简称“新材料基地”)组织北创营召开第二届“燕山杯”新材料创新创业大
目的通过研究手汗症治疗中胸交感神经链切断位置与术后代偿性出汗的关系,探讨其并发症发生的可能机制。方法2004年10月至2005年12月我院手术治疗手汗症患者128例,术前随机分成
梅毒是一种慢性系统性的性传播疾病,近年在安徽省呈现快速上升趋势,报告发病数居全省乙类传染病第三位,是严重的公共卫生问题。为更好落实国家梅毒控制规划,构建综合防控机制
针对基于RSSI测距定位中偶然性测距误差和设备误差对定位结果影响较大这一问题,提出了一种误差离群去约束的优化方法。通过对三边定位结果使用K-means算法进行离群分析,得到
目的研究我国当今社会医患关系的大环境下,在校医学生对国内医患关系现状的认知情况与相应心理状态的相关性。方法随机抽取牡丹江医学院在校医学生800人,参照阳欣哲编制修订
<正>恒顺醋业(600305):食醋需求稳定还具潜在产能。2015年食醋产量约330万吨,行业内较大规模企业目前纳入规划或建设中产能约80万吨左右,将于未来几年逐步释放。食醋需求占调
期刊
儿童爬山车作为常见的大型游乐设施,由于设备自身特点和日常运营管理中的疏忽,经常存在一些意想不到的安全隐患,并可能会对乘客(尤其是儿童)造成伤害:基于多年的检验经验,本