基于频繁项特征扩展的短文本分类方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:bccom
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
短文本具有特征维度高且稀疏等特点,导致将传统的分类方法应用于短文本分类时效果较差。针对此问题,提出基于频繁项特征扩展的短文本分类方法(Short Text Classification Based on Frequent Item Feature Extension,STCFIFE)。首先通过FP-growth算法挖掘背景语料库的频繁项集,结合上下文的关联特征,计算出扩展特征权重;然后将新特征加入到原短文本的特征空间中,在此基础上训练SVM(Support Vector Machine,SVM)分类器,并
其他文献
分块压缩感知的提出很好地弥补了大尺寸图像占用资源多、重构耗时长等不足,但重构后的图像存在明显的块效应。针对现有图像纹理复杂度分析不够准确,导致自适应采样率分配后块效应降低不理想的问题,提出了一种基于灰度共生矩阵的图像自适应分块压缩感知方法。该方法通过共生矩阵分析图像的纹理特性,自适应分配采样率,在总采样率不变的前提下使纹理复杂度高的子块获得较高的采样率,纹理复杂度低的子块获得较低的采样率,并用SA
针对大部分现有的人群计数方法被应用到新的场景时性能下降的问题,在多层BP神经网络框架下,提出一种具有无参数微调的人群计数方法。首先,从训练图像中裁切图像块,将获得的相似尺度的行人作为人群BP神经网络模型的输入;然后,BP神经网络模型通过学习预测密度图,得到了一个具有代表性的人群块;最后,为了处理新场景,对训练好的BP神经网络模型进行目标场景微调,可追求有相同属性的样本,包括候选块检索和局部块检索。
研究了辐射式雷达多目标模拟测试系统中,数字射频存储(DRFM)单元的设计问题,首先根据辐射式雷达多目标模拟测试系统的设计要求,提出一种基于高性能FPGA和软件无线电(SDR)技术
分析现有的基于TDOA的无线传感器网络定位系统与算法,使用基于超声波传感器和无线射频模块的到达时间差(TDOA)测距技术,完成了该定位系统、机制和算法的设计和实现;针对传感器网络在实际应用中的不均匀性布撒和不良节点定位等问题,在TDOA测距技术和多边测量定位算法的基础上,提出一种改进的定位算法,以提高网络定位性能;实验表明,改进后的定位系统有效的减小了网络的定位误差,解决了不良定位问题,可应用到无
针对传统数字滤波在红外光谱细胞水分检测中采样点平均后各峰值削减的严重问题,提出了一种基于LabVIEW的滤波方案,设计了相应的相关算法,并对滤波信号进行时域和频域分析;在此基础上,构建并开发了基于LabVIEW的数据分析处理系统;实验结果表明,该数据分析处理系统测量精度高,数据实时处理能力强,具有良好的推广和应用前景。