基于Word2vec和改进型TF-IDF的卷积神经网络文本分类模型

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:dfgforrest
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统机器学习文本分类算法语义特征表达弱、文本表示维度高、词序丢失、矩阵稀疏等问题,提出基于Word2vec、改进型TF-IDF和卷积神经网络三者相结合的文本分类模型(CTMWT):首先通过Word2vec模型训练得出样本中所有的词向量;然后提出基于类频方差改进型TF-IDF算法,分析每个词向量在文本中的权重,构建基于词向量和权重的文本向量表示;最后借助卷积神经网络从局部到全局相关性特征的学习能力,对该大量文本向量进行深度学习.试验结果表明三者结合的文本分类模型不仅能实现文本的准确分类,并且相比传统的机器学习文本分类算法具有更好的分类效果.
其他文献
回归分析中,如果自变量仅有一个,则只能进行单变量回归分析,拟合一条曲线.虽然该曲线能够反应数据发展的总体趋势,但是却不能体现数据在总体趋势周围的波动性,导致依据该拟合
大学生入党积极分子思想政治教育是高校培养党的后备军和各项建设事业接班人的重要阵地和主渠道,基于网络思想政治教育维度,从新时期高校大学生入党积极分子思想政治教育面临
力学中的杠杆定理可以推广应用在金属学中,用来分析相图,求合金中各相的相对含量,预测合金性能.
文章研究了商贸旅游企业集群发展的成因和模式结构,提出了天津滨海新区都市旅游企业集群发展应在市场核心导向、政府积极参与模式下组建"龙头+网络"式的旅游企业集群,实施创
随着“恐怖主义”在全球的蔓延,“生物恐怖”、“生物战”已是摆在世界各国人民面前的突出问题,本文就几种主要的可作为生物恐怖病原和生物战剂的微生物的致病作用和防治方法做
【正】随着电力体制改革的不断深入,供电企业运行机制、管理方式都将相应发生的重大变化。改革势必会对既有的利益分配格局有所触动、有所调整,人们的思想产生波动在所难免。
建立了油气润滑系统中油气分配器的仿真模型。基于该模型仿真了分配器分配界面油气两相的分布,计算了不同锥度时出口的液相分流系数;分析了锥体锥度对油气分配器液相分配性能的
高中是学生学习成长的关键期,这个阶段学生学业繁重,心理压力大。这时教师尤其是班主任应该要积极疏导学生,与学生进行谈话并了解学生情况从而对学生进行疏导,班主任在与学生进行