WordNG-Vec:一种应用于CNN文本分类的词向量模型

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:djdyaqb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本特征提取(文本输入表示)作为文本分类技术的要点,其构建质量直接影响着分类系统的分类效果.现在最流行的文本输入表示——词向量(Word Vector)虽然考虑了词的相似性但忽略了局部词序特征,在一些情况下造成文本语义上的缺失和歪曲.为此,本文提出了一种结合N-Gram特征与Word2vec的词向量模型WordNG-Vec,其提取出的词向量(Word-NG向量),作为双通道卷积神经网络模型(DC-CNN)的输入.经过多组对比实验分析表明,在精确率(precision)和召回率(recall)和F1值三个评价指标下,本文提出的方法有效提高文本分类的效果.
其他文献
<正>上世纪末,我们针对传统教学中"师问教学"存在的问题,根据儿童认知方式,创立了适合每个儿童自主学习的"‘自问自探’教学模式"。经过十余年的探究,我们既实践了起初建构的
会议
在高速公路管理体系的应用中,监控系统发挥的作用是对高速公路中的车辆信息等内容进行监控和记录,以达到对高速公路运行状态的全面分析。基于对收费监控系统视频干扰源的了解
本文调查和分析了贵州雷公山自然保护区内天然秃杉群落的物种组成、外貌和结构特征。结果表明:该秃杉群落植物共有58科89属143种;群落垂直结构明显,分为乔木层、灌木层、草本
随着高等教育大众化进程的不断推进,我国在教育规模上发生了巨大的变化,教育模式也由过去的精英教育转向大众教育,极大增加了高等教育的多样性发展。在量增加的同时,高等教育
<正> 广告,作为信息行业中的一个重要组成部分,已经越来越受到人们的重视。广告时都在为某一特定的需要,采取各种形式,通过各种途径,向消费者传播自己的生产或经营的商品或服
本文运用文献调查的研究方法对国内外销售人员绩效考核的研究现状进行总结,在此基础上运用社会实践调查法、个案法以及层次分析法等研究方法在对凤都集团销售人员调查研究,并
自律教育是指培养个体自我约束、自我监督、自我择决、自我调整、自我激励行为的教育活动。它的根本目的是以倡导社会的行为规范和价值观为基准,使个体的行为实现由他律向自
当前,高职学生厌学、违纪现象比较突出,究其原因是多方面的,有学生自身的因素,也有学校教育方面存在的偏差.毋庸置疑,学生自律意识淡薄是重要原因.加强自律教育、增强学生的
期刊
月季花因其品种繁多、花色艳丽、持续开花等特性而深受世界人民的喜爱。为不断培育新的月季品种,通常采用播种、嫁接和扦插等方法。播种多用于培育新品种;嫁接与扦插可保持