【摘 要】
:
基于向量空间模型的文本分类方法的文本表示具有高纬度、高稀疏的特点,特征表达能力较弱,且特征工程依赖人工提取,成本较高。针对该问题,提出基于双通道词向量的卷积胶囊网络
【基金项目】
:
国家自然科学基金(61762092);云南省软件工程重点实验室开放基金(2017SE204)
论文部分内容阅读
基于向量空间模型的文本分类方法的文本表示具有高纬度、高稀疏的特点,特征表达能力较弱,且特征工程依赖人工提取,成本较高。针对该问题,提出基于双通道词向量的卷积胶囊网络文本分类算法。将Word2Vec训练的词向量与基于特定文本分类任务扩展的语境词向量作为神经网络的2个输入通道,并采用具有动态路由机制的卷积胶囊网络模型进行文本分类。在多个英文数据集上的实验结果表明,双通道的词向量训练方式优于单通道策略,与LSTM、RAE、MV-RNN等算法相比,该算法具有较高的文本分类准确率。
其他文献
本文旨在探讨关联理论的关联方向性,即根据关联理论关联的概念和关于假设对个体关联的条件探讨话语对受话者、发话者、旁在者和话题等是否都关联的问题。分析显示关联是个矢
高职高专营销人才是面向市场第一线的高等技能型应用人才,其职业素养是多方面的。时下的教育领域普遍重视职业技能培养,对于职业道德的培养却是一块被轻视的"短板"。本文凭借对
在网络科技飞速发展的今天,大数据时代不断冲击着我们的视觉神经,网络科技的发展也不断改变着我们的消费观念,大数据的到来对企业的发展既是一个机遇,同时又是一个不小的挑战,因此
湿地在全球碳循环中发挥着重要作用,但湿地的碳储量估算仍存在很多不确定因素。用使对生长方程与碳/氮分析仪分析,同时测定大兴安岭永久冻土区沿过渡带环境梯度分布的7种典型
目的 确定含抑制结构域的蛋白3(ARRDC3)与微小核糖核酸-30d(miR-30d)在前列腺癌中的表达及ARRDC3的高低表达与前列腺癌进展和预后的相关性,探讨ARRDC3抑制前列腺癌进展的相关机制
“中国制造2025”提出以来,装备制造业迅猛发展,已形成相对完整独立的产业体系。党的十九大报告更是着重强调要深化供给侧改革,把经济建设着力点放在实体经济上。作为技术密集型实体经济的典型代表,电机设备制造业在我国电力需求逐年增大的强力拉动下,正面临崭新的发展机遇。然而,在我国生态环境恶化、能源削减、自我创新能力不足、产业结构失衡以及国内外电机设备市场竞争愈加激烈的大环境下,电机设备制造业也面临着诸多
目的:探讨多层螺旋CT在阑尾黏液囊肿诊断中的作用。方法:收治阑尾黏液囊肿患者6例,给予多层螺旋CT检查诊断,回顾性分析其临床及影像学资料。结果:6例患者术后经病理诊断为阑尾黏液
Pygmalion是英国现代戏剧之父萧伯纳的著名剧作。杨宪益先后出版了Pygmalion的四个中文译本。文章以切斯特曼的翻译伦理五个模式为视角研究杨宪益的四个译本,揭示出杨宪益坚持
农业、农村和农民问题 ,始终是我国革命、建设和改革的根本问题。当前我国“三农”问题的核心是就业问题。要从根本上解决“三农”问题就必须统筹城乡经济社会发展。而在发展
随着社会经济的不断发展,各种科学技术在信息传播当中得到了更为广泛的应用,这也就在一定程度上催生了新媒体的出现,各种各样的新媒体在人们的生活中发挥着更为明显的作用。