基于注意力词向量的情感分类方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wangle2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,网络为人们获取信息、传递信息以及交流情感提供了更多渠道。我们用微博分享自己每天的所见所闻;使用网络进行购物,然后留下评论;出差旅游之前在网上预约酒店,入住之后分享用户体验??这些数据囊括了人们的衣食住行,对消费者、商业组织、甚至政府部门都有巨大的价值。如何高效地从海量数据中挖掘情感信息,成为当前急需解决的问题。机器学习技术为情感分类问题提供了许多方法。尤其是近些年深度学习的发展,为情感分类问题的解决带来了新动力。但仍存在许多不足,有待解决。使用深度学习处理自然语言处理问题首先要把文字转化为计算机可以处理的形式,当前比较常用的是词向量的方式。虽然词向量在许多任务上都取得了优异表现。但是当前大多数词向量训练方法都是基于词语的上下文信息计算词向量。在中文领域,词语的意思还包含在组成它的字之中。本文提出了基于注意力机制的词向量训练方法,在词向量中加入字向量的信息。同时,在加入的过程中考虑不同字的重要程度。最后在相似度计算、逻辑推理、情感分类等任务上,验证该方法得到的词向量具有更加优秀的表示能力。经过多年积累,现有许多不同的情感分类模型,例如支持向量机、卷积神经网络、循环神经网络等等。这些模型基于不同的假设,从不同的角度抽取数据中的知识。为了获得更好的效果,可能将不同的模型进行集成。传统的集成方法在结合策略的选择上常用投票法、平均法、或者学习法。这些方法增加了测试阶段的计算量。本文提出了基于师生网络集成学习方法。先单独训练多个个体分类器,然后初始化一个新的神经网络作为目标分类器。目标分类器的训练过程除了要参考正确类标外,还加入个体分类器的判断信息。通过这种方式,将多个分类器压缩进一个分类器中,在保持原有的性能的同时,花费更少的计算代价。
其他文献
<正>立体几何中的二面角问题是高考的高频考点,题目一般是中等难度.自从新课标引入了向量知识,使得求二面角余弦值的方法在以往综合法的基础上又多了一个以向量为工具的向量
“金牛奔,大地春”,披着新春朝霞,改版后的《湖南教育》第一期以它“三多三少”的崭新面貌呈现在我们面前——多了大刊的大家风范,少了小刊的小家子气;多了新闻刊的鲜活神韵,少了业
教材是学生学习的凭借,是教师教学的依据,谁都知道教材对于教学的重要意义。然而,叶圣陶先生早在几十年前就指出:“语文教材无非是个例子,凭这个例子要使学生能够举一反三,练成阅读
本刊讯祁阳县针对全县教育系统线长面广、人员多、思想活跃的特点,制定管理兴教“三步走”思路,分阶段推进学校管理工作,取得了良好的效果。
随着陕西冬枣生产规模不断扩大,传统买成品苗回来移栽技术已经无法满足这一要求。为快速繁育大量的优质壮苗来扩大生产提早挂果提高枣品质量,采用原地育苗原地嫁接育苗技术,
学校处在一个动态的发展过程中,对传统的学校管理模式进行改革,必然会受到旧体制的影响和制约。要让新管理体制正常诞生、科学运转,必须让学校所有成员都积极参与学校的管理,把管
班干部的选拔和任用是班级管理的重要一环。班干部使用得当,可以起到班主任“左右手”的作用,从而切实提高班主任的管理效率;反之,则可能无助于班级日常管理工作的开展。所以,如何
一怪:家长重儿女学龄前期语文教育,轻学龄期语文辅导 父母是儿女第一位老师。随着计划生育政策的大力推进,农村小孩逐步减少,加上农村经济的飞速发展,农村家庭人力、物力、财力大
作为践行"走出去"国家战略的先锋,我国电力建设企业凭借技术实力和项目实施经验,在国际市场上有较强的竞争力,名声也越来越响。然而,国际市场异常激烈,业务模式不断推陈出新,