基于注意力的对抗多任务评论文本分类

来源 :大连理工大学 | 被引量 : 2次 | 上传用户:xiezuoyaoxiezuoyao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今社会生活中,机器学习已经成为一个重要的研究话题和应用趋势。而在机器学习领域内,对于文本进行分类处理与分析是重要的研究方向并且具有实际应用价值。多任务学习通过利用多学习任务中所有有效的信息来缓解数据稀疏性问题,从而帮助每个任务提升学习能力,得到更为准确的结果。同时,通过学习任务之间可以互相利用的信息,分析未来数据,来帮助缓解数据稀疏性问题。从理论分析和实际应用中,多任务学习都要比单独学习这些任务表现的更具优势。目前,针对现有的传统多任务文本分类学习模型不能够对文本特征进行有效提取的问题,以及容易忽略输入信息重要程度的问题,本文将注意力机制与对抗多任务学习相结合,从评论文本数据输入处入手,引入注意力机制,提出基于注意力的对抗多任务文本分类模型。注意力机制是依靠权重对文本数据中能够反映文本特征的重要的文本信息进行重点关注,并达到对文本数据特征有效提取的目的。以往的注意力机制较为普遍地应用于图像处理任务上,近几年才开始在文本处理等任务上引入。注意力机制通过训练权值,加权计算,合理表示文本数据信息,按照重要程度学习文本信息,对后续学习任务有显著帮助。通过对比四种多任务文本分类学习模型的最高正确率显著说明本文设计的模型的正确性和优势,对比四种多任务文本分类学习模型在多个任务上的平均正确率来说明模型在多任务文本分类问题上的普适性和正确性,较为直观地说明基于注意力的对抗多任务文本分类模型能够有效地解决一般的传统多任务文本分类学习模型不能够对文本特征进行有效提取的问题,以及容易忽略输入信息重要程度的现实问题,从而使得注意力模型的多任务文本分类能力明显提升。
其他文献
目的:观察阿托伐他汀在延缓早期2型糖尿病患者动脉粥样硬化形成中的疗效,为他汀类药物在早期2型糖尿病患者中的应用提供参考依据。方法:63例患者采用随机数字法分成阿托伐他汀组29例,对照组34例。两组患者均给予饮食治疗、生活方式干预,在此基础上,按照2型糖尿病诊疗原则给予合适降糖方案控制血糖,治疗组每晚加用阿托伐他汀20mg连续6个月,对照组不做特殊处理。分别统计各组患者性别、体重指数、吸烟及一级亲属
Agent理论和技术是当前AI研究中的热点.其中,基于目标驱动的Agent计算是一个尚待解决的关键性问题.文章提出了目标驱动中的依赖和协商机理,以Robocup为测试床建立了面向足球
个人外汇买卖是银行的一种业务,在进行外汇交易过程中选择合理的获利平盘时机是非常关键的一步,它和多种不确定因素相关.目前的平盘决策完全凭交易员的经验来决定,为了避免平
轮状病毒(Rotavirus,RV)是婴幼儿和幼龄动物腹泻的主要病因,其所编码的非结构蛋白NSP4,功能之一是作为肠毒素引发腹泻,严重威胁着婴幼儿健康和养殖业。据报道,在RV感染过程中,整联蛋白α2β1作为RV的主要受体之一,涉及NSP4的表达及NSP4与细胞内钙离子、整联蛋白受体和相关酶的相互作用;已知益生菌及其培养上清能抑制RV感染,但是是否和如何通过NSP4发挥作用,有待近一步研究。据此,本
Apriori算法是一种最有影响的挖掘关联规则频繁项集的算法.文章以100期彩票的开奖结果作为挖掘对象,利用该算法从中找出相对频繁出现的数字组合,并用VB进行了程序实现.
AES是新的分组对称加密算法高级加密标准,源自比利时人Daemen和Rijmen共同设计的Rijndael算法.该算法充分运用了扩散和混淆技术并使用128/192/256这3种可变长度的密钥,对128b
烟叶的外观颜色在生产上作为烟叶质量评判的直接指标。在烟叶色素方面有了一定的研究,但是烟叶颜色和品质的真正关系,烟叶品质与相应颜色指标不是很清楚,这将直接影响优质烤
近年来,龙岩市人民政府将中心城区的未来规划布局重点定义为“北拓南延,主城提升”,城市经营性用地需求快速增加,涉及农用地也不断增长。在村集体用地转变为国有建设用地的农
该文简述了民用建筑住宅电梯井道照明的两种常见做法,通过对一、二类高层中照明线路的电压损失计算,总结出了两种做法的适用范围及优缺点。