【摘 要】
:
近年来,诸如微博、贴吧之类的社交媒体网站获得了极大的欢迎和重视。社交媒体网站的发展刺激了民众在公众场合使用比喻和创造性语言,反讽作为其中之一也愈来愈多地被使用在社交媒体上。从全世界的范围来看,反讽都是一种有趣且引人注目的语言形式,但如何识别其内在含义也是一项艰巨的任务。反讽识别可从上下文无关与上下文相关两种思路进行研究。上下文无关的方法从反讽句的语言特性入手,而上下文相关的方法更加注重上下文信息的
论文部分内容阅读
近年来,诸如微博、贴吧之类的社交媒体网站获得了极大的欢迎和重视。社交媒体网站的发展刺激了民众在公众场合使用比喻和创造性语言,反讽作为其中之一也愈来愈多地被使用在社交媒体上。从全世界的范围来看,反讽都是一种有趣且引人注目的语言形式,但如何识别其内在含义也是一项艰巨的任务。反讽识别可从上下文无关与上下文相关两种思路进行研究。上下文无关的方法从反讽句的语言特性入手,而上下文相关的方法更加注重上下文信息的利用。随着深度学习领域的不断发展,传统机器学习的反讽识别方法已被逐渐淘汰,特别是预训练模型的进步为反讽识别带来了更多可供探索的空间。以预训练模型为基础,本文针对两种研究思路提出了两个方法:(1)上下文无关的反讽研究受限于可获取的信息太少,所以只能从文本自身挖掘信息,之前的研究者已从词性标签、语言特性等方面入手。由于反讽句对于句法的变化敏感并且反讽句暗含着使用者的强烈情感,所以本文引入依存句法分析模块和情感分析模块对每个句子进行依存句法分析与情感特征的提取,并将两者与预训练模型得到的文本特征进行融合进行反讽识别。在Ciron数据集上本文提出的反讽识别方法相比BERT提升了 2.5%的F1值。(2)上下文相关的反讽识别方法由于可引入更多的上下文信息,理论上相比上下文无关的反讽识别拥有更高的准确性。由于每个社交媒体用户的反讽使用习惯不同,本文利用用户的历史回复将用户转换为向量作为用户特征。除了用户特征,语篇信息也是反讽识别的重要信息,所以本文也将加入语篇信息。最终利用多任务学习把上下文信息与情感信息融合进模型。在SARC的平衡和非平衡数据集上本文提出的方法相比之前的最好模型的F1值分别提升了 1.5%和2.2%,并且通过消融实验证明了引入的上下文信息确实提高了反讽识别的准确性。
其他文献
甲烷是天然气的主要成分,是一种出色的化工原料,较为稳定不易转化;二氧化碳广泛存在于空气中,是人类大部分活动的产物。两者都是温室气体分子,如果能以两种气体为反应原料产生高价值化学品,将有助于缓解温室效应同时带来一定的经济价值。近年来,研究表明甲烷和二氧化碳能够反应直接合成乙酸,其中铜基和锌基催化剂受到关注,但是催化剂活性中心本质和反应机理还不是很明确。为此,我们采取密度泛函理论(DFT)方法,对氧化
磷化学与生命科学息息相关,随着有机膦化学的不断发展,化学家们合成了很多结构多样的有机膦化合物。这些有机膦化合物在生物医药、有机合成、光电材料和阻燃剂等方面有着巨大应用前景。因此,寻找有价值的底物来高效构建结构多样的有机膦化合物一直是有机膦化学领域的研究热点。近年来,联烯化学发展迅速,联烯的合成方法也更加简便,其中,2,3-联烯醇由于其独特的反应特性,开始作为一种有效的反应前体进入科学家们的视线。本
选择性加氢在精细化工中有着举足轻重的地位,常用于制备胺类化合物和烯烃类化合物等重要基础化工产品。随着社会对环境问题的日益关注和废弃物处理成本的提高,发展环境友好又具有原子经济性的绿色催化剂已成为催化学科的重要研究热点。鉴于揭示选择性加氢反应过程中的微观“构-效”关系是理性设计高性能催化剂的关键环节,本论文在构筑不同类型的表界面改性模型催化剂的基础上,探索催化金属的电子结构和局部配位环境对改性催化剂
以高能量密度著称的锂硫电池(LSBs)受到多硫化物(PSs)穿梭效应、硫(S)导电性差和循环过程中体积膨胀的影响,这些问题在高S含量和高S载量下更为严峻。针对这些问题,本论文从正极载体设计和隔膜修饰两方面开展研究,主要内容如下:(1)将微米S球封装在厚度可调的多层V/V2O5纳米壳(S@V/V2O5)中作为高硫含量的LSBs正极材料。极性的V2O5可以化学吸附PSs,金属V可以保证有效的电子转移,
后疫情时代需要以内需作为我国经济发展的主要动力,2020年7月底召开的中共中央政治局会议提出了建设双循环新发展格局的发展战略,这要为我国经济可持续、高质量发展找到相匹配的内源型动力。但是我国农村家庭高储蓄率问题成为制约我国内需进一步扩大的重要因素,本文从家庭外出务工视角出发来研究农村家庭高储蓄率问题,这可以为理解我国家庭储蓄行为提供新的视角和证据,也可以为进一步扩大内需提供相应的政策参考。本文利用
在电动汽车和小型化电子设备迅猛发展的今天,随着锂离子电池性能的提高,电动汽车的行驶里程在不断增加。然而,由于电极材料比容量的限制,当前商品化锂离子电池的能量密度很难大幅度提升。高能量密度的电化学储能系统引起了人们广泛关注。锂氧气(Li-O2)电池负极采用金属锂,正极反应的活性物质来自空气中的氧气,能量密度可高达3505 Wh g-1。近年来对Li-O2电池的研究在很大程度上推进了 Li-O2电池的
蛋白质在生命活动中起着十分重要的作用,其丰富的二级结构诸如α-螺旋、β-折叠、β-转角等,为生物体中各项功能的实施提供了充足的保障。近年来,被称作“脊梁”的α-螺旋与β-折叠已受到了广泛的研究关注,而β-转角作为最常见的转角结构,为蛋白质提供了丰富的结合位点,亦受到了研究者们青睐。本论文以肽基N-酰胺基硫脲提供的β-转角结构为构筑模板,于双边N-酰胺基硫脲的末端引入芘荧光团,成功构建了基于双重β-
经济特区取得巨大成功,为我国改革开放事业作出了重大贡献。为了探索特区成功经验,本文利用索洛余值(SR)法、数据包络(DEA)法和随机前沿分析(SFA)法,对1980-2017年深圳、珠海、汕头、厦门四个经济特区的全要素生产率进行测算,比较测算结果并分析特区发展原因及其差异原因,利用主成分回归法讨论影响特区全要素生产率的因素,探寻成功经验,希冀为我国未来经济增长和转型提供新的理念与思路。结果表明:(
金融征信机构无法获取被拒绝贷款的申请者的违约标签,故只能用接受样本搭建信用评分模型,再应用于全局的申请者。实际上接受样本违约率会低于全局样本,这就形成了样本偏差,导致模型在多次迭代后出现严重偏误。拒绝推断(Reject Inference)通过在模型中加入推断的拒绝样本信息,修正在有偏样本上估计参数的偏差。大量实证研究显示,传统和统计的拒绝推断方法在非随机数据缺失机制(MNAR)下的效果非常有限。
我国经济进入新发展阶段,必须坚持新发展理念,加快构建新发展格局,以实现高质量发展。制造业企业作为我国经济的重要支柱应坚持科技创新,找准并利用好数字经济新动能,积极开展数字化转型。本文旨在帮助我国上市的制造业企业把握目前行业整体数字化发展现状,探究数字化程度对企业经营绩效的影响和作用机制,并从企业规模、企业产权和所处地区异质性出发,研究不同情境下,企业数字化程度对绩效的影响差异。本文的研究结果将有助