基于Bi-LSTM-CRF的微博情绪诱因抽取及情绪识别的联合模型

来源 :武汉大学 | 被引量 : 1次 | 上传用户:jason23431
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络的兴起,越来越多的人们开始利用诸如新浪微博等社交平台开始发表自己对于各种话题的讨论与观点,因此而产生了大量带有情绪特征的社交文本,这些社交文本的产生使得情绪分析在自然语言处理任务中逐渐热门起来。而情绪诱因抽取作为深层次的文本情绪理解已成为情绪分析任务中的新热点,当前研究通常把诱因抽取和情绪识别看作两个独立的任务,容易导致错误在任务间的传播问题。本文考虑到情绪识别和诱因抽取之间有不可切断的关系,以及微博文本中表情符通常能够作为文本所蕴含情绪的表达,提出了一种基于Bi-LSTM-CRF模型的情绪诱因和表情符情绪识别的联合模型。该模型可以将微博文本中用户所表达的情绪发生的原因在文本中标记出来,并识别出文本中包含的表情符所蕴含的情感类别。主要研究工作如下:(1)构建情绪诱因及表情符情绪类别的微博情绪语料库,通过爬虫在新浪微博平台上爬取微博文本,对于文本中的情绪诱因子句及表情符所表达的情绪进行人工标注。(2)将情绪诱因抽取以及情绪识别形式化为一个统一的序列标注问题,充分利用了情绪诱因与情绪之间的互相作用,利用Bi-LSTM-CRF模型将情绪诱因的抽取和情绪识别同时进行。在本文所构建的微博情绪语料库上的实验结果表明,本文提出的基于Bi-LSTM-CRF 的微博情绪诱因抽取及情绪识别的联合模型相 比于两个任务进行串行实现时,在两个任务上的效果均有不小的提升。
其他文献
传染性法氏囊病(Infectious Bursal Discase,IBD)是由传染性法氏囊病病毒(Infectious Bursal Discase Virus,IBDV)引起的一种对雏鸡具有急性、高度接触性的传染病。IBDV易发
强震作用下桥梁结构不可避免地进入塑性阶段,往往呈现出较强的非线性特征,因此,需要对其进行非线性时程响应分析;与直线桥相比,曲线桥结构的地震响应量受地震输入方向的影响
目前,随着大规模集成电路的快速发展,功耗问题越来越引起人们高度地重视。目前的电路主要是以Boolean逻辑电路的形式为主,对电路的低功耗优化也主要是针对Boolean电路来展开进行的。但是,固定极性Reed-Muller(RM)逻辑相比较Boolean逻辑而言,它不但具有良好的可测性,同时在功耗、面积和速度等方面,如奇偶校检、算术逻辑以及通信电路具有结构和功能上的显著优势。对于固定极性XNOR/O
随着绿色生态住区概念的提出,我国出台有《绿色生态住宅技术评估手册》、《绿色生态住宅小区建设要点与技术导则》,就四川省而言,有《四川省绿色建筑评价标准》《四川省绿色
近年来,有机场效应晶体管(OFET)由于其低成本、制备工艺简单等等优点,被很多研究人员关注,目前来说,有些OFET的性能已经超过了非晶硅晶体管水平,并且应用在很多地方,比如逻辑电路、柔性电子器件、传感器等等中。本文以聚对苯二甲酸乙二醇酯(PET)膜作衬底,有机聚合物材料聚3-己基噻吩(P3HT)为半导体层,有机导电材料聚(3,4-乙烯二氧噻吩):聚苯乙烯磺酸(PEDOT:PSS)作为源漏极,银丝作
多环芳烃(PAHs)是我国污染土壤中最常见的一类具有“致畸、致癌、致突变”效应的持久性有机污染物,可以被植物吸收积累,并通过食物链危害农产品安全和人群健康。如何减低污染
碘元素在自然界中广泛分布。酚类基团是天然有机物(如腐殖酸)的基本组成部分。在饮用水和污水的氯化/氯胺化消毒处理过程中,消毒剂能将碘离子氧化为高活性不稳定的次碘酸,并与
由于目前环境急剧恶劣,各种灾害频发,水稻产量达到瓶颈,因此对抗逆性水稻品种的需求越来越强烈。旱稻作为水稻的变种,需水量小,抗逆性强,已越来越受到人们的重视与利用,因此
喷涂机器人因其具有大幅提升喷涂质量、喷涂效率、可替代人工在恶劣环境中工作等优点,在汽车生产过程中得到了广泛应用,也受到家具、家电、飞机等行业的高度重视。由于其技术
随着“交通强国”战略的提出以及航运业的快速发展,内河贸易往来频繁不断,水上突发事件时有发生,另外现阶段中央政府及地方主管部门出台了对西部内河水运发展的一系列政策文