社交网络中的情感知识图谱构建关键技术研究

来源 :上海师范大学 | 被引量 : 3次 | 上传用户:wml889900
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感分析是网络时代社会舆情监测的重要研究内容,其中,对社交网络文本进行不同维度的情感分析属于自然语言处理问题。而知识图谱则能为自然语言处理工作提供重要的基石。然而,目前国内外关于情感知识图谱的研究还处于空白阶段。因此,本文针对情感知识图谱的构建关键技术——命名实体识别和关系抽取技术加以研究。对于情感知识图谱而言,命名实体识别的目标是识别出文本中的情感词和描述对象,并进一步对情感词加以类似喜怒哀乐等具体感情维度的分类。这要求命名实体识别模型必须能挖掘深度的情感语义,是经典的实体识别模型不需要考虑的问题。情感知识图谱中的关系也不同于一般情况,体现的是情绪上的积极或消极,强烈或平淡。现有的研究工作难以满足情感知识图谱构建需求的问题,本文提出利用多层神经网络模型构建了一个适用于情感知识图谱的命名实体联合识别的模型;并将关系抽取转变为序列标注任务和文本分类任务,构建了一个共享编码器的关系抽取模型完成这两个任务,从而帮助模型更好的学习情绪上的语义特征,提高模型的泛化能力。本文的主要工作如下:1)提出BBC-LSTM模型对社交网络文本进行针对情感知识图谱的命名实体识别,该模型一方面考虑了情感层面的语义,另一方面考虑了情感词和评价对象间的关联,从而得到用于构建情感知识图谱的实体以及实体的属性;2)对情感知识图谱的关系抽取任务进行分析,将其拆解成两个子任务;提出SE-Learning模型对子任务同时进行解决,从而能够更便捷有效的利用社交文本数据获取情感知识图谱的关系;3)通过仿真实验证明本文提出的BBC-LSTM和SE-Learning模型的性能;同时,分析这两个模型存在的不足,并对未来的工作进行了展望。
其他文献
给出了绿色思维的定义,论述了绿色思维是强调人与自然和谐关系的生态思维方式,强调可持续发展的发展思维方式,强调以人为本的人文思维方式的内涵;从逻辑、价值、生产力、竞争力方
伴随部分造车新势力开始进入交付期,业界对其的关注程度正与日俱增。在“2018(第九届)全球汽车论坛”上,造车新势力无疑成为众多热点中较为引人注目的一个。未来3-5年,90%的
目的:探讨盐酸氨溴索治疗分泌性中耳炎的临床疗效。方法;回顾性分析我院从2011年10月至2012年3月期间收治的46例门诊分泌性中耳炎患者。将患者随机分成两组,分别是治疗组与对照
如何上好第一堂课:课程内容的划分、取舍及教材的选择和使用:比较、比喻和现场演示甚至游戏在课堂教学中的应用:如何调动学生的课堂参与和进行问题式教学:生化助记法实例:如
会议
目的:建立同时测定布地奈德和复方异丙托溴铵三个成分的HPLC方法。方法:采用Agilent Zorbax SB-C18柱(250 x 4.6nm,5um)色谱柱;以0.01mol/L磷酸氢二钾(pH2.5)缓冲液-乙腈(B)
一从1633年幕府发布第一次锁国令起,日本经历了近250年的闭关锁国体制。这期间日本船只被禁止出海从事贸易,凡偷渡者一概处以死刑。日本海外贸易的伙伴,除了同一文化圈的中国
从论述北京市水资源总量及构成入手,发现北京市生活用水总量呈逐年递增的态势。引用其他专家的实验成果数据,根据北京市5种常见草种的最大最小蒸散量计算得出各草种的节水潜力,
随着中国经济的快速发展,综合国力的进一步增强,世界对中国的关注达到了前所未有的高度。如何加强国际传播力建设,让世界准确、客观、全面地了解和认知中国,是摆在中国媒体面前的
西藏对外传播在我国对外传播大格局中具有举足轻重的作用,它是西藏反渗透、反颠覆、反和平演变、反分裂斗争的重要组成部分。当前,我们处在一个全面对外开放的时代,西方敌对势力对我国实行“西化”“分化”的战略图谋没有丝毫改变,达赖集团分裂祖国的图谋没有丝毫改变,并始终把国际公关和国际宣传作为重要手段。面对严峻复杂的涉藏外宣和国际舆论斗争形势,精准把握涉藏传播中的国际政治环境和报道规律,全面加强和改进涉藏对外
摘要:巴曲酶是单一成份的娄凝血酶,为丝氨酸蛋白酶的一种,化学结构式为直链糖蛋白类化合物,分子量约36,ooo。本品能降低血中纤维蛋白原的含量。减少血栓形成的基质,抑制血栓形成。能增强t—PA的活性,促使纤维蛋白溶酶原转变为纤堆蛋白溶解,以起到溶解血栓的作用,降低全血粘度,血泉粘度,使血管阻力下降,增加血流量。我院从2003年8月~2D08年8月对80例脑梗死患者应用巴曲酶治疗,取得了良好的效果,应