基于知识图谱的社交媒体情感分析研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:watersss1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着网络社交平台的迅速发展,社交媒体也随之兴起。社交媒体每天发布海量信息,内容主题涉及各个领域。内容中隐含的情感信息对舆情监测、民意调查等有巨大的利用价值。然而,目前的情感分析技术主要针对通用文本,在社交媒体场景下存在诸多问题:社交媒体内容日益多元化、专业化,致使情感分析模型在没有先验知识支持下难以充分理解社交媒体信息;传统情感分析算法分析粒度较粗,难以深度挖掘网民情感产生的原因;社交媒体内容碎片化、海量化的特点日益明显,传统情感分析系统缺乏对海量社交媒体内容的有效组织管理,情感分析系统使用者难以快速获取社交媒体内容实体、情感倾向、情感原因等关键信息。针对以上问题,本文使用统一内容标签(Uniform Content Label,UCL)及知识图谱解决社交媒体情感分析问题。本文提出一种维基知识图谱(Wikipedia Knowledge Graph,WIKIKG),并设计了一种维基百科知识抽取算法(Wikipedia Knowledge Extraction Algorithm,WIKI-KEA)。在WIKIKG知识图谱基础上,针对社交媒体提出一种基于知识图谱的情感分析算法(Knowledge Graph Based Sentiment Analysis,KGBSA),该算法可以向用户提供细粒度的社交媒体情感分析结果。本文的主要研究工作如下:1)针对传统情感分析方法因缺乏先验知识难以充分理解社交媒体信息的问题,本文提出基于维基百科的知识图谱构建方法。首先,使用爬虫技术爬取维基百科网页内容,抽取结构化数据及非结构化文本,采用UCL标引维基百科内容。然后,抽取UCL的结构化数据构建WIKIKG基础库,并使用WIKI-KEA算法从UCL的非结构化文本中抽取实体关系三元组,三元组经过实体消歧算法消歧后存入WIKIKG。最后,针对社交媒体内容更新速度快的特点,提出一种基于社交媒体的知识图谱实时更新方法,保证WIKIKG向情感分析系统提供实时、准确的先验知识。2)针对社交媒体内容缺乏有效组织管理的问题和现有情感分析方法粒度较粗的问题,本文提出社交媒体的UCL内容标引方法以及社交媒体情感分析算法KGBSA。首先,借助UCL规范化信息结构的优势,提出基于UCL的社交媒体内容标引方法。然后,利用WIKIKG知识图谱的先验知识,结合社交媒体特征构建情感词典。最后,提出KGBSA算法,该算法分为KGBSA-ECD情感原因发现算法和KGBSA-SC情感句分类算法两部分。KGBSA-ECD算法使用图注意力网络融合文本相关知识,并结合语义信息和位置信息特征预测情感原因。KGBSA-SC算法利用情感词典结合句法依存树,计算情感句情感倾向,进而完成情感句分类任务。3)本文分别对WIKI-KEA算法、实体消歧算法及KGBSA算法进行分析与验证。实验结果表明,WIKI-KEA算法和实体消歧算法在公开数据集上具有较好的性能,可以很好地支持WIKIKG知识图谱的构建。KGBSA算法相比于传统的情感分析算法具有更高的精度。在上述实验的基础上,本文设计了基于知识图谱的社交媒体情感分析系统总体框架,并在双结构网络原型系统中进行了实现。
其他文献
注入电流探头作为大电流注入测试系统中的关键仪器,其性能指标对最终测试结果有着显著影响。为规范注入电流探头的设计流程,优化电流探头性能,本文针对注入电流探头流程化设计方法展开研究。本课题首先对注入电流探头的基础理论进行分析,相关分析表明注入电流探头使用时与待测设备的线缆构成变压器结构,并建立了注入电流探头及其校准夹具的等效电路模型,利用该等效电路分析集总参数对注入电流探头插入损耗的影响。论文针对探头
近年来,随着地铁上盖物业的兴起和发展,我国的各大城市,包括北京、上海、深圳、杭州等进行了地铁上盖物业的尝试和开发。但是,由于地铁上盖物业的基础直接布置在振源之上,致使其振动敏感性比地铁沿线建筑更强。尽管地铁列车引起的振动一般都低于结构的破坏振级,不会造成像地震那样的直接破坏,但它能引起结构及室内设施的局部振动,产生二次结构噪声,使人明显感觉不适,造成失眠、烦躁等困扰。为了研究振动在上部结构中的传播
传统的核磁共振仪器体积庞大,难以移动,限制了其在生物标记物现场即时检测中的应用。为此,本文通过设计与制造一种便携式的Halbach永磁体结构,研制便携式核磁共振仪器探头、双工器和前置放大器等关键部件,组装一台面向生物标记物现场快速检测的便携式核磁共振仪器,以人体免疫球蛋白G(IgG)为实验对象,实验验证便携式核磁共振检测仪的可靠性和准确性。论文取得的具体成果如下:(1)便携式Halbach磁体的设
随着科技的进步,新能源汽车的发展日新月异,其安全性也备受关注。由于新能源汽车采用大量高压大功率线缆进行能量传输,从线缆辐射的电磁场不仅可能会影响车辆周围的无线电设备,还可能导致车厢内部电气设备在工作时出现故障,从而引发车辆行驶的安全性问题。为抑制从线缆辐射的电磁场对周围电子设备的电磁干扰问题,工程上常采用屏蔽线缆来传输信号,定量评估屏蔽线缆与连接器的电磁屏蔽性能是屏蔽线缆与连接器选型及线缆辐射发射
随着我国农业机械化的不断发展,国内对动力换挡拖拉机的需求越来越大。动力换挡拖拉机因其在换挡过程中动力连续且充足、作业效率高、能耗低而备受关注。变速器设计作为动力换挡拖拉机开发过程中的重要环节,一直以来也是各农业大国拖拉机技术的研究焦点。国外在这一领域起步较早,并开发了一系列优秀的变速器产品。近年来,国内对拖拉机变速器的开发研究也投入了大量资金,但大部分投入量产的产品依然借鉴了国外的技术,自主开发、
图像文本描述有很多应用场景,可以为图像自动搭配标题,也可以转化为文本帮助视障人士更好地理解生活中图像的内容。卷积神经网络(CNN)具有特征抽象提取的能力,长短期记忆网络(LSTM)能处理时序数据,将两者结合,能够自动生成图像文本描述。但是面向实际需求时,深层神经网络计算量大并且CPU串行的执行方式不能很好地利用网络并行性完成计算,对设备的性能提出了很高的要求,因此不能支持低功耗移动端的实时应用。针
AlGaN材料作为第三代半导体材料在深紫外发光二极管(DUV-LEDs)等光电子器件领域具有非常广泛的应用前景。理论上,由非极性Al Ga N材料制作的UV-LED,由于完全抑制了极性Al Ga N材料中存在的量子限制斯塔克效应,因而可以实现更高的发光效率。本论文利用金属有机化合物化学气相沉积(MOCVD)技术,对非极性(112?0)a面Al Ga N材料的n型掺杂进行了细致深入的研究。通过对外延
目标检测是计算机视觉领域的重要研究方向,广泛应用于交通、医疗等诸多领域。目前基于深度学习的目标检测算法在精度上取得了突破性进展,但是由于其存在参数量和计算量庞大等问题,仍然无法广泛应用于计算和存储能力有限的嵌入式设备。本文基于单步多框检测网络(Single Shot Multi Box Detector,SSD)设计了一套轻量级目标检测算法方案,包含网络优化、通道剪枝、知识蒸馏和存储优化四个部分,
工程招标代理机构作为招标投标过程中的重要服务机构,对保证招标投标活动的合法性,提高招标人投资的收益,促进招标投标活动公平公正有着重大意义。由于相关政策和招标人经验的缺乏,招标人在选择工程招标代理机构的过程中容易发生逆向选择问题导致挑选的招标代理机构不具备相应的能力,影响了招标投标活动的正常进行。因此,招标人应加强对选择工程招标代理机构的重视。本文以工程招标代理机构为研究对象,其主要目的是通过对历史
拉索作为现代大跨度桥梁的关键构件,对环境介质的侵害较为敏感,且防护体系破损情况不易检查,其腐蚀问题是桥梁工程运营维护的关注重点之一。目前对于服役期间拉索健康状态的检测与监测主要集中在拉索的损伤和断丝方面,而对于其早期腐蚀的检测与监测研究较少。由于电阻传感技术在金属腐蚀监测中具有较高的灵敏度,本文以拉索中含锌铝合金镀层的高强钢丝为研究对象,先后进行了基于电阻传感的钢丝腐蚀监测理论分析、相关参数标定试