基于情感新词识别的微博文本情感倾向分析研究

来源 :安徽理工大学 | 被引量 : 0次 | 上传用户:morpheus
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在微博话题讨论过程中,用户更加注重输入的简化、随性的表达以及情感的输出,便自发性的转变了自己的语言表述方式。这一转变直接增加了网络新词的输出,使得微博文本情感倾向分析更加困难。为了解决这个问题,本文提出了一种基于情感新词识别的微博文本情感分析的方法。首先通过统计量方法从微博数据中识别出新词;其次根据新词的上下文信息及其语义信息识别出情感新词,;最后扩展微博情感词库并结合多种规则进行微博文本情感倾向判定。具体研究内容如下:(1)针对新词的构成特点,提出基于改进互信息的新词识别算法。首先针对某个词被分词工具错分成多个字词的情况,对预处理后的文本进行N元切分;然后将改进的互信息与左右侧邻接熵相结合识别出候选新词;最后通过重复词和扩展词集对候选新词进行过滤得到新词集合。(2)针对新词是否有共现情感词的问题,提出词间关键字与余弦相似度相结合的情感新词识别算法。首先构建微博情感词库来判断某一新词是否有共现情感词;然后采用改进情感倾向点互信息的方法和改进余弦相似度的方法计算新词的极值;最后根据阈值判断新词的情感倾向。(3)针对现有的基础情感词典所包含的词语有限的情况,提出扩展词库和多规则相结合的微博文本情感倾向分析优化算法。首先基于扩展后的词库识别出微博文本中的情感词;再对情感词所在文本进行修饰词匹配和多规则匹配;最后考虑句子的位置特征并计算出整篇微博的情感极值,从而分析出微博的情感倾向。实验结果表明,基于情感新词识别的微博文本情感分析的方法不仅对新词和情感新词的识别颇有成效,而且提高了微博文本情感倾向分析的准确性。本文考虑到新词的多种构成模式来识别新词,并根据微博文本特点以及新词情感识别过程中的不足对传统情感新词识别方法进行改进,使得在庞杂的微博语料中能够准确识别出情感新词。本文的研究将情感新词扩充到微博情感词库中使得用户微博的情感倾向判断更加精确,从而有利于相关部门引导正确的舆论导向,企业制定相应的经营战略,消费者买到更加符合自己意愿的产品。图[16]表[24]参[70]
其他文献
硒是人体必需的微量元素,缺失或过量都会对健康产生不利影响。硒在土壤中分布极不均匀,而当前国内外研究多关注富硒或过量地区,采集的土壤多选自普通农用地,相关的分析以单一行政区域为研究单元,未体现地域的差异性。而研究硒在不同地域内分布规律、揭示土壤富硒特征,对于指导富硒农业产业宏观规划和富硒土地资源开发利用具有重要意义。本文以旱作区农田和矿区复垦农田为研究对象,借助变异函数、冷热点分析、地理探测器等方法
目的探讨腹腔镜辅助经肛门全直肠系膜切除保肛根治术—人工吻合法在低位直肠癌保肛治疗中的应用,分析其手术时间、出血量、淋巴结清除数、远切缘距肿瘤下缘距离、患者术后术后3个月及6个月肛门功能Wexner评分、手术效果、术后并发症、术后1年及2年生存率和肿瘤复发率。方法匹配研究,同济大学附属第十人民医院胃肠外科,从2018年11月至2020年11月,根据手术适应症及意愿接受腹腔镜辅助经肛门全直肠系膜切除保
该论文主要设计并制备出层状硅酸镍(NiPS)及其纳米杂化材料,并将其引入环氧树脂(EP)作为功能填料,制备出EP纳米复合材料。首先通过各类现代测试技术对所制备的纳米填料进行微结构、热性能和成分的表征,而后针对填料的含量对复合体系的摩擦磨损特性、力学性能、燃烧行为和固化过程的影响规律进行了详细而充分的研究,主要研究结果如下:(1)以气相二氧化硅(SiO2)作为硅源以及硬模板,以硝酸镍(Ni(NO3)
无线传感器网络WSN凭借其自身所具有的低成本、自组织、长生存周期等优势,广泛应用于电网监测、海底勘探、军事管理、医疗护理等领域。但是无线传感器网络工作环境复杂多变,传感器能量受限且不能补充,因此无线传感器网络的核心研究问题便是网络覆盖优化控制,可以说网络覆盖控制决定了 WSN的性能和服务质量。采用高效合理的网络覆盖控制策略,能够优化传感器节点的部署,从而使WSN更好的服务于用户。故本文针对二维网络
奇异微分系统是微分方程与动力系统的一个重要领域,其在应用数学、天文学、物理学以及生物学科中有着广泛的应用。因此,探讨奇异微分系统周期解问题具有很高的学术价值。本文应用重合度延拓定理、上下解方法、三阶近似方法、平均方法研究了几类奇异微分系统周期解的存在性和稳定性问题。全文的组织结构如下:第一章,绪论,简述奇异微分系统的背景、研究现状和意义。同时给出了重合度定理、上下解方法、三阶近似方法、平均方法一些
因果中介分析是通过中介变量识别解释自变量和因变量之间关系的因果机制。目前,中介分析的研究主要集中在自然直接与间接效应推断,很少进行效应的估计与分布的研究。本文分别在简单中介模型、具有混杂变量的中介模型、具有交互作用的中介模型和具有多个中介变量的中介模型下进行了自然直接与间接效应估计,并由Delta方法获得了估计量的分布。论文的主要工作包括以下四个部分。第一部分对单个中介变量情形,运用线性回归建立自
随着现代通信技术的发展,对相关元器件的需求也越来越大。这些年,微波介质陶瓷发展迅速,是因为由其制作的微波元器件,有不少优点,例如小巧、经济、质量轻、性能稳等,因此可以满足现代通信工具的小型化、集成化等要求。低温共烧陶瓷(LTCC:Low Temperature Co-fired Ceramic),是一种多层电路,由未烧结的流延陶瓷材料叠层在一起制成,内置印制互联导体、电路和元件,该结构被烧结成一个
移动互联网和智能终端设备可以产生大量的高维数据,这些数据具有潜在的规则和价值。然而,如果不经净化处理直接发布,可能会泄漏用户或组织的隐私信息。现有的高维数据差分隐私发布方法不能够较好地保护用户隐私。一方面,中心化差分隐私无法解决不可信服务器导致的隐私泄露问题,以及应用于众包场景存在诸多问题;另一方面,差分隐私作用于高维数据上不仅会引入大量的噪声,降低数据效用,也会产生时间复杂度高、计算复杂等问题。
文本表示是自然语言研究的基础问题,也是帮助我们高效处理文本信息的关键,传统的文本表示模型大多是基于词或短语构建,普遍存在容易丢失语义信息的问题。近年来,事件这一概念引起了学者的高度重视,叙事类文本中包含了大量的事件,面向事件对文本表示模型进行研究,以事件或事件要素作为语义单元,可以很好的保留文本中存在的深层语义信息。本文首先对文本中缺省的对象要素、时间要素和地点要素进行缺省补全的研究;然后以事件作
互联网时代信息爆炸增长,搜索引擎已经无法满足用户的需求。推荐系统通过分析用户历史行为预测用户的偏好,可以实现主动的个性化推荐。但当前推荐算法中仍存在数据稀疏和冷启动等问题影响推荐系统的性能。社交网络中存在用户行为信息和用户社会关系,考虑将社交网络应用到推荐算法中,能有效改善上述问题。因此,本文首先提取社交网络中的用户行为信息特征,然后提出一种社交网络中的矩阵分解推荐算法,主要研究内容如下:1.针对