【摘 要】
:
随着网络信息通信的迅速发展,微博、微信等社交网络上短文本形式的使用量激增。特别是在数据爆炸的时代背景下,社交网络已然是网络短文本形成和流传的最大聚集地。在自然语言处理研究领域中,由于不能准确识别这些互联网新词导致对于这类文本的分析理解困难,尤其是文本中的网络新词识别及其语义情感理解方面。缺乏新词的解读能力意味着无法理解用户表达内容,也无法进行正确的舆论引导,因此对于网络新词的识别、语义理解和情感分
论文部分内容阅读
随着网络信息通信的迅速发展,微博、微信等社交网络上短文本形式的使用量激增。特别是在数据爆炸的时代背景下,社交网络已然是网络短文本形成和流传的最大聚集地。在自然语言处理研究领域中,由于不能准确识别这些互联网新词导致对于这类文本的分析理解困难,尤其是文本中的网络新词识别及其语义情感理解方面。缺乏新词的解读能力意味着无法理解用户表达内容,也无法进行正确的舆论引导,因此对于网络新词的识别、语义理解和情感分析研究意义重大。本文主要研究内容是社交网络中的产生的新新词汇识别及其情感极性分析。在短文本的情感识别研究中,词语的情感倾向分析是判别短文本整体情感的关键。新词以其通俗精简又有趣的表达能力而被互联网用户广泛使用,然而在传统的语料库中没有这些网络新词,因此传统的情感分析方法对这类文本处理困难。处理情感分析的基础是文本分词准确且单词情感倾向识别无误,微博这类社交网络短文本中的网络新词又是影响分词准确度和理解准确度的主要原因。为了克服传统方法无法识别网络新词的缺点,提出了一种融合网络实体链接和显性语义分析方法的网络新词识别方法。该方法以短语的粗粒度对原文进行分词,目的是尽可能保留原文的逻辑防止误读,分词后利用已有语料库进行语义分析,将未登录词以ESA方法清洗梳理数据最终得到新词的识别结果。在此研究基础上提出一种融合词向量和情感点互信息的词语情感倾向识别方法,该方法主要攻克了网络新词和表情符号的情感倾向识别难点。经实验结果表明,本文方法仅需要少量的语料库作为底层知识支撑,大幅降低了人工规则制订的成本,并提高了网络新词识别正确率与词语情感理解准确率。
其他文献
基于视觉的动作识别一直是计算机视觉领域的热点问题。早期基于彩色图像的动作识别方法,当光照条件发生变化时,彩色图像的质量会受到影响,动作识别的准确率也会下降。相比于彩色图像,深度图像对于光照条件的变化不敏感,并且可以提供额外的三维几何信息,对于运动特征的提取尤为重要。近年来,人们基于深度信息设计或学习得到了许多优秀的动作特征,它们之间存在相关性和互补性,较好地融合多种动作特征,能有效地提升动作识别的
二维材料具有超薄结构,使热量、载流子、声子输运等被限制在二维平面内,表现出一系列新奇的物理化学现象。二维三元材料相对于二元或一元的二维材料而言,由于第三种元素的加入使得化学计量比以及晶格结构发生改变,被赋予了性质调控的新自由度,展现出新颖而独特的化学和物理特性,在电子学、光电子学、生物传感器和催化等领域中有着广阔的应用前景。ε-CaTe_2O_5是一种间接带隙为3.3 eV的半导体材料,拥有低对称
现实世界中存在大量待解决的多目标优化问题,且此类问题的复杂度随着科技的发展而不断增加。演化多目标优化算法是处理多目标优化问题的常用手段,但是演化算法的计算速度较慢,这一缺陷限制了其在对时间性能要求严格的多个领域的优化问题上的应用。近年来基于分解的多目标演化算法(Multi-objective Evolutionary Algorithm Based on Decomposition,MOEA/D)
随着社会经济的发展,世界人口数量剧增,这对社会管理提出新的挑战。为了更合理地规划资源的分配,对视频监控中人数进行统计,可以辅助决策者根据人流量信息制定资源分配策略,
在网络使用场景变多且越来越多元化的今天,保证网络系统的安全对社会秩序、生活、经济至关重要。本文主要通过对网络异常流量的检测来完成网络态势预测和攻击识别。本文研究了网络中的系统日志和URL后选择了 CNN算法训练检测模型,并设计了一个对内提供检测模型训练,对外提供检测任务调度的平台。本文的工作内容主要如下:1、本文设计实现网络异常流量检测平台,为浏览器登录的用户提供训练再训练模型、任务管理、数据上传
“一带一路”是我国在新时代的一项重大发展战略,中亚地区的铁路投资作为“一带一路”的重要组成部分,具有建设周期长、资金额度大、参与方众多等特点,面临着众多不确定性。
近年来,二维材料作为后硅时代最为重要的半导体材料,深入研究发现没有一种或者一类材料能够完全满足半导体产业的所有要求。最近,带隙范围宽、一维结构的过渡金属三硫化物(TMTCs)引起了研究者的关注,大的带隙范围(0.2eV-2eV)使其适用于下一代电子和光电子领域,准一维特性赋予的各向异性为器件工艺提供了额外的自由度。目前关于过渡金属三硫化物的生长合成研究主要是通过烧结法、化学气相传输法或者两者并用来
量子计算机是一类物理装置,它遵循量子力学规律,它不但可以进行高速数学和逻辑运算,还可以存储及处理量子信息。随着对量子计算机不断深入研究,人们发现量子计算机一旦研究成
近年来,为消除贫困我国各级政府进行了各种有益探索。实践表明,旅游能够带动当地经济发展,促进居民增收,已成为脱贫攻坚的重要手段之一,有效地助力乡村振兴。贫困地区创建A级旅游村,是旅游扶贫的升级,有助于振兴乡村,打赢脱贫攻坚战。旅游扶贫能够既能给当地带来积极效应,也带来了负面效应。在实践中,本地居民对旅游村的旅游扶贫效应感知最直接,其影响因素多样。基于现状,旅游村创建中如何有效地提升旅游扶贫效应,带动
在天山西段,南天山北缘褶皱冲断带发现包括Muruntau在内的众多世界级金矿和铜矿,构成“亚洲金腰带”的主体;而在天山东段,南天山北缘褶皱冲断带却少有重要金矿及铜矿发现,凌东金矿、凌云铜矿是在该区域新发现的重要金、铜矿床,勘探工作正在进行,金、铜矿石品位分别为3.5g/t和1.4g/t。凌东金矿体呈透镜状产于下泥盆统阿尔彼什麦布拉克组变晶屑凝灰岩中,受眼形山脆韧性剪切带中的张扭性断裂-裂隙控制。自