【摘 要】
:
微博短文本是一种典型的用户生成数据(user generate data),蕴含了丰富的用户情感信息,微博短文本情感分类在舆情分析等众多应用中具有较强的实用价值.微博短文本具有简洁不
【机 构】
:
太原理工大学 信息与计算机学院,山西 晋中030600
论文部分内容阅读
微博短文本是一种典型的用户生成数据(user generate data),蕴含了丰富的用户情感信息,微博短文本情感分类在舆情分析等众多应用中具有较强的实用价值.微博短文本具有简洁不规范、话题性强等特征,现有研究表明基于有监督的深度学习模型能够显著提升分类效果.本文针对广播电视领域微博文本展开情感分类研究,实验对比了多种文本分类模型,结果表明基于Bert的情感分类方法准确率最高.深入分析实验结果发现,Bert模型对于困难样本的分类错误率较高,为此本文引入Focal Loss作为Bert模型的损失函数,提出一种基于Bert与Focal Loss的微博短文本情感分类方法(简称为Bert-FL方法),使得Bert模型能够更容易学习到困难样本的类别边界信息,实验表明Bert-FL方法的分类准确率绝对提升了0.8%,同时对困难样本的分类准确率也有显著提升.
其他文献
针对蝗虫优化算法(GOA)全局寻优能力不足,易陷入局部最优、寻优精度较低等问题,提出融合正弦余弦和变异选择的蝗虫优化算法(SC-MGOA).首先,在位置更新处根据转换概率选择不同
自然界中细菌无处不在,细菌的革兰氏阳性和阴性的有效分类对于临床治疗具有重要意义.现有的细菌的革兰氏阴阳性分类主要依赖于革兰氏染色法.这种方法借助细菌细胞壁结构的不
采用模糊综合评价法对足球比赛的胜平负关系进行预测具有优越性。在目前的研究中,指标权重的确定片面地采用主观法或客观法,得到的指标权重具有一定的片面性。文中提出的模糊
为进一步提高基于图卷积神经网络的半监督图节点分类的准确率,本文研究了基础图结构对图卷积神经网络的影响.通过对数据集(Cora、Citeseer及Pubmed)的图结构进行可视化,发现数据集(Cora、Citeseer)的图结构均为非连通图.通过研究非连通图中图拉普拉斯矩阵的"0"特征值和特征向量的特性,提出了通过对图拉普拉斯矩阵的"0"特征值对应的特征向量进行相关运算处理,获取非连通图最大连通分量
随着新课改的推行,要求英语教学要改变传统的教学理念和教学方式,实行以学生为中心的教学理念,将学生作为课堂教学的主体,教师起到指导和促进学习的作用,让学生在课堂上发挥主体作用,提高学生的学习积极性,培养学生的英语能力,提高教学的效率。 1. 树立“以学生为中心”的教学意识 教师在长期的教学过程中,可能受传统的教学观念和模式的影响比较深,对于新理念的接受和实施会出现一些问题,所以说要在课堂上首先要
针对两相流流型识别率不高且存在主观性的问题,提出一种基于Landweber迭代图像重建算法和卷积神经网络相结合的流型识别方法。利用Landweber迭代图像重建算法来获取流型图像并构建出流型图像数据库,通过对VGG16网络中不同的卷积层层数和不同尺寸及分辨率的数据集样本进行流型识别,确定了网络冻结卷积层和输入图片的参数。实验结果表明:采用电阻层析成像与卷积神经网络相结合的方法,使得流型识别准确率达
针对遥感影像快速有效的场景分类,提出了一种低维度稠密特征编码的场景分类算法.首先提取遥感图像不同尺度下的稠密特征,利用Hellinger kernel对原始特征进行映射变换形成新的特征空间,采用主成分分析对新的特征降维并进行Fisher编码量化,进而实现遥感图像的低维度稠密特征表达,最后在线性支持向量机中完成遥感影像的场景分类.所提出的算法分别在UC Merced、WHU和NWPU-RESISC4
字符串匹配是生物识别、入侵检测的基础,也是大数据互联网时代的研究热点.随着现代信息技术的发展,日常工作生活中移动及手持小型化设备的使用越发普遍.这些设备的应用场景中