融合多种特征的舆情时序文本情感分类方法

来源 :山西大学学报(自然科学版) | 被引量 : 0次 | 上传用户:fntshb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在传统的文本情感分类中,通常假设数据是独立同分布的,但对于舆情时序数据,文本的情感分布处在一个不断变化的环境中,未必都服从独立同分布的假设,因此,仅在历史数据上训练的分类器无法在新到来的数据上取得令人满意的分类效果.针对这一问题,文章提出一个基于特征融合的时序文本情感分类模型.该模型在多段时间连续的数据上训练多个BERT模型,用于抽取各时段文本的源域特征、目标域特征和综合域特征,并将这些特征按时间顺序输入一个双向GRU网络中进行融合,从而得到更加准确的文本情感分类特征表示.通过在真实的舆情时序文本数据集上进行实验,实验结果表明本文的方法优于传统的文本情感分类方法.
其他文献
文章研究GI/G/1→/G/1串联排队系统,该系统由两个单一服务器串联而成,系统的到达过程是更新过程,两个站的服务时间服从一般分布.由于系统的到达时间间隔和服务时间服从一般分布,导致很难用解析的方法进行分析.根据系统的到达时间间隔和服务时间的三阶矩,文章分别将两个站的到达过程近似为MAP,服务时间近似为PH分布,从而将GI/G/1→/G/1排队系统近似为MAP/PH/1→/PH/1排队系统,构建相应的马尔可夫过程,采用矩阵几何解的方法求解系统的平均排队时间等数量指标.通过数值实验,验证了文章提出的近似方法
研究幂零元集合和拟正则元集合相等的环,称这样的环为NQ环.给出NQ环的若干例子,讨论相关的环扩张性质.
在前馈神经网络学习中,极限学习机(Extreme Learning Machine,ELM)具有高效快速的优势.然而ELM采用的2-范数损失函数在许多实际应用中受异常值影响较大.文章采用截断思想,将2-范数损失函数进一步改进为能够限定最大损失为常数的截断2-范数损失函数,构建了基于截断2-范数损失函数的鲁棒ELM模型,依此来抑制噪声和异常值对模型的影响.采用拉格朗日乘子法和迭代重赋权算法对模型进行求解.最后在UCI数据集和实际风速数据集上验证所提出模型的有效性.实验结果表明,与现有回归算法相比该模型在噪声
文章研究分数阶q-微分方程初值问题吸引解的存在性.在非线性项满足合适的条件下,文章巧妙地构造出无限区间上连续函数空间的一个有界凸闭子集.利用Schauder不动点定理,得到该初值问题至少存在一个吸引解,并给出相关的例子.
基于非平衡格林函数方法,考虑量子点和电极耦合界面的微小振荡,研究了并联双量子点AB干涉仪的输运性质.把双时格林函数中的时间分为快变的相对时间和慢变的质心时间,在Wigner空间近似求解Kadanoff-Baym方程,得到格林函数对质心时间各阶求导对电导的修正.在弱耦合情况下,讨论了通过调节两个子AB环中的磁通和两个并联量子点之间的耦合强度,对系统的输运行为的改变,说明了电导的二阶修正可以增强Fano共振效应.
针对图论中广义棱柱的概念和众多研究成果,作为推广,提出了两个有向图的广义棱柱的概念,研究了这类图的超欧拉性质.基于广义棱柱概念中置换的性质,给出了一种判断广义棱柱是超欧拉有向图的有效工具.证明了两个超欧拉有向图的广义棱柱是超欧拉有向图,另外给出了一类由有向可迹图和超欧拉有向图所构造的广义棱柱是超欧拉有向图的一个特征刻画.
针对HIV研究中病毒载量出现反弹和左删失以及CD4细胞数目离散的情况,利用半参数非线性混合效应模型拟合病毒载量,广义线性混合模型拟合CD4细胞数目,并与变点模型联合建模,采用贝叶斯方法对联合模型中的参数进行估计.实例分析表明对于病毒的估计,联合贝叶斯方法中第一阶段递减率β2=60.26>0且远远大于β4,说明半参数非线性混合效应模型的参数估计值是合理的.
不确定性理论有广泛的应用和重要的影响.文章将不确定性理论中的粗糙集理论应用到量子B-代数中.考虑了(线性序)量子B-代数的粗糙子代数,证明了量子B-代数上的子代数是粗糙子代数.然后,研究了格序量子B-代数的粗糙正规q-滤子.证明了量子B-代数上正规q-滤子是粗糙正规q-滤子.为了研究格序的量子B-代数,借助单位元将量子B-代数分为三类,给出了并和交运算的具体形式.研究了格序量子B-代数上粗糙正规q-滤子的同态像.此外,将粗糙集理论应用于一类特殊的量B-代数—CKL-代数中,通过选择合适的蕴含算子,证明了粗
超图的边连通性与超网络的容错性密切相关,是一个判断超网络可靠性的经典指标.一个连通超图H的边连通度λ(H)是超图H的所有边割中最小边割的大小.用δ(H)表示超图H的最小度,称满足条件λ(H)=δ(H)的超图为最大边连通的.文章用最大度和直径给出了r-一致超图的边连通度的一个下界.进一步获得了r-一致超图是最大边连通的一个充分条件.
文章研究了带有外部干扰的二阶非匹配非线性多智能体系统的领导跟随滞后一致性问题.值得注意的是,在所考虑的系统中,非线性存在于所有状态的动态特性中.为了处理非匹配非线性项和干扰项,将自适应控制方法与反步控制方法相结合设计了新的分布式状态反馈控制器.与现有研究相比,文章所考虑的具有外部干扰的非匹配非线性多智能体系统模型能更好地刻画实际系统动态特性,滞后一致性问题更符合实际的网络通信环境.最后,通过一个仿真实例说明了所提结果的有效性.