基于混合高斯分布伪样本生成的情感分析方法

来源 :广东工业大学学报 | 被引量 : 0次 | 上传用户:ajimide001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对微博行文自由性大,情感倾向识别困难的问题,提出了一种基于混合高斯分布伪样本生成技术和条件随机场模型的新方法。该方法首先利用混合高斯分布模型来为训练集中的少数类生成伪样本从而构建一个情感倾向分布平衡的训练集,然后通过使用Word2vec来扩展微博句子以丰富它的情感信息,从而缓解情感词典不足够大对情感分类的负面影响;最后将条件随机场模型应用在上面已经平衡和扩展后的训练集上。实验结果表明该方法比现有方法在数据集情感倾向分布不平衡时能更有效地识别微博的情感倾向.
其他文献
以罗非鱼加工鱼片的下脚料鱼头、鱼骨、鱼尾等为原料,选用弹性蛋白酶对其水解,通过响应面进行分析并优化酶解条件.以水解度与多肽含量为指标,分别对酶浓度、温度、p H值、料