面向短文本情感分析的词扩充LDA模型

来源 :山东大学学报(工学版) | 被引量 : 0次 | 上传用户:wuxiaoxin888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对短文本在情感极性判断上准确率不高的缺点,在隐含狄利克雷分配(latent Dirichlet allocation,LDA)的基础上提出一种适用于短文本的情感分析模型。该模型在短文本中按词性寻找情感词汇,并对其进行有约束的词语扩充形成扩充集合,增强情感词汇之间的共现频率。将扩充集合加入文本中已发现的情感词汇,使得短文本长度增加并且模型可以提取到情感信息,模型通过这种方法将主题聚类变成情感主题聚类。该模型使用4 000条带有正负情感极性的短文本进行验证,结果表明该模型准确率比情感主题联合模型提高约11%,比隐含情感模型提高约9.5%,同时可以发现更多的情感词汇,证明该模型对于短文本能够提取更丰富的情感特征并在情感极性分类上准确率较高。
其他文献
针对国际工程教育认证的要求,结合我校给排水科学与工程专业准备专业认证的契机,分析了目前专业在应用型人才培养中存在的问题,针对性地修订了人才培养方案和课程体系,提高学
在水溶液或非水介质中,苯硼酸及其衍生物可以与二羟基化合物通过可逆共价键结合而生成环状酯,因此,苯硼酸可以作为分子识别单元,被用来设计和合成硼外源凝集素(糖蛋白)和糖类
随着经济的不断发展,环境也变得愈发恶劣,其中二氧化碳排放量的增加不仅加剧了温室效应,也严重影响着人们的健康。物流活动作为全球温室气体排放的主要来源,而冷链物流又是一种高能耗物流,其运作过程会产生更多的二氧化碳。因此,研究低碳化冷链物流管理不仅能优化冷链物流公司运营方案,还能减少其运作过程中的二氧化碳排放量,具有重要的理论意义与实践意义。基于上述背景,本文考虑了需求不确定这一现实因素,通过建立冷链物
“单摆测重力加速度”实验的基本原理是根据其周期公式T=2πLg,在实验中需要测量摆长L和周期T.传统实验测摆长和周期的方法比较繁琐,用眼睛盯着小球看,数全振动次数,容易引起
稍稍熟悉一点中国近代文史的读者,不会不知道斯坦因(Marc Aurel Stein 1862—1943),这位“大名鼎鼎”的英国探险家。他在国际学术界、探险界、考古学界、东西交通史学界可谓“跨
作品《阳光地带》中的人物形象来源于生活。人物塑造的决定性因素在动笔之前,关键是做生活的有心人,从生活中捕捉活生生的个性,体现对生活的理解,留住生活中那份感动。能用有个性
研究了不同第三单体的三元乙丙橡胶(EPDM)的流动性质。其中双环戊二烯(DCPD)的EPDM的非牛顿性,较乙叉降冰片烯(ENB)的EPDM更为显著,这可归因于分子量分布及长链支化的不同。
探讨妇科尿瘘修补术后留置气囊尿管有效护理对策 ,提高手术成功率 ,我科对 14例尿瘘修补术后留置气囊尿管患者进行观察 ,根据病人在插导尿管、留置尿管、取导尿管过程中的具
近年来,各地抓紧推进建设田园综合体、家庭农场等新兴农业综合体,取得了可喜成绩。这些农业综合体融一二三产业为一体,具有较全的产业形态和不错的发展前景,有力促进了乡村振兴。不过,笔者在西部一些地区调研时看到,有的农业综合体形态陈旧,产业层次不高,给人“似曾相识”和“新瓶装旧酒”的感觉,不利于持续健康发展。如何才能改变这一状况?笔者认为,应为农业综合体增添更多创意。   随着农业科技、互联网、物联网等先
报纸
目的建立溃疡性结肠炎(UC)和其它肠道疾病的肠道细菌DNA指纹图谱以分析其肠道菌丛的整体差异。方法采集19例UC、11例急性胃肠炎、6例IBS患者及11例正常对照者的粪便标本,提取