基于主题模型的文本情感分析研究

来源 :太原理工大学 | 被引量 : 10次 | 上传用户:hhtui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网中各类评论信息数量巨大、变化迅速,海量的评论表达着信息发布者的情感倾向,这些信息对于政府部门的舆情监控、企业的经营决策和个人的购买决定,都起着至关重要的作用。但通过人工收集分析这些数据不仅成本较高,也无法满足时效性要求,因此文本情感分析受到了学术界与工业界的广泛关注。主题模型是能够从大规模离散数据集中自动提取隐含语义信息的生成概率模型。近年来,主题模型在文本分类、图像分类、热点事件监测、多文档自动文摘、推荐系统等领域得到了广泛应用。主题情感混合模型以主题模型为基础,可以无监督地提取语料的主题信息和对应的情感倾向,在文本情感分析领域得到了越来越多的关注。本文针对长文本和短文本的不同特性,分别提出了词加权LDA算法(Weighted Latent Dirichlet Allocation Algorithm,WLDA)和BJSTM模型(Biterm Joint Sentiment Topic Model,BJSTM)。针对长文本,本文针对现有主题/情感联合分析方法中主题间区分度较低的问题提出了WLDA算法。通过在吉布斯采样中对不同词汇赋予不同权重,增强了具有情感倾向的词汇在采样过程中的影响,从而改善了主题间的区分性。实验表明,与JST模型(Joint Sentiment/Topic model,JST)相比,WLDA不仅在采样中迭代速度快,也能够更好地实现主题提取和情感分类。由于短文本具有稀疏性,面向短文本的主题/情感联合分析方法较少,本文针对这一问题提出适用于短文本的BJSTM模型。该方法为BTM模型(Biterm Topic Model,BTM)增加情感层,对每个双词的情感和主题进行采样。BJSTM模型充分利用了语料级别的丰富词汇共现和词频信息,从某种程度上降低了短文本特征稀疏对主题/情感联合分析的影响。实验表明,与JST和SSTM(Short-text sentiment-topic model,SSTM)相比,BJSTM模型在情感分类和主题关键词提取方面都取得了良好效果。
其他文献
随着我国社会主义市场经济的发展速度不断加快,为我国各个行业的发展注入了新的发展动力,同时也为各个行业的发展提出了新的要求,为满足经济发展需求的新政策随即颁布。尤其
作为中职学生毕业和升学的重要依据,中职学校学生学业水平考试成绩也是评价和改进教学工作的重要参考,其中英语学科学业水平测试的实施对于英语教师教学和中职学生学习都起到
基于SPCE061A单片机,融合传感器技术、语音识别技术、图像识别技术、网络技术等多种技术手段,设计出了一种新型智能锁.通过在正常环境和噪声环境下的大量测试数据分析,证实该
目前,因我国城市地下综合管廊仍处在起步阶段,促使在实际建设的过程中出现诸多困境,例如:建设方式较为单一、管理存在问题等,最终会对实际建设造成较为严重的影响,这时就需要
利用位于黄淮海平原的中国科学院封丘农业生态实验站冬小麦/夏玉米轮作保护性耕作定位试验平台,研究全翻耕、常规耕作、少耕、免耕、全翻耕+秸秆还田、常规耕作+秸秆还田、少
本文全面系统地研究了亚硫酸钙非均相氧化的工艺参数及动力学机理,旨在开发一种经济、高效的脱硫废渣综合治理技术,研究结果将为石灰石-石膏烟气脱硫法工艺的进一步完善提供
目的分析藿香正气丸治疗急性胃肠炎的临床疗效。方法选取42例急性胃肠炎患者,将其随机分组,各21例。对照组患者予以常规对症支持治疗,试验组患者在此基础上辅以藿香正气丸治
商业秘密价值性乃是商业秘密的构成要件以及判断侵权行为成立与否的要素。对此,美国判例法已经形成被告使用了商业秘密、原告因商业秘密而产生了收入、商业秘密对被告具有价
2009年末的朝阳市经济工作会议为我市2010年乃至“十二五”经济发展定下了主基调——以重点产业集群建设为突破口,推动工业经济发展提速提质提效。$$    会议对产业集群建
报纸
Ⅱb期及以上宫颈癌患者一般采用根治性放射治疗(即全盆腔外照射加近距离腔内后装放疗),部分患者在放射治疗后联合手术治疗。腔内放疗产生的r射线在损伤肿瘤细胞DNA的同时,对