基于主题模型的半监督网络文本情感分类研究

来源 :The 5th Statistics Annual Conference CSAC2014(第五届中国统计学年会) | 被引量 : 0次 | 上传用户:liuzhao256
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  在网络评论文本的情感分类问题中存在数据的不平衡性、无标记性和不规范性问题。本文提出一种基于主题的阈值调整的半监督学习模型,通过从非结构化文本中提取主题特征,对少量标注情感的文本训练分类器并优化指标调整阈值,达到识别用户评论的情感倾向的目的。仿真研究证明阈值调整的半监督模型对数据非平衡性和无标记性具有较强的适应能力。在实证研究中,本文对酒店评论文本数据构建的文本情感分类器显示模型可以有效预测少数类评论样本的情感极性,证实了基于主题模型的阈值调整半监督网络评论文本情感分类模型在实际问题中的适用性与可行性。
其他文献
该文基于Delft3D模型,利用长期观测地形图和实测水文数据建立闽江下游至近海大陆架的二维水流数学模型,分析研究闽江下游潮差、水位及南北港分流比.结果表明:潮波受地形及径
该文利用二维数模的水动力学模块和对流扩散模块模拟研究湖北省松滋市小南海湖在引调水作用下湖泊水体交换能力,以确定合理引调水流量.模拟结果表明,小南海湖在既定换水周期
在观赏石文化事业和文化产业日益发展的今天,女子赏石巾帼不让须眉,全国各地女石友日渐增多,成为我国赏石队伍中一道亮丽的风景线。6月1日在柳州举行的“第二届中国观赏石女
  对高维(三维以上)属性数据或分类数据进行可压缩性研究是属性大数据分析中的重要内容,由于高维列联表数据资料的复杂性,在分析高维列联表时为了更好地分析数据集
会议
邵武(上王塘二)水文站于2003年恢复设站后,基本水尺断面下游水文站控制断面经历一次特大洪水冲刷和两次较大涉河工程建设施工,对该站高中低水控制造成很大影响.该文据此分析
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
抽水蓄能电站地下厂房通风设计是整个电站通风空调设计的重要组成部分.根据抽水蓄能电站洞室布置形式,一般地下厂房的新鲜空气由进场交通洞引入,由安全洞排出,部分电站设置专
  租金等价法出自于国民经济核算,是居民最终消费中对自有住房服务价值的核算方法。为能更好地分析CPI中的自有住房的租金等价法,本文讨论国民核算内的国内生产总值
会议
  基于投入产出模型可以构建多种产业关联效应测度方法,但不同方法间的区别与联系尚未获得足够重视和透彻把握。本文探讨了常规不加权产业关联测度的真实内涵和局限性,并由经
一、根据省人民委员会「关于召开江西省农业劳动模范代表大会」的决定,为了总结我省几年来在农业生产战线上所取得的伟大成绩,交流农业生产经验,表扬在农业生产各方面所涌现