基于文本和社交语境的微博数据情感分类

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:cherrychenghui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博数据的情感分析具有重要的应用价值和研究价值,是网络文本挖掘领域的研究热点。微博消息非常短而且稀疏,同时包含大量的不规则词语,噪声很强,给传统的情感分析方法带来了很大的挑战。受社会科学的相关理论的启发,该文尝试利用微博消息的社交语境来帮助解决情感分析所面临的稀疏性强和噪声大的困难。由于文本向量的维度很高,而具有情感倾向的词只占其中较少的一部分,因此将Lasso方法加进LR(logistic regression)模型中以提高模型的鲁棒性。在真实的英文Twitter数据集上的实验结果表明,加入社交语境和模型的稀疏约束能够有效提高微博数据情感分类的准确率。
其他文献
《新唐书》有《宗室世系表》二卷,载于卷七十上、卷七十下。该书在编纂方面有很多缺点,尤其是脱漏很多。本文运用新出土的大量墓志,对于其中脱漏加以补正,并参证他书,详加考证,为唐
目的了解南京市溧水区农村青少年儿童营养健康现状。方法采用随机整群抽样法和分层随机抽样法获得调查对象;采用Z评分法,参考WHO儿童生长发育标准评价0~17岁农村少年儿童的身
休闲农业园是现代休闲农业发展的重要载体,了解游客对园区服务质量的感知,更有利于休闲农业园提升服务质量.本文基于游客感知视角,运用Kano模型确定休闲农业服务质量各要素的
如何考察全球化背景下生态环境问题——研究发展中国家的环境与发展问题,需要有全球视野、需要进行全球性思考。
首先分析了三峡工程船闸边坡有限元计算和现场监测的位移成果 ,说明岩石边坡位移反分析必须考虑岩体的松动因素 ,本构模型可以使用弹性模型 ;其次介绍了松动区的有关物理力学
中国传统工笔人物画,一般称为"工笔重彩人物画",顾名思义就是用笔工整细致、色彩浓重艳丽的人物画。中国传统工笔人物画的色彩在总体上倾向于表现性与装饰性,无论是"五彩彰施
南阳玉雕艺术既有北派的雄浑豪放,又有南派的婉约细腻,以技巧的灵活和色泽的显贵著称于世。南阳的玉雕艺术充分继承和发展了中国画的"形""神""意""像""气""韵""理""法"等核心元素。本文以南阳
文章探讨了在移动交互的情况下动效的运用与价值,以及移动应用中动效创新的原则与方法。以目标导向为出发点,尝试通过引用和举例的方式阐述动效的应用价值。指出了移动应用界
设计了一套在超低温环境下对压力传感器进行测试和标定的校验装置,并且成功地在-253~-163℃、0~2MPa压力范围内对自行研制的超低温压力传感器进行了标定。
传统的PI(proportional-integral)控制器整定公式不能灵活地适应具体控制系统特定的性能要求。该文提出一种面向性能指标的最优PI控制器参数整定和鲁棒性评价的方法。首先基