互联网用户生成内容的情感分析研究和应用

被引量 : 0次 | 上传用户:ulysseschen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本情感分析(Sentiment Analysis)是指对自然语言文本中所含的情感倾向如正向(positive),负向(negative),中性(neutral)等进行自动分类,帮助计算机理解人类自然语言文本的情感表达,从而更加细致地了解用户的情感倾向。情感分析作为自然语言处理(Natural Language Processing)的一个重要模块,可以运用到许多相关的应用中,如预测股票走势分析、社交网络的分析等。随着信息科技的日益发达和社交网络的普及,人们更倾向于使用短文本来表达情感或者评论,比如目前流行的Twitter、微博、手机短消息等,因此本文着重研究互联网中用户生成内容的句子级和实体属性级的文本情感分析。句子级文本情感分析是识别一句话的情感倾向,实体与属性级文本情感分析是判断句子中某个命名实体(例如手机)或者它的某个属性(例如电池)的情感倾向。对于句子级文本情感分析,本文着重研究口语化文本的句子级文本情感分析。本论文采用有监督的机器学习算法来建立分类模型。首先抽取词语特征、情感词典特征以及词性特征,然后通过使用不同的机器学习算法来训练与预测结果,得到每个句子情感倾向性判断的结果。这是本论文的第一个研究内容。本论文的第二个研究内容是对实体与属性级文本情感分析。本文着重研究笔记本电脑(Laptop)与酒店(Restaurant)这两个实体领域的评论。研究内容包括两部分:(1)属性词的抽取和(2)针对这个属性词进行情感倾向判断。针对第一个内容,我们采用了命名实体识别(NER)和名词短语抽取两个方法。对于属性词情感倾向判断,我们首先抽取词语特征、情感词典特以及词性特征等,然后通过使用不同的机器学习算法来训练模型,预测句子中抽取属性词的情感倾向性。在SemEval2013和SemEval2014相关数据集的实验结果表明,基于命名实体识别的方法可以更准确地抽取实体属性词,采用多样化的特征抽取和有监督的学习算法可以有效进行句子级和实体属性级情感倾向判断。
其他文献
高校已经成为培养我国社会主义经济发展所需人才的主要机构,加强高校教师的职业道德建设是学校发展的重要动力。教师职业道德是至关重要的一个问题,一方面可以体现出高校教师本
目的:通过选择择期行腹部手术的老年患者,观察术中、术后不同时间点血栓前状态指标变化,探讨不同麻醉方法对血栓前状态的影响,为降低围手术期脑卒中发生高危因素提供指导或建
唇疱疹感染后继发金葡菌L型败血症1例曹卉,王守军(济宁医学院微生物学教研室滕州市工人医院)患者,男性,5岁,2天前因发热、鼻孔及口唇皮肤粘膜出现绿豆大小水疱入院就诊。查体T38.9℃,咽部充血
在平面设计领域中,如何通过新颖独特的视觉语言吸引眼球是一个很重要的课题,也是平面设计教学的关键。在读图时代,直观、简洁、新颖的图形信息得到广泛的传播,而图形创意课程
目的:视神经-颈内动脉间隙,也称Ⅱ间隙是鞍区手术最常用的手术间隙,大部分临床工作者对它的了解都缘于解剖学文献,而这些文献报道也大部分为对正常尸头的研究。实际工作中由
<正>《最后一片叶子》是欧·亨利的代表作品。该篇小说延续了欧·亨利惯用的"含泪微笑"式风格,整个故事感人至深。读者由此看到了在艰难困窘生存环境中苦苦挣扎的社会底层小
一、文秘工作与文书档案管理工作的关系文秘工作与文书档案工作密切相关,文秘工作是档案工作的基础,文书档案工作是文秘工作的延伸和发展,两者的有效结合、相辅相成,是实现文
目的:股骨颈骨折是常见骨折,占股骨近端骨折的53%[1],占全身骨折的3.6%[2],且发生率逐年增加。非手术治疗股骨颈骨折,骨不愈合的发生率约为50%-60%,内固定治疗为4%-33%,股骨
综述职业压力对精神科护士身心健康影响的研究现状,分析精神科护士职业压力产生的原因,提出相应的对策。