面向酒店评论的中文短文本情感分析研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:a13600660175
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今世界,随着互联网技术的繁荣和蓬勃发展,产生了诸多网络媒体和应用,同时大量的互联网信息应运而生。网络评论就是这些互联网信息的重要组成部分。与一般客观文档内容不同的是,这些大众舆论的观点所蕴含的丰富主观感情信息,对互联网商家、潜在用户以及政府信息部门等都具有非常有价值的参考意义。然而,如果通过人工方式去挖掘这些庞大的信息,不但需要高昂的成本,而且效率底下,实施起来也较为困难。所以,利用计算机算法对互联网上非结构化的文本评论进行信息挖掘和文本分类的情感分析技术应运而生,这也就是自然语言处理相关研究蓬勃发展的应用方向之一。本文主要研究是面向中文文本情感分类的问题,以中文酒店评论为实验对象,前两章对问题的研究现状和基本技术进行了详细的介绍。然后,论文从两个方面针对现有研究提出拓展和改进。本文的主要工作以及成果如下:(1)论文提出一种基于语义向量空间泛化的情感词典构建方法。在结合多个权威词典融合之后,加入神经网络模型,并结合酒店评论数据共同完成词典构建目标。基本思想是从评论语义向量空间出发结合公式构建新的情感词典。在和领域内较为完备的情感词典进行对比的实验中,本文所提出的方法构建的情感词典能较好的辅助完成情感分类任务。(2)针对现有监督学习和规则情感分类方法的优缺点,本文提出一种基于语义规则和神经网络模型特征融合的情感分类方法。论文主要面向中文酒店评论的特点,将多层语义规则沿用到传统基于词典的分类方法上,加强了对语料文本的情感分析信息的准确度。之后本论文将特征方向作为切入点,提出一种基于特征融合情感分类方法,将规则化计算得出的情感得分以及过程中统计的情感信息,作为新的情感特征参数嵌入到模型特征集合模板中,再利用神经网络模型进行情感分类。相比一般分类方法,本文方法在特征表示和中文文本情感分类两个方面有较大的提升,并以实验证明本方法拥有较于普通文本分类方法较好的性能。
其他文献
“互联网+”思维的兴起,人们消费习惯的日益改变,我国传统医药行业又迎来了新一轮的变革。2014年我国政策对互联网医药销售条件的放开,大大增强了我国传统医药企业转型、变革
加入WTO,中国农产品贸易面临机遇和挑战。机遇将成为发展的动力,挑战将不可避免的带来冲击。处于经济转型时期的中国农产品贸易应依据WTO条款,抓住机遇,扩大出口,适度保护,趋利避害,在竞争
近几年,我国的市场供求格避发生了根本性的转变,出现总供给大于总需求的现象。这种经济现象在我国现阶段及制度变迁的必然结果。因此,内需不足的深层次原因必然与体制因素紧密相
在近十年的高考中,导数综合解答题常常作为压轴之作.这类题由于其解答的方法灵活,没有固定的解题套路,对学生的综合能力要求较高,难度往往很大,得分率极低.所以在考试过程中
裂缝是土木结构的常见的损伤之一,传统裂缝检测的主要方法是人工视觉检查,在实际应用中费力耗时且存在较大主观因素。近年来,计算机视觉和深度学习理论的发展,为裂缝的检测和识别提供更加自动化的手段。然而,当图像处理技术检测图像中的裂缝时,需要提取特征。因而,图像处理技术的使用也受到限制,因为在真实混凝土表面上拍摄的图像会受到由光照、模糊等引起的噪声的影响。本文研究基于深度学习的混凝土结构表面裂纹的识别方法
随着社会的日益数字化,信息安全已经成为影响国家政治稳定、经济发展、国防安全以及文化安全的重大问题。作为保障信息安全的核心工具之一,数字签名技术可以保证消息的完整性
—本文首先建立了SINS的误差模型,并对系统模型进行了可观测性分析,然后基于SINS误差模型的特点,通过对所采用卡尔曼滤波器仿真结果的分析,提出了一种快速估计方位失准角D的方法,从而大大
我国教育部对于学生的教育问题非常重视,进而实行新课程改革,希望提高学生学习效果,新课程改革已经是我国教育发展的必然趋势,而且在未来的发展中,课改还会继续进行,以促进我
家庭作为社会最小的经济单元构成了社会生产的微观基础,家庭分工对于社会稳定和国民经济发展有着深远的影响。随着市场经济的发展、女性地位的不断提高以及家庭观念的不断转
本文介绍采用全数字闭环光纤陀螺组成的惯性测量单元的实现方法,采用DSP作为中央处理单元,完成三轴组合的时序控制、数字解调、滤波算法、波形合成及数据传输,并对三轴陀螺进行了全