【摘 要】
:
随着web2.0的日益发展,互联网渗入到日常生活的各个方面。点评网站作为互联网渗入到线下的一个非常好的切入口,已经成为本地垂直生活的一个标配。针对用户原创的评论数据进行
论文部分内容阅读
随着web2.0的日益发展,互联网渗入到日常生活的各个方面。点评网站作为互联网渗入到线下的一个非常好的切入口,已经成为本地垂直生活的一个标配。针对用户原创的评论数据进行情感信息的挖掘具有极大的学术价值和商业价值。目前单纯的进行情感分类已无法满足情感分析日益发展对分类强度和精度的需求。本文主要研究了如何定量化的表示文本情感,与简单的情感分类研究相比较,对更贴近用户实际情况的情感强度研究具有更加重要的研究意义和价值。本文以大众点评的评论数据作为研究对象,通过研究实现了一个文本情感强度分析系统,从定量角度对文本情感倾向进行分析。对于输入的评论,系统分析得到该条评论的情感强度值并展示。首先,在文本表示方面,本文提出了一种基于情感词典进行文本表示的方法。实现了一个具有惊喜、悲伤、爱、喜悦、恨、期待、焦虑、愤怒八个维度的情感词典,每个维度的浮点数代表该维度的权重。实验表明,基于该情感词典进行文本向量表示最大可能的保留了文本的情感信息。其次,在知识表示方面,本文结合深度学习技术,提出了 Bi-LSTM+Attention模型,该模型在继承其他深度模型优点的情况下,更好的表达了文本的上下文信息和情感信息,通过实验验证了其稳定性和有效性。最后,在情感强度定量化表示方面,本文建立了一套新的文本情感强度衡量体系,将情感强度划分为1到10十个等级,对不同程度的情感倾向能做出清晰的区分。
其他文献
以金山27为供试品种,设超高产栽培(SHY)和普通高产栽培(CK)2个处理,通过2009、2010年2年的田间试验,研究了超高产春玉米干物质及氮、磷、钾养分积累与转运特征。结果表明,超
提出了一种基于节点分离概念的Lagrange有限元冲击破碎分析的算法,采用节点分离技术实现了网格断裂,并用畸变侵蚀技术处理严重畸变单元。利用C++编程实现了节点分离计算模型的
该文通过对健美操创编能力概念的阐述,了解到健美操创新的来源,并结合培养健美操创编能力的意义及制约健美操创编能力的因素,提出培养学生健美操创编能力的方法,以利于健美操
目的探讨肺蜂窝病变的HRCT表现及其病理基础和临床意义。方法搜集具有肺蜂窝病变的3组不同种类病例60例,分析蜂窝及伴随征象的HRCT表现。对具有蜂窝表现的尸检肺标本6例行HRC
运用15N示踪法研究了不同施氮量对两个品种水稻(4007和武运粳15)干物质积累量与其对15N吸收及分配的影响。结果表明,当施氮量超过N 150 kg/hm2时,两个品种水稻子粒产量均不再
随着科学技术的飞速发展,传统的CRT电视逐步被LED液晶电视等新兴的高性能电视所取代。LED液晶电视是一种新型的环保节能电视,具有节省能源消耗,画质清晰,响应速度快,寿命长等
本文引入模糊需求量、模糊生产能力建立了钢铁企业产品组合模糊优化模型,完善了钢铁企业产品组合模型。引入Zimmermann对模糊规划的解法,对钢铁企业产品组合决策的模糊优化模型
<正>【本刊讯】由我社社主办的"2018中国宏观经济高层报告会"1月6日在京隆重召开。报告会用宏观的视角,精辟的立论,多渠道的数据,多角度的分析,整合各方智慧,共同探讨解析国
利用LS—DYNA仿真软件研究了高速三体船连桥结构的砰击问题,建立了二维有限元模型,对高速三体船结构以不同的速度进行等速入水的情况进行了计算。研究发现,存在于高速三体船主船
通过三室根袋栽培试验,对3种磷高效型和3种磷低效型的玉米自交系在2种不同磷水平下的植株生物量、吸磷量、根系形态、根际pH值以及根际磷酸酶进行研究,比较不同磷利用率基因