情感倾向分析中的结构化方法

来源 :复旦大学 | 被引量 : 5次 | 上传用户:xusir99
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来情感倾向分析在自然语言处理领域引起了广泛的关注.它可以帮助分析文本中与情感相关的信息,从而提供直接的应用结果或者为其他的自然语言处理任务服务.结构化方法是自然语言处理的各个任务中广泛使用的一类机器学习方法,它通过利用结构化的信息提高分类器的性能.本文中主要研究倾向性信息抽取任务中的结构化方法.首先,对于倾向性信息抽取中的评价词,评价对象的关系抽取任务,过去的关系抽取方式要么为简单的将相邻评价词,评价对象的关联在一起,要么依靠手工制定的模板,都没有充分利用句法树上的信息.同时,也忽略了评价词.评价对象的短语结构.本文提出了短语依存句法树,将短语结构引入了依存句法树中,较好的处理了短语间的依存关系.在短语依存句法树上,首次提出了依赖于短语结构的树核函数.它能够区别对待不同类型的依存关系,很大的提高了树核函数在关系抽取中的辨识能力.在5个不同领域的在线评论语料上的实验证明了短语依存句法树能够很好的处理短语类型的评价词,评价对象;同时,新的树核函数能够有效的提高关系抽取的各方面性能.其次、传统的文本倾向性信息表示忽略了文本中许多与倾向性相关的信息.这使得最终的抽取结果可能是不准确,不完整的.针对这样的问题,本文提出了基于图的倾向性表示.其中除了传统的评价词,评价对象等要素外,还包括了对评价词的限制隐含的评价对象,以及评价词之间的关系.它极大的丰富了倾向性信息抽取的结果,也扩充了倾向性任务处理的对象能够提供更加精确,更加完备的抽取结果.本文使用了一种新的结构化方法将一个句子的倾向性信息转化成对应的图表示.它通过整数线性规划,有力的整合了图上的各类结构化约束,同时有较强的扩展能力和稳定性.在中文在线评论语料库上的实验证明,基于图的倾向性表示有较强的表示能力,同时结构化方法能构明显的提高倾向信信息抽取系统的各方面性能.
其他文献
背景动脉粥样硬化(atherosclerosis,As)所致的心血管疾病成为威胁人类生命的重要疾病之一,目前已知的主要危险因素有:1、高脂血症,2、高血压,3、糖尿病,4、吸烟等。其中血脂异常主要
航空科研项目作为一项具有较高科技水平的复杂项目,具有创新性强,资金投入量多,研制生产周期长等特点。在众多的系统环节中各种风险因素层出不穷,往往因为对一个环节的考虑不
<正> 现代社会文明和进步的标志之一是义务教育的全面普及,由此,学校教育对年轻一代的成长愈来愈显得重要。但是,家庭及社会环境依然是影响儿童青少年发展的重要因素,尤其在
目的1)探索大鼠前庭功能损伤后其焦虑水平变化;2)探索前庭功能下降后前庭神经内侧核(MVN)与情绪相关的蓝斑核(LC)和中缝背核(DRN)中单胺类神经递质含量的变化;3)量化了解难治性
人是世间最宝贵的财富。坚持以人为本是全面建设小康社会的需要,也是思想政治教育的本质要求。在全面建设小康社会的新时期,思想政治教育坚持以人为本,不仅要把人作为实践主
大学生作为国家宝贵的人才资源和未来国家经济发展的主体,他们是否具有强烈的社会责任感和历史使命感将对国家经济的发展与和谐社会的建立以及中华民族的伟大复兴具有十分重要
随着金融危机的影响在全球蔓延,中国企业尤其是中小企业的发展环境受到了一定程度的影响,“融资难”成为在此过程中暴露的最为严重的普遍性问题。面对这一问题,中国企业结合自身
所谓构成要件,是指刑法规定的,行为成立犯罪所必须符合的违法类型。①结合《刑法》第271条第1款的规定,职务侵占罪的构成要件可以表述为:公司、企业或者其他单位人员,利用职务
为了促进大型科学仪器设备的协作共享,提高科技资源使用效率,增强科技创新能力,提高仪器设备使用率,大型仪器设备共享系统成为促进大型仪器协作共享的主要途径。本文基于现有共享