面向评论的跨领域情感分类研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:tltim2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络社交平台的崛起,海量主观性信息迅速涌现。鉴于这些主观数据往往具有巨大的潜在价值,情感分类、观点挖掘等领域逐渐引起了广泛的关注。然而传统的情感分类具有领域特定性(domain-specific),即当训练集和测试集数据分布不同时,分类效果往往欠佳。随着信息的迅猛发展,新的领域不断涌现,而人工标注数据既耗时又费力,因此跨领域情感分类具有极其重要的意义。它旨在通过一个领域的数据训练模型,来预测另一个领域文本的情感倾向性。本文旨在解决跨领域文本情感分类问题,主要工作包括以下三个方面:首先,本文提出了一种基于加权SimRank算法的跨领域情感分类模型。该模型先通过ADMI (Absolute Difference of Mutual Information)算法挑选出频繁出现在两个领域中且带有相同情感倾向性的枢纽特征作为桥梁,然后将枢纽特征与非枢纽特征的关系映射为二部图,在加权SimRank算法的基础下构建潜在特征空间LFS(Latent Feature Space)。最后,利用LFS对样本进行重映射,从而减小了不同领域之间的数据分布差异,较好的实现了领域迁移。实验结果表明了该模型在跨领域文本情感分类中的有效性。其次,受评论中句子主语与领域独立性(domain-independent)/特定性(domain-specific)隋感词分布关系的启发,本文提出一种主语启发式的跨领域文本情感分类集成模型(Subject-based Model)。该模型依照评论中句子的主语,将评论划分为Personal和Object两个视图。其中,Personal视图包括主语或隐含主语是人物(评价者)的句子集;Object视图由主语或隐含主语是评价对象的句子组成。统计发现,Personal视图往往具有较好的领域独立性,而Object视图则常常具有领域特定性。在此基础上,通过集成学习,有效地融合两个视图,既可以更大的受益于领域独立性部分(Personal视图),而在一定程度上又可以避免领域特定性部分(Object视图)拉大数据分布差异。最后,实验从监督学习和半监督学习两个方面,验证了Subject-based模型的有效性。最后,鉴于同一条评论中主题(产品属性)的混杂性和情感对主题的依赖性,本文在第2部分工作的基础上,充分考虑样本的质量,提出了一种联合样本过滤和主语启发式的跨领域情感分类集成模型SF-SE (Joint Sample Filtering with Subject-based Ensemble Model)。文中首先在句子级上提出了一种同时考虑主题和情感因素的主题模型,称之为SS-LDA。在此基础上,以无监督的方式过滤掉同一条评论中与其情感倾向性不同的句子,从而提高了评论的质量。实验结果表明,该模型能进一步提高分类性能。
其他文献
SATA2.0接口芯片主要应用于SATA硬盘中,该硬盘是目前主流的存储器。保证SATA2.0与其他芯片之间的正确互连,使得互连故障在测试中被发现,这对芯片的广泛应用具有重要意义。  边
随着Internet与Web技术的高速发展及广泛应用,如何从众多的服务功能相近或相同但QoS属性值不同的Web服务中选择出最能满足用户需求的Web服务,已经成为相关领域的一个研究热点
超声诊断设备已经成为现代医学四大影像设备之一,由于具有无损伤、无痛苦、操作简单、方便等诸多优点,在临床诊断中得到了广泛的应用。数字化超声成像技术相比传统超声成像技术
PC机、手机、平板及智能家电等电子设备的不断普及促进了三网融合下各种新兴业务的快速开展,然而这些新兴业务的身份认证系统之间由于服务动态性、异构性及开放性的不同,导致各
随着各式各样的医学仪器不断涌现,临床诊断中出现了越来越多的医学图像。由于医学图像种类繁多,且人体结构复杂,人工提取医学图像的特征比较困难,自适应能力差,分类效果有待
数字签名是对传统手写签名的电子模拟,是随着公钥密码体制的建立而产生的一个新的密码学应用方向,和传统手写签名一样,数字签名是一种认证机制,保证了消息的来源和完整性,所
医学诊断领域,超声成像诊断设备因为其经济实用、无侵袭、无损伤、对人体影响小、低成本、适应性广等优势,在临床诊疗中得到了广泛应用。随着计算机在生活中的普及与软硬件资源
无线自组织(Ad hoc)网络是一种无需基础设施且具有自组织能力的分布式临时自治网络系统。无线Ad hoc网络的易部署、终端可移动、灵活便捷以及可扩展等特性使之具有广阔的应用
本文首先分析配电自动化系统和配变终端国内外研究现状,针对国内现有配变终端存在问题,在对配变终端及相关国家标准充分调研基础上,确定配变终端基本功能及技术指标,借鉴当前国内
更快速地渲染出更具有真实感的人脸,对于虚拟现实,影视娱乐,医学仿真,信息安全等领域都有着重要的意义。因此,实时真实感人脸的渲染技术在应用领域中拥有广阔的前景,其也一直