基于跨领域分类学习的产品评论情感分析

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:zou_zm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子商务的快速发展使得网络购物成为一种时尚,越来越多的用户开始通过互联网了解、购买产品并且发表评论。产品评论是一类蕴含着丰富商业价值的数据,潜在消费者可以通过产品评论了解产品的口碑,从而更加理性的选择和购买产品;而对于产品制造商而言,产品评论则代表了最真实的市场反应,有利于他们做出正确的市场决策。然而,互联网上产品评论的数量非常庞大,并且增长速度非常迅猛,如果靠人工去挖掘和分析是不现实的。因此,我们必须依赖计算机去帮助我们进行自动化的产品评论挖掘与分析。本文分为两大部分。在第一部分中,本文提出了一个中文产品评论挖掘与分析的系统框架;在第二部分中,我们研究了跨领域文本分类算法,并且应用于跨领域产品评论情感分类。中文产品评论挖掘与分析系统可以分为产品评论挖掘、评论情感分析、评论搜索三个大的部分。在产品评论挖掘任务中,系统使用规则挖掘和分类学习相结合的方法,对互联网上的产品评论进行识别和收集。评论情感分析模块对评论的情感倾向性进行分类,把评论分为正面评论和负面评论两类。通过实验,我们发现评论情感分类的领域性非常强,也就是说,一个领域内训练出的情感分类模型往往不能应用于其他领域,所以在情感分类之前,系统首先对产品评论进行了领域分类。评论搜索模块向用户提供了一个搜索平台,通过这个搜索平台,用户查询自己感兴趣的产品,可看到相关评论的具体内容。同时,系统对用户查询的结果进行了产品属性抽取和情感归纳总结,使得可以快速的了解产品的整体口碑以及具体的各个属性的表现情况。传统的分类学习算法要求训练数据与测试数据的词汇分布相同。情感分类问题是领域性非常强的,因此,如果使用传统的文本分类算法,每个产品领域都需要大量的标注数据训练分类模型。然而标注数据获取的代价非常昂贵,所以我们考虑能否使用一个领域中的训练数据,对其他多个领域的产品评论进行情感分类。这个问题就是跨领域产品评论情感分类问题。本文提出了迭代加强的迁移分类算法,用于提高跨领域文本分类的精准度。本文将迭代加强的迁移分类算法与另外两个跨领域文本分类算法一起应用于产品评论跨领域情感分类的问题。通过实验,我们发现,在不同的领域之间,不同的算法有不同的表现,三种跨领域分类算法的表现基本上都好于传统分类算法,而我们提出的迭代加强的迁移分类算法在大多数情况下有着最好的表现。
其他文献
随着计算机应用技术的蓬勃发展,精度高、成像快的数字医学影像设备不断涌现,在此技术支撑基础上设计开发的计算机辅助诊断(Computer-aided Diagnosis, CAD)系统正在迅速普及,
近二十年来,互联网的爆炸式发展,给人类社会、经济、文化等带来了无限的机遇,同时也给信息安全带来了严峻的挑战。人们采用反病毒,防火墙和入侵检测等技术手段来保证网络信息
随着企业间竞争的日趋激烈和业务环境的不断变化,人们对业务流程管理的可靠性和正确性要求越来越高。实现一个具有可靠性、高度灵活性、动态性和高性能的工作流系统的主要途
随着互联网的迅速普及和发展,对等计算(Peer-to-Peer, P2P)技术的应用层出不穷,P2P流量占网络总流量的比重也越来越大。有关调查显示,P2P业务已成为杀手级宽带互联网应用,造
视频压缩技术是计算机处理视频信息的前提,对普通计算机用户来说,原始视频数据量大,需要很大的存储空间和很强的计算能力,应用代价太大,因而在处理、传输之前需要压缩。视频
在因特网的飞速发展、多媒体技术的成熟以及社会信息化的发展过程中产生了越来越多的群组应用,如股票信息分发、视频会议、协作计算系统、付费电视、网络游戏、分布式仿真以
随着Android移动终端的普及,Android操作系统已经成为了越来越多的恶意软件攻击的目标。然而不同恶意软件的威胁是不相同的,例如窃取用户银行账户的应用的威胁性要远大于读取
AdHoc网络是一种没有基础设施支持的移动无线网络,具有自组织、无中心、可快速部署、动态拓扑和多跳等特点。这些特点使它可以广泛地应用于军事战备、救灾工作、环境监测等,
人脸识别系统以其方便、非侵入的特点受到军事、商业、安全、信息等应用领域的青睐。经过30多年的发展,自动人脸识别技术取得了长足的进步。但是,单幅人脸图象直接比对是许多
随着计算机网络规模的不断扩大,结构的日益复杂以及功能的愈来愈强,计算机网络管理就显得越来越重要,一个完善的网络管理系统也就成为计算机网络能够可靠而稳定运行的保证。