基于语义分析的产品评论挖掘技术研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:zihaocn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,随着Web2.0技术的迅猛发展,人们已经逐渐习惯了写博客、泡论坛以及留言评论等生活方式。在产品的评论方面,研究数据表明,大部分的网络购物用户倾向于在购物前参阅其他用户的评论,从而为自己的决策提供依据。在当今这个信息爆炸的社会中,如何从海量数据中提取有用的信息变得至关重要。产品评论挖掘属于自然语言处理范畴,其主要目的是从海量数据提取出用户感兴趣的主题,将数据分门别类、统一管理,并且从评论中获取其中蕴含的感情色彩。本文基于餐饮业的大量评论,研究了产品评论挖掘系统中的关键技术,主要在以下几个方面做了创新性工作:1)提出了一种从海量评论数据中进行主题提取和数据分类的方法。首先利用概率潜在语义分析算法(PLSA),找出词语与潜在语义之间的联系,并计算出词语之间的相似度。然后在半监督的基础上归纳主题,再通过聚类算法,将主题相关的词语聚集起来,从而实现数据的分类。2)提出了一种评论数据中感情色彩的自动提取算法。主观评价语句可以由多个特征观点对表示,该算法假设用户评分与其评论内容基本一致,利用评分和主题聚类结果,让计算机自动学习特征观点对的感情色彩倾向度,并通过对大量评论数据的统计处理建立倾向度数据库。该算法不需要利用任何先验信息,因此相对于其它算法而言,具有简单、准确、高效的优点。综上所述,论文提出了基于PLSA的主题提取和数据分类的方法,并研究了依据用户评分从评论中提取感情色彩的算法。论文以餐饮业的评论为应用背景,进行了详细地实验分析。实验结果表明,论文提出的算法正确、合理,而且具有较好的工程应用价值。
其他文献
《大瀑布》通过对男性角色的塑造,揭示了美国20世纪中期繁荣表面下暗含的家庭危机和社会危机,对死亡、挫败、人的尊严等进行了深刻的思考,探究了错综复杂的家庭关系受到外部
随着人们生活水平的不断提高,乘坐飞机出行已经成为越来越多人的选择,飞行安全也就得到格外的关注。飞机在进行飞行试验或正常飞行中,会产生大量的控制及监控数据,而这些数据正是
在城市文化成为城市重要价值资源的今天,如何让城市风貌更好地引导城市发挥自身独特的魅力,是研究的重点。文章以新疆维吾尔自治区伊州区中心城区为例,基于文化再生这一视角,
世界经济全球化以及信息和通讯技术的迅猛发展企业生存的环境越来越复杂,竞争越来越激烈,给企业的生存和发展提出了巨大的挑战。为了维持自己的核心竞争能力,企业开始寻求与
<正>我国开展采购经理调查已有几年时间(2005年开始开展制造业调查,2007年开始进行非制造业调查),采购经理指数的先行性和对经济的预测作用也日益显现,特别是在2008年的金融
<正>纵观近几年的高考地理试题,常常会有关于昼夜长短的变化规律和正午太阳高度的考题。此类题目重点是考查学生分析问题、解决问题的能力及空间转换能力,难度较大,考生掌握
经济全球化、区域经济一体化是当今世界发展的大趋势,对外开放是一国经济发展的重要前提。改革开放的30年来,我国经济实现了快速发展,在经济发展过程中呈现出了一些显著特点
项目质量管理体系的有效运行是质量管理的核心,是提高工程质量,改进工作质量的重要手段。因此,本文以半导体制造项目为研究对象,为其构建了项目质量管理保证体系,用于解决目
当前,在我国房地产开发领域,尤其是住宅开发领域普遍存在缺乏战略规划、产品定位不明晰、管理过程不严谨等问题,造成了开发项目和产品同质化严重、目标消费群体针对性不强、
随着科学技术的发展,计算机软件开发项目涉及领域越来越广泛,同时也面临着前所未有的风险,在软件开发过程中存在着诸多的弊端,因此需要对计算机软件工程进行管理,以促进计算