中文网络产品评论的情感分析关键技术研究

被引量 : 0次 | 上传用户:sansyl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子商务的急速发展促使网络评论数量呈飞跃式增长。这使得人们很难在短时间内从大量网络产品评论中获取到真正有用的信息,以至于难以优化自己的购买决策。因此,借助一定的技术手段来对这些海量网络评论进行情感分析以减轻人们的阅读负担是非常必要的。目前,人们在英文评论领域已取得一些研究成果,但是有关中文评论的研究相对较少。本文以中文网络产品评论为研究对象,研究评论中产品特征自动提取方法、中文情感词典构建方法及“情感文摘”相关情感分析技术。首先,提出了一种基于无监督学习的产品特征自动提取方法。通过有效的剪枝手段来保证种子词选取的准确性,并以有效的迭代规则来扩展得到新的产品特征。在此基础之上,利用“特征权重”筛选技术来进一步保证算法召回率。对比实验结果表明了该算法针对中文产品评论的有效性。其次,提出了一种带有“情感强度分数”的中文情感词典构建方法。以已有的普通词典为基准,将该词典中的各个词汇作为顶点,并将这些词汇之间的关系作为边,构建出相应的无向加权图,然后通过标签迭代模型来生成带有“情感强度分数”的情感词典。实验验证了该方法在汉语常用词中的褒贬判别效果较好,具有一定的实用价值。最后,在上述研究成果的基础上,研究了评论中产品特征及用户对其情感倾向的综合信息挖掘——情感文摘的一种挖掘方法,并以图形可视化方法来展现挖掘结果。先提取出评论中的产品特征,并找到其对应的情感词,然后基于本文生成的情感词典对各评论进行情感极性判断,统计分析出产品评论的情感文摘并以图形可视化方法来展现用户们对该产品的总体评价。综上所述,本文提出了一些新技术以解决中文网络产品评论中的部分情感分析关键问题。这些技术的研究将有助于用户快速便捷地获取其他客户对相应产品的反馈信息,为中文网络评论挖掘方法在电子商务领域的应用开辟了更加宽阔的空间。
其他文献
话语冲突频繁地发生于人们互动交际的过程中,它是一种普遍而且复杂的语言现象。国内学者对此研究已取得了一定的研究成果。然而调查发现,有关汉语冲突话语的实证性研究却很少,系
西凉是十六国时期河西地区兴起的第二个汉族地方王朝。其中后西凉政权更是直接建政于流沙以西的伊吾地区。西凉政权的创业主李暠是一位伟大的爱国者。李暠建立西凉王朝后,与
随着能源危机和环境污染的加剧,地源热泵因其节能性及环保性而倍受青睐。然而,在地源热泵的应用和研究过程中,人们逐渐发现:地源热泵具有其适用的最佳地域范围,即冷热负荷相当的建
马克思曾说过:“人的本质并不是单个人所固有的抽象物。在其现实性上,它是一切社会关系的总和”。任何人都是处在一定的社会关系中从事社会实践活动的人。在各种社会关系中,父
中共新疆维吾尔自治区党委七届九次全委(扩大)会议提出:以现代文化为引领推动实现新疆跨越式发展和长治久安两大任务。保障新疆文化安全,是尊重民族文化,确保新疆社会稳定的
<正>发展是第一要务,稳定是第一责任。2009年以来,黄石市委、市政府坚持把综治信访维稳作为学习实践科学发展观活动的重要内容,按照"治源头,化疑难,建体系,管长远"的要求,构
中小学后进生是客观存在的。后进生大致可分为三种类型:学习后进生、品德后进生和学习、品德都相对落后的学生,即所谓双差生。后进生形成的原因主要是家庭、社会和学校不良影
本文通过运用文献资料法、录像统计法、调研统计法、数理统计法逻辑分析法和访谈法等研究方法,对全国女足超级联赛北京女足比赛情况进行个案研究,阐述比赛的真实、客观的现象和
无线传感器执行器网络最近应用的越来越广泛.传感器节点和执行器节点间的协作与纯粹传感器网络相比,有着显著的优势.从网络体系结构、路由算法、协作机制和网络容错4个方面介
本试验使用禽用开放回流式呼吸测热装置进行能量代谢试验,探究木聚糖酶对肉鸡玉米-豆粕型饲粮和玉米干酒精糟及其可溶物(DDGS)型饲粮净能值的影响。采用2×2双因子试验设计,