基于Web文本的图书评论倾向性分析方法的研究

被引量 : 6次 | 上传用户:wocaodouji
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网Web2.0的普及,互联网已经逐渐成为人们表达情绪、发表观点、分享体会的新舆论空间,越来越多的人们习惯在网络平台上留下自己的看法与观点,由此互联网也被更多的人视为“百家讲坛”。网上书店作为电子商务平台是目前人们购买图书的最重要的途径,也是与它人分享读书体会,经及对书籍进行评价的“自由环境”,这些众说纷纭的海量图书评论文本,已成为图书出版、发行和阅读人士关注和研究的舆情资源,成为计算机应用、图书情报、媒体传播等领域跨学科的研究问题,成为大数据分析、数据挖掘数据支撑,具有重要的研究价值。用户在购买图书时会将商品在线评论作为自己购买商品时的决策依据。这些图书评价语料的内容代表了评论者在图书的购买或者使用过程中产生的感想,很多都具有鲜明的主题性和情感倾向性,通过对这些数据进行分析,我们可从发现图书购买者使用图书的角度,对图书给予的客观评价的价值。文本以海量的真实图书评论语料为分析基础,提出了一种从多层面进行文本倾向性分析的解决思路,通过搜集图书评价语料,从中提炼出“内容”“质量”“物流”三个不同主题,分析了人们的大量图书评论数据的情感倾向,从而判断用户对图书的“内容”“质量”和“物流”三个主题的满意程度。本文的研究方法是,首先,利用爬虫工具获取大量“网上书店”上的图书评论原始语料,然后,运用基于主题词聚类的方法,构建了图书评价的主题词库。设计了将图书评论按照不同主题进行语料聚焦算法,最后,针对三类主题评论,通过单句级、用户级到图书级逐级分析算法的设计,给出基于规则与统计的图书评论倾向性分析算法,对图书的不同主题进行倾向性分析。本文设计并实现了一个“基于主题分类的图书评论倾向性分析系统”,对文本的算法进行了验证,得出较好的结论的同时,系统也为今后商业应用提供了可行性思路。
其他文献
为了研究米饭食味品质的仪器法评价技术,本课题以南方籼米和东北粳米为原料,分别将电子鼻技术、图像处理技术和质构仪应用于米饭食味品质中的气味、外观和适口性等评价技术的研
在当前媒体融合背景下,纸媒大型赛事如何变革,成为目前媒体行业的热门话题。随着全媒体时代的到来,网络技术的快速发展,微博、微信等新媒体的快速普及,传统媒体遇到了前所未
指挥员,是基层行政管理工作的领导者,组织者和实施者。我认为在基层中队,指挥员就是平时抓队伍管理,完成中队日常各项管理工作;战时,带领中队完成抢险救援任务。其管理素质如
以习近平为总书记的新一届党中央领导集体履任以来,高举中国特色社会主义伟大旗帜,全面贯彻落实党的十八大精神,围绕全面建成小康社会、夺取中国特色社会主义事业新胜利,开展
<正> 美国药店的发展历程是由北美独特的历史、文化和传统所决定的。过去10年的舆论调查显示,相对于其他专业人士,如牧师、律师、军人、银行家甚至医生等而言,公众对药师具有
财务造假案件频发的原因众多,但更应关注企业自身。企业内部控制不健全甚至空有其表提供了财务造假的土壤。所以优化企业的内部控制就成了重要话题。国内外对内部控制及其发
随着中国经济的发展,服务业收入在社会总收入所占的比重越来越高,会计师事务所这种现代咨询服务的行业发展也越来越迅速。会计师事务所不同于一般企业,属于轻资产企业,其成本
第一部分大鼠原位肝移植急性排斥模型的建立及评价目的:掌握大鼠原位肝移植急性排斥反应的建模技术并评价其效果,总结手术技巧及方法,为后续试验建立稳定、有效的动物模型。方
酒店作为一种服务产品,酒店的生命线是服务,本文阐述了它的特殊性,并就如何搞好酒店的服务营销,提出了七个方面的策略。
随着全球化趋势不断加快,人类开始进入知识经济时代,组织内外部环境都在发生着深刻的变化,无边界职业生涯趋势不断加强。各个企业都把“以人为本”作为用人的理念,新时代的发