论文部分内容阅读
随着互联网高速发展,不同模式的电子商务公司在中国快速崛起,用户网上购物的现象在中国已普遍可见,甚至开始严重影响实体店经营。网上购物后,用户会用短文本形式的评价表达自己对所购买的产品满意程度。电商网站内商品评论具有直接体现用户观点的有价值信息,因此挖掘评价内信息是极其有意义的。然而评论数据量往往较为庞大,噪音数据多,如何高效的对商品评论数据进行分析和如何提取文本情感成为关键的问题。本论文提出了基于京东手机类评论数据的情感分析模型,对不同手机进行特征情感对比,构建满意度模型,计算客户满意度指标。特征情感对比结果可为用户提供参考信息,同时为厂商提供反馈信息。而且满意度指标则可作为京东商城个性化推荐的参考指标。本论文首先介绍了该课题的研究背景、国内外研究现状、研究意义、课题创新、研究框架和相关技术理论。接着基于情感分析方法对华为P9手机及苹果iphone6手机京东评论数据进行情感分析,并且对比二者结果数据。其中整个操作过程是在RHadoop的多线程和并行的环境下完成的,将R软件与Hadoop软件相互结合,爬取相关手机评论数据,并且过滤掉文本中噪音数据,对有效文本数据进行分词,利用依存句法提取文本中特征词、修饰词、情感词等关键字,构建多种方法综合的情感分析方法,对不同文本结构采取不同计算方式,计算特征词的情感值。将两款手机的特征情感值结果进行对比,并定制满意度指标体系,构建用户满意度模型。结果显示,"华为P9"手机的拍照、样式、功能、信号大受好评,而"苹果iphone6"手机在质量、性价比、售后服务上都有明显的优势。"华为P9"用户满意度比"苹果iphone6"略小。虽然"华为P9"在功能上有明显的创新,但由于其缺少高质量和优质的售后服务,其依然显弱势。