论文部分内容阅读
在电子商务飞速发展的今天,网络购物逐渐成为人们主流购物方式。网上产品种类丰富,购物过程简单,给人们的生活带来了极大的便利;此外,网上购物商品价格相对实惠。因此,越来越多的消费者倾向于在网上购物。消费者在购买某产品之后,于网上商店留下有关产品体验的信息,而后续的消费者会浏览这些信息,以决定是否购买该产品;同时,商家和生产商会利用消费者的评论对自己的产品进行评估,以印证产品是否满足消费者需求。然而,网上评论信息数据量庞大,且结构杂乱无章,仅通过人工方式获取有效的信息难上加难。在这种前提下,对于产品评论挖掘的研究应运而生。本文从生产商的角度,利用产品评论挖掘技术,获取、整理和提炼产品评论中的有效信息,为新产品开发提供决策支持。本文主要研究内容如下: 首先,在面向产品开发的特征提取中,主要考虑产品特征获取的全面性与准确性,从产品特征的频繁项集与非频繁项集两方面进行分析,运用基于关联规则的Apriori 算法从频繁项集中进行产品特征的提取,对于提取结果采用PMI算法进行过滤,非频繁项集中的产品特征则采用改进的TF-IDF 算法来抽取。将获取的产品特征依据领域本体构建的产品特征模型进行归类。 其次,在进行情感分析研究时,对传统的SO-PMI情感分析算法进行改进,考虑否定词以及产品特征对情感词极性的影响,获取基于产品特征的用户情感倾向,在此基础上考虑程度词的权重以及其与否定词位置关系来计算情感强度。 最后,基于产品评论挖掘结果进一步分析,从消费者评论的情感强度以及评论内容两方面来识别“水军”评论,提高挖掘结果的准确性。去除“水军”评论后,分析产品属性关注度、产品属性得分以及消费者对产品属性的评价,明确消费者需求以及获知产品优缺点;分析消费者偏好,利用余弦相似度算法进行用户分类。 本文的实例分析部分,主要利用网上商店所获取的智能手机的评论进行研究。首先,选取最优独立支持度进行产品特征提取,并对产品特征的情感倾向以及情感强度进行分析和计算,两者在准确率和召回率上都达到了理想的效果。然后,在产品评论挖掘结果基础上,识别并去除“水军”评论后,分析获取消费者需求、产品优缺点以及消费者人群主要分类,根据分析结果提出该手机的新产品开发建议。实验结果表明:论文所用方法是有效的,能够给改进型产品的开发提供有效信息,且对于完全创新型产品具有一定的参考意义。