论文部分内容阅读
电子商务、论坛等网络平台,有效拉近了制造企业与消费者之间的距离,企业可以通过用户评论直接了解客户的使用体验,发现产品在使用阶段暴露的质量问题,为产品的质量改进提供方向。本文以网络评论为研究对象,利用特征词提取、情感分析、序列模式挖掘等方法,实现了产品质量水平评估和质量问题发现。本文主要研究内容如下:(1)质量特征词的提取与语义树构建。本文将质量特征词提取看成是序列标注问题,利用条件随机场进行模型训练,在特征方面,采用了词形、词性、上下文、依存关系、支配词、情感判断等特征,实现了质量特征词的自动提取。构建了描述质量特征词之间语义关系的语义树,提出了基于词语相似性的同义子节点添加和基于词语相关性的隶属子节点添加两种语义树扩展方法。(2)产品质量水平评估与质量问题发现。首先提出了基于情感词典的质量特征词情感得分计算方法,然后分析了否定词和程度副词对情感得分的影响,接着基于语义树和情感得分,提出了产品质量水平评估方法。研究了质量否定句的序列模式,提出了基于序列模式挖掘的产品质量问题发现方法。(3)产品质量分析系统的设计。系统由数据抓取、数据预处理、质量特征词提取、语义树构建、质量水平评估和质量问题发现等六个模块组成。