论文部分内容阅读
近年来,食品、汽车等行业频频爆发重大质量安全事件,严重危害了消费者的切身利益。随着经济的发展,监管的对象和数量越来越复杂,仅仅依靠传统的产品抽查检验,并不足以解决这一日益严重的问题。互联网是当今主要的信息发布平台,含有大量的质量安全信息,对互联网中海量的信息进行挖掘分析,有助于更好的实行产品质量安全的监督控制。本文主要研究产品质量安全网络信息监督和预警平台中文本分类组件的设计和实现,采用文本分类技术对海量的反馈信息进行数据分析处理。主要研究内容有:1)信息过滤,设计实现基于朴素贝叶斯和支持向量机两种算法的文本二值分类器,滤除数据中与质量安全无关的信息,保证后续数据分析的准确性。2)自动分类,设计实现基于朴素贝叶斯和支持向量机两种算法的文本多分类器,将汽车行业质量安全相关信息进行自动分类,具体化产品的质量安全问题,进而发现产品的潜在危机。3)测试分析,采用准确率、召回率、F1估计以及宏平均等评估值对分类器进行测试评估,分析文本分类组件的分类性能以及在平台中应用效果。本文设计实现的基于朴素贝叶斯和支持向量机算法的文本分类组件,已应用于质量安全网络信息监督与预警平台中。测试分析以及应用结果表明,文本分类组件可以从互联网中提取产品质量安全的相关信息,发现产品质量安全的潜在缺陷,进而达到产品质量安全监督和预警的目的。