质量安全系统中文本分类组件的设计与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:ffyy5051
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,食品、汽车等行业频频爆发重大质量安全事件,严重危害了消费者的切身利益。随着经济的发展,监管的对象和数量越来越复杂,仅仅依靠传统的产品抽查检验,并不足以解决这一日益严重的问题。互联网是当今主要的信息发布平台,含有大量的质量安全信息,对互联网中海量的信息进行挖掘分析,有助于更好的实行产品质量安全的监督控制。本文主要研究产品质量安全网络信息监督和预警平台中文本分类组件的设计和实现,采用文本分类技术对海量的反馈信息进行数据分析处理。主要研究内容有:1)信息过滤,设计实现基于朴素贝叶斯和支持向量机两种算法的文本二值分类器,滤除数据中与质量安全无关的信息,保证后续数据分析的准确性。2)自动分类,设计实现基于朴素贝叶斯和支持向量机两种算法的文本多分类器,将汽车行业质量安全相关信息进行自动分类,具体化产品的质量安全问题,进而发现产品的潜在危机。3)测试分析,采用准确率、召回率、F1估计以及宏平均等评估值对分类器进行测试评估,分析文本分类组件的分类性能以及在平台中应用效果。本文设计实现的基于朴素贝叶斯和支持向量机算法的文本分类组件,已应用于质量安全网络信息监督与预警平台中。测试分析以及应用结果表明,文本分类组件可以从互联网中提取产品质量安全的相关信息,发现产品质量安全的潜在缺陷,进而达到产品质量安全监督和预警的目的。
其他文献
当今的网络规模不断扩大、功能复杂性不断增加、异构网络逐渐融合,给网络管理带来了前所未有的挑战。传统的网络管理系统已经不能适应网络飞速发展的需求。基于Web的网络管理
低密度奇偶校验(Low-Density Parity-Check, LDPC)码是一类可以非常逼近Shannon限的线性分组码,其译码复杂度随码长成线性增加。多进制LDPC码在中短码长时比二进制LDPC码有优
随着高速铁路的快速发展,铁路运输对铁路通信系统提出了更高的需求。为了保障列车运行的安全性和稳定性,需要铁路通信系统提供可靠、稳定、实时的数据传输;同时日益增长的旅客
随着航天器自主导航技术的发展,自主定轨技术成为当今卫星定轨系统研究中的种重要技术。与其他发达国家在卫星自主定轨方面的研究进展相比,我国在技术上还存在较大差距。本文
近年来,随着科技水平的不断发展与进步,国内高速铁路的发展和崛起给国内铁路的振兴带来了生机。由此应运而生的车载人机界面的易操作性和友好性越来越体现其重要性。而快速高效
在安防、图像处理、语音识别、网络通信等计算密集型应用领域,市面单颗嵌入式处理器的性能提升速度常常满足不了人们的需求。应用开发商往往会选择一种称为嵌入式多处理器方案
正交频分复用(OFDM)作为一种能有效地对抗多径衰落以及载波间干扰的技术被广泛应用于无线通信系统中。但是,OFDM系统存在着一个严重的缺点就是OFDM信号具有较高的峰均功率比(P
鉴于生物特征的人员身份认证算法中,步态以其独特的优势被广泛应用于诸多领域。作为步态识别算法中最为关键的技术之一,特征提取与描述一直是该研究的重要切入点。特征信息来源
随着我国经济的发展,基础建设投资力度不断加大,公路隧道数量也在迅速增长,同时,人们对公路隧道的照明和控制也有了更高的要求。目前我国传统的隧道照明方式大多为回路控制方
IMT-Advanced是由ITU主导的第四代移动通信技术标准,其对未来宽带无线移动通信网络的发展起着重要作用。随着IMT-Advanced标准化进程的展开,TDD(Time Division Duplex,时分双